Training in progress, step 5000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +2 -2
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +252 -3
pytorch_model.bin +1 -1
runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:27258b0c1d06a9b5e61d8f927d63726deb3b0f232f363bb381e6603a2e047efd
 size 2524414853

 version https://git-lfs.github.com/spec/v1
+oid sha256:d04ac14b396acc439a80242e3de2dde5c2c3cfe230aff038ac79cfc71137162a
 size 2524414853

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb9bb8d82c12f7963f345a3bc44171138b5cd9c15813fe124d03c8957cb8aa3d
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:72797f1440dbbfd35bf83a8efb707c911377db12eea28703ebe830d181f4ed7f
 size 1262229869

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:dc101980f72fb94e34cbe7f2fcca59c7772750d7ccf19bcd551759aee050f696
-size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:38c34f160b4325fa8e05323d539226829df54c92e017ae64958c023e2dbecb9e
+size 14575

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4eb4748670085a8091d197542279b737c13c5a3f63f48bc90750499483c77941
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:4e00e24b9ec2f00c6f283cf8c9dd0d87ed62551d6e0d1598b4aa9ff96f37c557
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": 0.0693531029534856,
   "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-3000",
-  "epoch": 35.39823008849557,
-  "global_step": 4000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1002,11 +1002,260 @@
       "eval_steps_per_second": 1.209,
       "eval_wer": 0.07222288652397466,
       "step": 4000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
-  "total_flos": 1.5768864774399195e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 0.0693531029534856,
   "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-3000",
+  "epoch": 44.24778761061947,
+  "global_step": 5000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.209,
       "eval_wer": 0.07222288652397466,
       "step": 4000
+    },
+    {
+      "epoch": 35.62,
+      "learning_rate": 0.00018868421052631575,
+      "loss": 0.0222,
+      "step": 4025
+    },
+    {
+      "epoch": 35.84,
+      "learning_rate": 0.00018789473684210524,
+      "loss": 0.0206,
+      "step": 4050
+    },
+    {
+      "epoch": 36.06,
+      "learning_rate": 0.00018710526315789475,
+      "loss": 0.0196,
+      "step": 4075
+    },
+    {
+      "epoch": 36.28,
+      "learning_rate": 0.0001863157894736842,
+      "loss": 0.0186,
+      "step": 4100
+    },
+    {
+      "epoch": 36.5,
+      "learning_rate": 0.00018552631578947368,
+      "loss": 0.0178,
+      "step": 4125
+    },
+    {
+      "epoch": 36.73,
+      "learning_rate": 0.00018473684210526314,
+      "loss": 0.0159,
+      "step": 4150
+    },
+    {
+      "epoch": 36.95,
+      "learning_rate": 0.00018394736842105262,
+      "loss": 0.0249,
+      "step": 4175
+    },
+    {
+      "epoch": 37.17,
+      "learning_rate": 0.00018315789473684208,
+      "loss": 0.0258,
+      "step": 4200
+    },
+    {
+      "epoch": 37.39,
+      "learning_rate": 0.00018236842105263156,
+      "loss": 0.0202,
+      "step": 4225
+    },
+    {
+      "epoch": 37.61,
+      "learning_rate": 0.00018157894736842105,
+      "loss": 0.022,
+      "step": 4250
+    },
+    {
+      "epoch": 37.83,
+      "learning_rate": 0.0001807894736842105,
+      "loss": 0.0266,
+      "step": 4275
+    },
+    {
+      "epoch": 38.05,
+      "learning_rate": 0.00017999999999999998,
+      "loss": 0.0183,
+      "step": 4300
+    },
+    {
+      "epoch": 38.27,
+      "learning_rate": 0.00017921052631578944,
+      "loss": 0.0159,
+      "step": 4325
+    },
+    {
+      "epoch": 38.5,
+      "learning_rate": 0.00017842105263157892,
+      "loss": 0.0167,
+      "step": 4350
+    },
+    {
+      "epoch": 38.72,
+      "learning_rate": 0.00017763157894736838,
+      "loss": 0.0163,
+      "step": 4375
+    },
+    {
+      "epoch": 38.94,
+      "learning_rate": 0.00017684210526315786,
+      "loss": 0.0151,
+      "step": 4400
+    },
+    {
+      "epoch": 39.16,
+      "learning_rate": 0.00017605263157894737,
+      "loss": 0.0172,
+      "step": 4425
+    },
+    {
+      "epoch": 39.38,
+      "learning_rate": 0.00017526315789473683,
+      "loss": 0.0175,
+      "step": 4450
+    },
+    {
+      "epoch": 39.6,
+      "learning_rate": 0.0001744736842105263,
+      "loss": 0.0193,
+      "step": 4475
+    },
+    {
+      "epoch": 39.82,
+      "learning_rate": 0.0001736842105263158,
+      "loss": 0.0241,
+      "step": 4500
+    },
+    {
+      "epoch": 40.04,
+      "learning_rate": 0.00017289473684210525,
+      "loss": 0.0192,
+      "step": 4525
+    },
+    {
+      "epoch": 40.27,
+      "learning_rate": 0.00017210526315789473,
+      "loss": 0.019,
+      "step": 4550
+    },
+    {
+      "epoch": 40.49,
+      "learning_rate": 0.0001713157894736842,
+      "loss": 0.0138,
+      "step": 4575
+    },
+    {
+      "epoch": 40.71,
+      "learning_rate": 0.00017052631578947367,
+      "loss": 0.0158,
+      "step": 4600
+    },
+    {
+      "epoch": 40.93,
+      "learning_rate": 0.00016973684210526313,
+      "loss": 0.0181,
+      "step": 4625
+    },
+    {
+      "epoch": 41.15,
+      "learning_rate": 0.0001689473684210526,
+      "loss": 0.0167,
+      "step": 4650
+    },
+    {
+      "epoch": 41.37,
+      "learning_rate": 0.00016815789473684207,
+      "loss": 0.0214,
+      "step": 4675
+    },
+    {
+      "epoch": 41.59,
+      "learning_rate": 0.00016736842105263155,
+      "loss": 0.0184,
+      "step": 4700
+    },
+    {
+      "epoch": 41.81,
+      "learning_rate": 0.00016657894736842103,
+      "loss": 0.0166,
+      "step": 4725
+    },
+    {
+      "epoch": 42.04,
+      "learning_rate": 0.00016578947368421052,
+      "loss": 0.0128,
+      "step": 4750
+    },
+    {
+      "epoch": 42.26,
+      "learning_rate": 0.000165,
+      "loss": 0.0156,
+      "step": 4775
+    },
+    {
+      "epoch": 42.48,
+      "learning_rate": 0.00016421052631578948,
+      "loss": 0.0131,
+      "step": 4800
+    },
+    {
+      "epoch": 42.7,
+      "learning_rate": 0.00016342105263157894,
+      "loss": 0.0146,
+      "step": 4825
+    },
+    {
+      "epoch": 42.92,
+      "learning_rate": 0.00016263157894736842,
+      "loss": 0.0157,
+      "step": 4850
+    },
+    {
+      "epoch": 43.14,
+      "learning_rate": 0.00016184210526315788,
+      "loss": 0.0158,
+      "step": 4875
+    },
+    {
+      "epoch": 43.36,
+      "learning_rate": 0.00016105263157894736,
+      "loss": 0.0157,
+      "step": 4900
+    },
+    {
+      "epoch": 43.58,
+      "learning_rate": 0.00016026315789473682,
+      "loss": 0.0159,
+      "step": 4925
+    },
+    {
+      "epoch": 43.81,
+      "learning_rate": 0.0001594736842105263,
+      "loss": 0.0217,
+      "step": 4950
+    },
+    {
+      "epoch": 44.03,
+      "learning_rate": 0.00015868421052631578,
+      "loss": 0.0178,
+      "step": 4975
+    },
+    {
+      "epoch": 44.25,
+      "learning_rate": 0.00015789473684210524,
+      "loss": 0.0177,
+      "step": 5000
+    },
+    {
+      "epoch": 44.25,
+      "eval_loss": 0.24588559567928314,
+      "eval_runtime": 10.7371,
+      "eval_samples_per_second": 9.313,
+      "eval_steps_per_second": 1.211,
+      "eval_wer": 0.07437522420184145,
+      "step": 5000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
+  "total_flos": 1.96951110785928e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bb9bb8d82c12f7963f345a3bc44171138b5cd9c15813fe124d03c8957cb8aa3d
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:72797f1440dbbfd35bf83a8efb707c911377db12eea28703ebe830d181f4ed7f
 size 1262229869

runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:50fa134d7573be5c46508e873e8bb15f1862c32825a16d7b12c777045dccecb2
-size 31774

 version https://git-lfs.github.com/spec/v1
+oid sha256:1d0c176c61ff82428c1cfed0632db9bfe35c7927ea235840f13920ec7caf7126
+size 38372