Training in progress, step 9000

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/pytorch_model.bin +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +254 -5
pytorch_model.bin +1 -1
runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 +2 -2

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:01ff7248d086cb5c4cedadeb579adbb675a1c64e4fb09e5ae750359a44febb76
 size 2524414853

 version https://git-lfs.github.com/spec/v1
+oid sha256:e0c2be3452d8137d689d35c0df6e890c78020bf9843bc1e5ee746f483f22d91d
 size 2524414853

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4607f812b37e97d000dcc622b3e637fb3031eca1d8fd3c7555cdaadfec40180b
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c2f9145d655487602d0119001d797a278a1eb42e4a3b0bd88e042a0adbe3136
 size 1262229869

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:977a8fef6282492c80e91318169668264512de99e37019c60391b3f14bdd2233
 size 14639

 version https://git-lfs.github.com/spec/v1
+oid sha256:70a396db9e5798714b943d735d77ab7ab39ac707fd4daa400a37b45acbc4d16e
 size 14639

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e3c549db73c256944038c972af144f55d1e0fbea4d86305beed62e57f9cae640
 size 627

 version https://git-lfs.github.com/spec/v1
+oid sha256:6e7b0809e95e7bb66d8269d06cf0ed6189035774c3ca188b731868d7c85cab50
 size 627

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 0.06791821116824107,
-  "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-6000",
-  "epoch": 70.79646017699115,
-  "global_step": 8000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1998,11 +1998,260 @@
       "eval_steps_per_second": 1.204,
       "eval_wer": 0.0680377854836781,
       "step": 8000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
-  "total_flos": 3.1517992803917713e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.065048427597752,
+  "best_model_checkpoint": "./wav2vec2-xls-r-300m-ar/checkpoint-9000",
+  "epoch": 79.64601769911505,
+  "global_step": 9000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 1.204,
       "eval_wer": 0.0680377854836781,
       "step": 8000
+    },
+    {
+      "epoch": 71.02,
+      "learning_rate": 6.236842105263157e-05,
+      "loss": 0.0061,
+      "step": 8025
+    },
+    {
+      "epoch": 71.24,
+      "learning_rate": 6.157894736842104e-05,
+      "loss": 0.0059,
+      "step": 8050
+    },
+    {
+      "epoch": 71.46,
+      "learning_rate": 6.078947368421052e-05,
+      "loss": 0.008,
+      "step": 8075
+    },
+    {
+      "epoch": 71.68,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 0.0105,
+      "step": 8100
+    },
+    {
+      "epoch": 71.9,
+      "learning_rate": 5.921052631578947e-05,
+      "loss": 0.0066,
+      "step": 8125
+    },
+    {
+      "epoch": 72.12,
+      "learning_rate": 5.842105263157894e-05,
+      "loss": 0.0075,
+      "step": 8150
+    },
+    {
+      "epoch": 72.35,
+      "learning_rate": 5.763157894736841e-05,
+      "loss": 0.01,
+      "step": 8175
+    },
+    {
+      "epoch": 72.57,
+      "learning_rate": 5.684210526315789e-05,
+      "loss": 0.0097,
+      "step": 8200
+    },
+    {
+      "epoch": 72.79,
+      "learning_rate": 5.605263157894736e-05,
+      "loss": 0.007,
+      "step": 8225
+    },
+    {
+      "epoch": 73.01,
+      "learning_rate": 5.526315789473683e-05,
+      "loss": 0.0047,
+      "step": 8250
+    },
+    {
+      "epoch": 73.23,
+      "learning_rate": 5.4473684210526315e-05,
+      "loss": 0.006,
+      "step": 8275
+    },
+    {
+      "epoch": 73.45,
+      "learning_rate": 5.3684210526315784e-05,
+      "loss": 0.0078,
+      "step": 8300
+    },
+    {
+      "epoch": 73.67,
+      "learning_rate": 5.2894736842105254e-05,
+      "loss": 0.0085,
+      "step": 8325
+    },
+    {
+      "epoch": 73.89,
+      "learning_rate": 5.210526315789474e-05,
+      "loss": 0.0075,
+      "step": 8350
+    },
+    {
+      "epoch": 74.12,
+      "learning_rate": 5.1315789473684206e-05,
+      "loss": 0.0062,
+      "step": 8375
+    },
+    {
+      "epoch": 74.34,
+      "learning_rate": 5.0526315789473676e-05,
+      "loss": 0.0073,
+      "step": 8400
+    },
+    {
+      "epoch": 74.56,
+      "learning_rate": 4.973684210526315e-05,
+      "loss": 0.0063,
+      "step": 8425
+    },
+    {
+      "epoch": 74.78,
+      "learning_rate": 4.894736842105263e-05,
+      "loss": 0.006,
+      "step": 8450
+    },
+    {
+      "epoch": 75.0,
+      "learning_rate": 4.81578947368421e-05,
+      "loss": 0.0064,
+      "step": 8475
+    },
+    {
+      "epoch": 75.22,
+      "learning_rate": 4.7368421052631574e-05,
+      "loss": 0.0058,
+      "step": 8500
+    },
+    {
+      "epoch": 75.44,
+      "learning_rate": 4.657894736842105e-05,
+      "loss": 0.0059,
+      "step": 8525
+    },
+    {
+      "epoch": 75.66,
+      "learning_rate": 4.578947368421052e-05,
+      "loss": 0.0064,
+      "step": 8550
+    },
+    {
+      "epoch": 75.88,
+      "learning_rate": 4.4999999999999996e-05,
+      "loss": 0.0085,
+      "step": 8575
+    },
+    {
+      "epoch": 76.11,
+      "learning_rate": 4.4210526315789466e-05,
+      "loss": 0.0065,
+      "step": 8600
+    },
+    {
+      "epoch": 76.33,
+      "learning_rate": 4.342105263157895e-05,
+      "loss": 0.0068,
+      "step": 8625
+    },
+    {
+      "epoch": 76.55,
+      "learning_rate": 4.263157894736842e-05,
+      "loss": 0.0084,
+      "step": 8650
+    },
+    {
+      "epoch": 76.77,
+      "learning_rate": 4.184210526315789e-05,
+      "loss": 0.0049,
+      "step": 8675
+    },
+    {
+      "epoch": 76.99,
+      "learning_rate": 4.105263157894737e-05,
+      "loss": 0.0055,
+      "step": 8700
+    },
+    {
+      "epoch": 77.21,
+      "learning_rate": 4.026315789473684e-05,
+      "loss": 0.0077,
+      "step": 8725
+    },
+    {
+      "epoch": 77.43,
+      "learning_rate": 3.947368421052631e-05,
+      "loss": 0.0071,
+      "step": 8750
+    },
+    {
+      "epoch": 77.65,
+      "learning_rate": 3.868421052631579e-05,
+      "loss": 0.005,
+      "step": 8775
+    },
+    {
+      "epoch": 77.88,
+      "learning_rate": 3.789473684210526e-05,
+      "loss": 0.0066,
+      "step": 8800
+    },
+    {
+      "epoch": 78.1,
+      "learning_rate": 3.710526315789473e-05,
+      "loss": 0.0067,
+      "step": 8825
+    },
+    {
+      "epoch": 78.32,
+      "learning_rate": 3.631578947368421e-05,
+      "loss": 0.0058,
+      "step": 8850
+    },
+    {
+      "epoch": 78.54,
+      "learning_rate": 3.552631578947368e-05,
+      "loss": 0.004,
+      "step": 8875
+    },
+    {
+      "epoch": 78.76,
+      "learning_rate": 3.4736842105263153e-05,
+      "loss": 0.0044,
+      "step": 8900
+    },
+    {
+      "epoch": 78.98,
+      "learning_rate": 3.394736842105263e-05,
+      "loss": 0.0052,
+      "step": 8925
+    },
+    {
+      "epoch": 79.2,
+      "learning_rate": 3.31578947368421e-05,
+      "loss": 0.0058,
+      "step": 8950
+    },
+    {
+      "epoch": 79.42,
+      "learning_rate": 3.2368421052631575e-05,
+      "loss": 0.0063,
+      "step": 8975
+    },
+    {
+      "epoch": 79.65,
+      "learning_rate": 3.1578947368421045e-05,
+      "loss": 0.0058,
+      "step": 9000
+    },
+    {
+      "epoch": 79.65,
+      "eval_loss": 0.31133854389190674,
+      "eval_runtime": 10.8234,
+      "eval_samples_per_second": 9.239,
+      "eval_steps_per_second": 1.201,
+      "eval_wer": 0.065048427597752,
+      "step": 9000
     }
   ],
   "max_steps": 10000,
   "num_train_epochs": 89,
+  "total_flos": 3.5456385787518284e+19,
   "trial_name": null,
   "trial_params": null
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4607f812b37e97d000dcc622b3e637fb3031eca1d8fd3c7555cdaadfec40180b
 size 1262229869

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c2f9145d655487602d0119001d797a278a1eb42e4a3b0bd88e042a0adbe3136
 size 1262229869

runs/Apr09_14-45-21_gpu07.cyverse.org/events.out.tfevents.1681076808.gpu07.cyverse.org.48142.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14933acd55b5be1858479eeffcc145290dda1fac71c2c315cec1bd00af72f3df
-size 58166

 version https://git-lfs.github.com/spec/v1
+oid sha256:4d5ae4f462216938e728a8fba4681e7f5455b3d2c2795cb02eb92e4c0cd05237
+size 64764