Training in progress, step 1800, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +69 -3
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f2ea132becf87dc52197cf8a159e74b0528f1247ff978154da29acbbc2518801
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:53b109faeebfa0c0ba61658697fa9237074126c445642641b79158eb7ba30739
 size 966995080

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6fc2acc2a6470bfc38326462621d18c5f641b87e8c17fb748004af842c9e4d6c
 size 1925064044

 version https://git-lfs.github.com/spec/v1
+oid sha256:fc9233433683d3c753053a718e86d2d4fe0a922bf031d40e5d28f0e2784fb198
 size 1925064044

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:153f4050e22e2494e5c9cdfc54488cbdedf363e2e2f8bc78cef38c7af2fa76ee
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:be7e79fe3343879b02c09de94643d5ac71cd5dcd0d985d78489ded30fcafb6d1
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d3466ad5bf04d87f27e472dda1dbd8f7524011eeb345f9a73787480c172c7321
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:095de9bddf48720b0136a232ba94acee339b784d05fa46f4489ae091d1c97a55
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
-  "epoch": 3.053435114503817,
   "eval_steps": 100,
-  "global_step": 1600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -535,6 +535,72 @@
       "eval_steps_per_second": 0.11,
       "eval_wer": 166.51414309484193,
       "step": 1600
     }
   ],
   "logging_steps": 25,
@@ -542,7 +608,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 1.476951220297728e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
+  "epoch": 3.435114503816794,
   "eval_steps": 100,
+  "global_step": 1800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.11,
       "eval_wer": 166.51414309484193,
       "step": 1600
+    },
+    {
+      "epoch": 3.1,
+      "learning_rate": 6.8028571428571434e-06,
+      "loss": 0.0353,
+      "step": 1625
+    },
+    {
+      "epoch": 3.15,
+      "learning_rate": 6.7314285714285724e-06,
+      "loss": 0.0366,
+      "step": 1650
+    },
+    {
+      "epoch": 3.2,
+      "learning_rate": 6.660000000000001e-06,
+      "loss": 0.034,
+      "step": 1675
+    },
+    {
+      "epoch": 3.24,
+      "learning_rate": 6.588571428571429e-06,
+      "loss": 0.0324,
+      "step": 1700
+    },
+    {
+      "epoch": 3.24,
+      "eval_loss": 0.3962928354740143,
+      "eval_runtime": 1676.3692,
+      "eval_samples_per_second": 0.895,
+      "eval_steps_per_second": 0.112,
+      "eval_wer": 170.93039378813089,
+      "step": 1700
+    },
+    {
+      "epoch": 3.29,
+      "learning_rate": 6.517142857142858e-06,
+      "loss": 0.0332,
+      "step": 1725
+    },
+    {
+      "epoch": 3.34,
+      "learning_rate": 6.445714285714286e-06,
+      "loss": 0.0342,
+      "step": 1750
+    },
+    {
+      "epoch": 3.39,
+      "learning_rate": 6.374285714285715e-06,
+      "loss": 0.0353,
+      "step": 1775
+    },
+    {
+      "epoch": 3.44,
+      "learning_rate": 6.302857142857144e-06,
+      "loss": 0.0348,
+      "step": 1800
+    },
+    {
+      "epoch": 3.44,
+      "eval_loss": 0.40044304728507996,
+      "eval_runtime": 1648.6224,
+      "eval_samples_per_second": 0.91,
+      "eval_steps_per_second": 0.114,
+      "eval_wer": 163.39434276206325,
+      "step": 1800
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 1.661645876502528e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:671df0b935ce81783da8e41ef1c633553d21543422fa2f0117e9c7591df7d4f5
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:56b1eae5bcb377ffc0d4c8ff2741201cd456f48425776cda068ae6f4f3917a46
 size 4856