Training in progress, step 2600, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +69 -3
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:427ae072cbc49ae148942a74b9f051c838d316269f69b8f3611c391c8a391f3c
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:bc9ce79fc599740aef87f7fd48706228015ab07b2a1dfd751d72c6184f855c03
 size 966995080

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:08fe004ed695904662ce35ea3ec86602835c8a8f59b8179ec9a51565518cb6bf
 size 1925064044

 version https://git-lfs.github.com/spec/v1
+oid sha256:d306912bc344aaf32285eaf9f48c11bfb51cf53853d6ee359fddf97240bd0bb9
 size 1925064044

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ff499e04130faa18bab8a5b949aa9f38474523cf8282520e9cbda71727ce4299
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:bdbc32589e7c655d36a5fb4597ce0c5aa1b6a41b9f31868102fdf367046c16aa
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8b19556c05ce15c76b44c442588d62a6615081b49579cf8217e66cc8d1a38558
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:709fa179bb7fc9a25ddcbc282cb67b6963af0127c69eb4336b37c5b7c5aba9e9
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
-  "epoch": 4.580152671755725,
   "eval_steps": 100,
-  "global_step": 2400,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -799,6 +799,72 @@
       "eval_steps_per_second": 0.106,
       "eval_wer": 179.64503605102607,
       "step": 2400
     }
   ],
   "logging_steps": 25,
@@ -806,7 +872,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 2.215527835336704e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
+  "epoch": 4.961832061068702,
   "eval_steps": 100,
+  "global_step": 2600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.106,
       "eval_wer": 179.64503605102607,
       "step": 2400
+    },
+    {
+      "epoch": 4.63,
+      "learning_rate": 4.5171428571428575e-06,
+      "loss": 0.0165,
+      "step": 2425
+    },
+    {
+      "epoch": 4.68,
+      "learning_rate": 4.445714285714286e-06,
+      "loss": 0.0159,
+      "step": 2450
+    },
+    {
+      "epoch": 4.72,
+      "learning_rate": 4.374285714285715e-06,
+      "loss": 0.0161,
+      "step": 2475
+    },
+    {
+      "epoch": 4.77,
+      "learning_rate": 4.302857142857143e-06,
+      "loss": 0.0172,
+      "step": 2500
+    },
+    {
+      "epoch": 4.77,
+      "eval_loss": 0.418465793132782,
+      "eval_runtime": 1826.6437,
+      "eval_samples_per_second": 0.821,
+      "eval_steps_per_second": 0.103,
+      "eval_wer": 186.09262340543538,
+      "step": 2500
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 4.231428571428572e-06,
+      "loss": 0.016,
+      "step": 2525
+    },
+    {
+      "epoch": 4.87,
+      "learning_rate": 4.16e-06,
+      "loss": 0.0163,
+      "step": 2550
+    },
+    {
+      "epoch": 4.91,
+      "learning_rate": 4.088571428571429e-06,
+      "loss": 0.0163,
+      "step": 2575
+    },
+    {
+      "epoch": 4.96,
+      "learning_rate": 4.017142857142857e-06,
+      "loss": 0.0142,
+      "step": 2600
+    },
+    {
+      "epoch": 4.96,
+      "eval_loss": 0.41750070452690125,
+      "eval_runtime": 1819.7416,
+      "eval_samples_per_second": 0.824,
+      "eval_steps_per_second": 0.103,
+      "eval_wer": 181.14254021075985,
+      "step": 2600
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 2.400222491541504e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:ec4f3c4eccd10d40b1e2a9f33f5736b02d4539dda80932770d03eaca234d4288
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:96eac9b215a976aa2dd9548a4525c1b8963c1f6f7769df3b71271d00769da268
 size 4856