Training in progress, step 2100, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +102 -3
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:53b109faeebfa0c0ba61658697fa9237074126c445642641b79158eb7ba30739
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:ce5374a700f6cb8856fec0d069890cb1c699a8142cbab7571daa3287a2b3058b
 size 966995080

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fc9233433683d3c753053a718e86d2d4fe0a922bf031d40e5d28f0e2784fb198
 size 1925064044

 version https://git-lfs.github.com/spec/v1
+oid sha256:10dcd11e2cb1895f7c3e1c68032ca79221ba9837804ddc4c0ad628db4cb3bbbb
 size 1925064044

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:be7e79fe3343879b02c09de94643d5ac71cd5dcd0d985d78489ded30fcafb6d1
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:a9f1fe924fb046e82f32a9e9633992150d028a3f688d46144a5a5c7f5cbc6bad
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:095de9bddf48720b0136a232ba94acee339b784d05fa46f4489ae091d1c97a55
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:d6c2e8507c15e11b5d34f126b0dbb02f39afdf32066bd4c386593945bed215e3
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
-  "epoch": 3.435114503816794,
   "eval_steps": 100,
-  "global_step": 1800,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -601,6 +601,105 @@
       "eval_steps_per_second": 0.114,
       "eval_wer": 163.39434276206325,
       "step": 1800
     }
   ],
   "logging_steps": 25,
@@ -608,7 +707,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 1.661645876502528e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
+  "epoch": 4.00763358778626,
   "eval_steps": 100,
+  "global_step": 2100,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.114,
       "eval_wer": 163.39434276206325,
       "step": 1800
+    },
+    {
+      "epoch": 3.48,
+      "learning_rate": 6.231428571428571e-06,
+      "loss": 0.0348,
+      "step": 1825
+    },
+    {
+      "epoch": 3.53,
+      "learning_rate": 6.16e-06,
+      "loss": 0.0336,
+      "step": 1850
+    },
+    {
+      "epoch": 3.58,
+      "learning_rate": 6.088571428571429e-06,
+      "loss": 0.0347,
+      "step": 1875
+    },
+    {
+      "epoch": 3.63,
+      "learning_rate": 6.017142857142858e-06,
+      "loss": 0.0345,
+      "step": 1900
+    },
+    {
+      "epoch": 3.63,
+      "eval_loss": 0.40161246061325073,
+      "eval_runtime": 1812.1091,
+      "eval_samples_per_second": 0.828,
+      "eval_steps_per_second": 0.104,
+      "eval_wer": 158.56905158069884,
+      "step": 1900
+    },
+    {
+      "epoch": 3.67,
+      "learning_rate": 5.945714285714286e-06,
+      "loss": 0.0327,
+      "step": 1925
+    },
+    {
+      "epoch": 3.72,
+      "learning_rate": 5.874285714285715e-06,
+      "loss": 0.0363,
+      "step": 1950
+    },
+    {
+      "epoch": 3.77,
+      "learning_rate": 5.802857142857144e-06,
+      "loss": 0.0328,
+      "step": 1975
+    },
+    {
+      "epoch": 3.82,
+      "learning_rate": 5.731428571428572e-06,
+      "loss": 0.0346,
+      "step": 2000
+    },
+    {
+      "epoch": 3.82,
+      "eval_loss": 0.40199828147888184,
+      "eval_runtime": 1770.9946,
+      "eval_samples_per_second": 0.847,
+      "eval_steps_per_second": 0.106,
+      "eval_wer": 176.11619523017194,
+      "step": 2000
+    },
+    {
+      "epoch": 3.86,
+      "learning_rate": 5.66e-06,
+      "loss": 0.0363,
+      "step": 2025
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 5.588571428571429e-06,
+      "loss": 0.0346,
+      "step": 2050
+    },
+    {
+      "epoch": 3.96,
+      "learning_rate": 5.517142857142857e-06,
+      "loss": 0.0342,
+      "step": 2075
+    },
+    {
+      "epoch": 4.01,
+      "learning_rate": 5.445714285714286e-06,
+      "loss": 0.0317,
+      "step": 2100
+    },
+    {
+      "epoch": 4.01,
+      "eval_loss": 0.400082528591156,
+      "eval_runtime": 1696.9765,
+      "eval_samples_per_second": 0.884,
+      "eval_steps_per_second": 0.111,
+      "eval_wer": 134.65058236272878,
+      "step": 2100
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 1.938485851029504e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:56b1eae5bcb377ffc0d4c8ff2741201cd456f48425776cda068ae6f4f3917a46
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:77aa736647908221a6b18a6489ddd200e9a64629e700dfb2729d6eac836a4004
 size 4856