Training in progress, step 2900, checkpoint

Browse files

Files changed (6) hide show

last-checkpoint/model.safetensors +1 -1
last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +102 -3
last-checkpoint/training_args.bin +1 -1

last-checkpoint/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bc9ce79fc599740aef87f7fd48706228015ab07b2a1dfd751d72c6184f855c03
 size 966995080

 version https://git-lfs.github.com/spec/v1
+oid sha256:4322cb52e7375952b1b7c62f67285f280a31e123ef3ec661fb690ab98ec4501d
 size 966995080

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d306912bc344aaf32285eaf9f48c11bfb51cf53853d6ee359fddf97240bd0bb9
 size 1925064044

 version https://git-lfs.github.com/spec/v1
+oid sha256:0c8b1e94006a0bd0b5433a91a8d0f2efb9acd8c8debe0a4db87187d4f3df0549
 size 1925064044

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bdbc32589e7c655d36a5fb4597ce0c5aa1b6a41b9f31868102fdf367046c16aa
 size 14244

 version https://git-lfs.github.com/spec/v1
+oid sha256:aabc5988751cca3ac2633ffd4f8fdf9b2babdfb7020d9a25c5dd343ea5e806c4
 size 14244

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:709fa179bb7fc9a25ddcbc282cb67b6963af0127c69eb4336b37c5b7c5aba9e9
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:7b8eb592d2fee38e792ebd9f77ad72aad42bb0e171607f9852785836391c11e4
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
-  "epoch": 4.961832061068702,
   "eval_steps": 100,
-  "global_step": 2600,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -865,6 +865,105 @@
       "eval_steps_per_second": 0.103,
       "eval_wer": 181.14254021075985,
       "step": 2600
     }
   ],
   "logging_steps": 25,
@@ -872,7 +971,7 @@
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
-  "total_flos": 2.400222491541504e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": 70.1955074875208,
   "best_model_checkpoint": "./whisper-it/checkpoint-300",
+  "epoch": 5.534351145038168,
   "eval_steps": 100,
+  "global_step": 2900,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_steps_per_second": 0.103,
       "eval_wer": 181.14254021075985,
       "step": 2600
+    },
+    {
+      "epoch": 5.01,
+      "learning_rate": 3.945714285714286e-06,
+      "loss": 0.0156,
+      "step": 2625
+    },
+    {
+      "epoch": 5.06,
+      "learning_rate": 3.874285714285715e-06,
+      "loss": 0.0086,
+      "step": 2650
+    },
+    {
+      "epoch": 5.1,
+      "learning_rate": 3.802857142857143e-06,
+      "loss": 0.0075,
+      "step": 2675
+    },
+    {
+      "epoch": 5.15,
+      "learning_rate": 3.731428571428572e-06,
+      "loss": 0.009,
+      "step": 2700
+    },
+    {
+      "epoch": 5.15,
+      "eval_loss": 0.43247538805007935,
+      "eval_runtime": 1622.3539,
+      "eval_samples_per_second": 0.925,
+      "eval_steps_per_second": 0.116,
+      "eval_wer": 161.67498613422075,
+      "step": 2700
+    },
+    {
+      "epoch": 5.2,
+      "learning_rate": 3.66e-06,
+      "loss": 0.0074,
+      "step": 2725
+    },
+    {
+      "epoch": 5.25,
+      "learning_rate": 3.588571428571429e-06,
+      "loss": 0.0096,
+      "step": 2750
+    },
+    {
+      "epoch": 5.3,
+      "learning_rate": 3.5171428571428573e-06,
+      "loss": 0.0098,
+      "step": 2775
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 3.4457142857142863e-06,
+      "loss": 0.0069,
+      "step": 2800
+    },
+    {
+      "epoch": 5.34,
+      "eval_loss": 0.43616336584091187,
+      "eval_runtime": 1644.4427,
+      "eval_samples_per_second": 0.912,
+      "eval_steps_per_second": 0.114,
+      "eval_wer": 161.19661674986133,
+      "step": 2800
+    },
+    {
+      "epoch": 5.39,
+      "learning_rate": 3.3742857142857145e-06,
+      "loss": 0.0103,
+      "step": 2825
+    },
+    {
+      "epoch": 5.44,
+      "learning_rate": 3.302857142857143e-06,
+      "loss": 0.0083,
+      "step": 2850
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 3.2314285714285716e-06,
+      "loss": 0.0084,
+      "step": 2875
+    },
+    {
+      "epoch": 5.53,
+      "learning_rate": 3.1600000000000002e-06,
+      "loss": 0.0093,
+      "step": 2900
+    },
+    {
+      "epoch": 5.53,
+      "eval_loss": 0.43420636653900146,
+      "eval_runtime": 1623.2282,
+      "eval_samples_per_second": 0.924,
+      "eval_steps_per_second": 0.116,
+      "eval_wer": 157.52218524681086,
+      "step": 2900
     }
   ],
   "logging_steps": 25,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 8,
   "save_steps": 100,
+  "total_flos": 2.67706246606848e+19,
   "trial_name": null,
   "trial_params": null
 }

last-checkpoint/training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:96eac9b215a976aa2dd9548a4525c1b8963c1f6f7769df3b71271d00769da268
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:e2c92dac35d16dc814e0a1581e1901c1f2948813ba744cab88f1ca1434e0d291
 size 4856