End of training

Browse files

Files changed (5) hide show

all_results.json +11 -11
eval_results.json +7 -7
runs/Dec18_17-32-59_129-146-179-188/events.out.tfevents.1671388061.129-146-179-188.141056.2 +3 -0
train_results.json +5 -5
trainer_state.json +324 -14

all_results.json CHANGED Viewed

@@ -1,15 +1,15 @@
 {
-    "epoch": 6.33,
-    "eval_cer": 0.9545736113978939,
-    "eval_loss": 4.904029369354248,
-    "eval_runtime": 53.4856,
     "eval_samples": 481,
-    "eval_samples_per_second": 8.993,
-    "eval_steps_per_second": 1.14,
-    "eval_wer": 0.9322987721691678,
-    "train_loss": 6.457582977294922,
-    "train_runtime": 2324.152,
     "train_samples": 2528,
-    "train_samples_per_second": 6.884,
-    "train_steps_per_second": 0.215
 }

 {
+    "epoch": 12.66,
+    "eval_cer": 0.9608244326394233,
+    "eval_loss": 4.192136287689209,
+    "eval_runtime": 52.7328,
     "eval_samples": 481,
+    "eval_samples_per_second": 9.121,
+    "eval_steps_per_second": 1.157,
+    "eval_wer": 0.9294849931787176,
+    "train_loss": 1.9340453338623047,
+    "train_runtime": 2875.5301,
     "train_samples": 2528,
+    "train_samples_per_second": 11.128,
+    "train_steps_per_second": 0.348
 }

eval_results.json CHANGED Viewed

@@ -1,10 +1,10 @@
 {
-    "epoch": 6.33,
-    "eval_cer": 0.9545736113978939,
-    "eval_loss": 4.904029369354248,
-    "eval_runtime": 53.4856,
     "eval_samples": 481,
-    "eval_samples_per_second": 8.993,
-    "eval_steps_per_second": 1.14,
-    "eval_wer": 0.9322987721691678
 }

 {
+    "epoch": 12.66,
+    "eval_cer": 0.9608244326394233,
+    "eval_loss": 4.192136287689209,
+    "eval_runtime": 52.7328,
     "eval_samples": 481,
+    "eval_samples_per_second": 9.121,
+    "eval_steps_per_second": 1.157,
+    "eval_wer": 0.9294849931787176
 }

runs/Dec18_17-32-59_129-146-179-188/events.out.tfevents.1671388061.129-146-179-188.141056.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1daf1563a93e258ca38036d9bbede0dd1eb72b9269b014b7ca7ddc67dd8eeb64
+size 405

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 6.33,
-    "train_loss": 6.457582977294922,
-    "train_runtime": 2324.152,
     "train_samples": 2528,
-    "train_samples_per_second": 6.884,
-    "train_steps_per_second": 0.215
 }

 {
+    "epoch": 12.66,
+    "train_loss": 1.9340453338623047,
+    "train_runtime": 2875.5301,
     "train_samples": 2528,
+    "train_samples_per_second": 11.128,
+    "train_steps_per_second": 0.348
 }

trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-  "best_metric": 4.904029369354248,
-  "best_model_checkpoint": "./checkpoint-500",
-  "epoch": 6.329113924050633,
-  "global_step": 500,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -358,18 +358,328 @@
       "step": 500
     },
     {
-      "epoch": 6.33,
-      "step": 500,
-      "total_flos": 1.7609861732211995e+19,
-      "train_loss": 6.457582977294922,
-      "train_runtime": 2324.152,
-      "train_samples_per_second": 6.884,
-      "train_steps_per_second": 0.215
     }
   ],
-  "max_steps": 500,
-  "num_train_epochs": 7,
-  "total_flos": 1.7609861732211995e+19,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 4.192136287689209,
+  "best_model_checkpoint": "./checkpoint-1000",
+  "epoch": 12.658227848101266,
+  "global_step": 1000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "step": 500
     },
     {
+      "epoch": 6.46,
+      "learning_rate": 3.8025000000000003e-07,
+      "loss": 4.3992,
+      "step": 510
+    },
+    {
+      "epoch": 6.58,
+      "learning_rate": 3.8775e-07,
+      "loss": 4.1942,
+      "step": 520
+    },
+    {
+      "epoch": 6.71,
+      "learning_rate": 3.9525000000000005e-07,
+      "loss": 4.339,
+      "step": 530
+    },
+    {
+      "epoch": 6.84,
+      "learning_rate": 4.0275000000000003e-07,
+      "loss": 4.2826,
+      "step": 540
+    },
+    {
+      "epoch": 6.96,
+      "learning_rate": 4.1025000000000006e-07,
+      "loss": 4.3752,
+      "step": 550
+    },
+    {
+      "epoch": 7.09,
+      "learning_rate": 4.1775000000000004e-07,
+      "loss": 3.9576,
+      "step": 560
+    },
+    {
+      "epoch": 7.22,
+      "learning_rate": 4.2524999999999997e-07,
+      "loss": 4.0814,
+      "step": 570
+    },
+    {
+      "epoch": 7.34,
+      "learning_rate": 4.3274999999999995e-07,
+      "loss": 4.3274,
+      "step": 580
+    },
+    {
+      "epoch": 7.47,
+      "learning_rate": 4.4025e-07,
+      "loss": 3.9749,
+      "step": 590
+    },
+    {
+      "epoch": 7.59,
+      "learning_rate": 4.4774999999999997e-07,
+      "loss": 3.8373,
+      "step": 600
+    },
+    {
+      "epoch": 7.72,
+      "learning_rate": 4.5525e-07,
+      "loss": 4.1076,
+      "step": 610
+    },
+    {
+      "epoch": 7.85,
+      "learning_rate": 4.6275e-07,
+      "loss": 3.8279,
+      "step": 620
+    },
+    {
+      "epoch": 7.97,
+      "learning_rate": 4.7025e-07,
+      "loss": 4.0263,
+      "step": 630
+    },
+    {
+      "epoch": 8.1,
+      "learning_rate": 4.7775e-07,
+      "loss": 3.8141,
+      "step": 640
+    },
+    {
+      "epoch": 8.23,
+      "learning_rate": 4.8525e-07,
+      "loss": 3.8791,
+      "step": 650
+    },
+    {
+      "epoch": 8.35,
+      "learning_rate": 4.927500000000001e-07,
+      "loss": 3.6906,
+      "step": 660
+    },
+    {
+      "epoch": 8.48,
+      "learning_rate": 5.0025e-07,
+      "loss": 4.0741,
+      "step": 670
+    },
+    {
+      "epoch": 8.61,
+      "learning_rate": 5.0775e-07,
+      "loss": 3.7322,
+      "step": 680
+    },
+    {
+      "epoch": 8.73,
+      "learning_rate": 5.152500000000001e-07,
+      "loss": 4.1834,
+      "step": 690
+    },
+    {
+      "epoch": 8.86,
+      "learning_rate": 5.2275e-07,
+      "loss": 3.8571,
+      "step": 700
+    },
+    {
+      "epoch": 8.99,
+      "learning_rate": 5.3025e-07,
+      "loss": 3.9223,
+      "step": 710
+    },
+    {
+      "epoch": 9.11,
+      "learning_rate": 5.3775e-07,
+      "loss": 3.6997,
+      "step": 720
+    },
+    {
+      "epoch": 9.24,
+      "learning_rate": 5.4525e-07,
+      "loss": 4.0024,
+      "step": 730
+    },
+    {
+      "epoch": 9.37,
+      "learning_rate": 5.5275e-07,
+      "loss": 3.7653,
+      "step": 740
+    },
+    {
+      "epoch": 9.49,
+      "learning_rate": 5.602500000000001e-07,
+      "loss": 3.873,
+      "step": 750
+    },
+    {
+      "epoch": 9.62,
+      "learning_rate": 5.6775e-07,
+      "loss": 3.597,
+      "step": 760
+    },
+    {
+      "epoch": 9.75,
+      "learning_rate": 5.7525e-07,
+      "loss": 3.7902,
+      "step": 770
+    },
+    {
+      "epoch": 9.87,
+      "learning_rate": 5.827500000000001e-07,
+      "loss": 3.8314,
+      "step": 780
+    },
+    {
+      "epoch": 10.0,
+      "learning_rate": 5.902500000000001e-07,
+      "loss": 3.956,
+      "step": 790
+    },
+    {
+      "epoch": 10.13,
+      "learning_rate": 5.9775e-07,
+      "loss": 3.6297,
+      "step": 800
+    },
+    {
+      "epoch": 10.25,
+      "learning_rate": 6.0525e-07,
+      "loss": 4.0449,
+      "step": 810
+    },
+    {
+      "epoch": 10.38,
+      "learning_rate": 6.1275e-07,
+      "loss": 3.5669,
+      "step": 820
+    },
+    {
+      "epoch": 10.51,
+      "learning_rate": 6.2025e-07,
+      "loss": 3.6994,
+      "step": 830
+    },
+    {
+      "epoch": 10.63,
+      "learning_rate": 6.277499999999999e-07,
+      "loss": 3.6146,
+      "step": 840
+    },
+    {
+      "epoch": 10.76,
+      "learning_rate": 6.3525e-07,
+      "loss": 3.8637,
+      "step": 850
+    },
+    {
+      "epoch": 10.89,
+      "learning_rate": 6.4275e-07,
+      "loss": 3.7,
+      "step": 860
+    },
+    {
+      "epoch": 11.01,
+      "learning_rate": 6.5025e-07,
+      "loss": 3.8526,
+      "step": 870
+    },
+    {
+      "epoch": 11.14,
+      "learning_rate": 6.5775e-07,
+      "loss": 3.7276,
+      "step": 880
+    },
+    {
+      "epoch": 11.27,
+      "learning_rate": 6.6525e-07,
+      "loss": 3.989,
+      "step": 890
+    },
+    {
+      "epoch": 11.39,
+      "learning_rate": 6.7275e-07,
+      "loss": 3.7838,
+      "step": 900
+    },
+    {
+      "epoch": 11.52,
+      "learning_rate": 6.802500000000001e-07,
+      "loss": 3.698,
+      "step": 910
+    },
+    {
+      "epoch": 11.65,
+      "learning_rate": 6.8775e-07,
+      "loss": 3.4391,
+      "step": 920
+    },
+    {
+      "epoch": 11.77,
+      "learning_rate": 6.9525e-07,
+      "loss": 3.7371,
+      "step": 930
+    },
+    {
+      "epoch": 11.9,
+      "learning_rate": 7.027500000000001e-07,
+      "loss": 3.4201,
+      "step": 940
+    },
+    {
+      "epoch": 12.03,
+      "learning_rate": 7.1025e-07,
+      "loss": 3.7721,
+      "step": 950
+    },
+    {
+      "epoch": 12.15,
+      "learning_rate": 7.1775e-07,
+      "loss": 3.7842,
+      "step": 960
+    },
+    {
+      "epoch": 12.28,
+      "learning_rate": 7.2525e-07,
+      "loss": 3.8125,
+      "step": 970
+    },
+    {
+      "epoch": 12.41,
+      "learning_rate": 7.3275e-07,
+      "loss": 3.7673,
+      "step": 980
+    },
+    {
+      "epoch": 12.53,
+      "learning_rate": 7.395e-07,
+      "loss": 3.7048,
+      "step": 990
+    },
+    {
+      "epoch": 12.66,
+      "learning_rate": 7.47e-07,
+      "loss": 3.3986,
+      "step": 1000
+    },
+    {
+      "epoch": 12.66,
+      "eval_cer": 0.9608244326394233,
+      "eval_loss": 4.192136287689209,
+      "eval_runtime": 52.6187,
+      "eval_samples_per_second": 9.141,
+      "eval_steps_per_second": 1.159,
+      "eval_wer": 0.9294849931787176,
+      "step": 1000
+    },
+    {
+      "epoch": 12.66,
+      "step": 1000,
+      "total_flos": 3.5131981783950033e+19,
+      "train_loss": 1.9340453338623047,
+      "train_runtime": 2875.5301,
+      "train_samples_per_second": 11.128,
+      "train_steps_per_second": 0.348
     }
   ],
+  "max_steps": 1000,
+  "num_train_epochs": 13,
+  "total_flos": 3.5131981783950033e+19,
   "trial_name": null,
   "trial_params": null
 }