Training in progress, step 50, checkpoint

Browse files

Files changed (7) hide show

last-checkpoint/optimizer.pt +1 -1
last-checkpoint/rng_state_0.pth +1 -1
last-checkpoint/rng_state_1.pth +1 -1
last-checkpoint/rng_state_2.pth +1 -1
last-checkpoint/rng_state_3.pth +1 -1
last-checkpoint/scheduler.pt +1 -1
last-checkpoint/trainer_state.json +188 -5

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fd4501e6e24aa8c0ef481c8984155b903083659723d147978469ceee0d0ff808
 size 646253418

 version https://git-lfs.github.com/spec/v1
+oid sha256:400636f1de12a1f7168eb6762fd9904f32785f8150a2cc3041d6060ca1b2dc94
 size 646253418

last-checkpoint/rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2d932da0cd778c65f882ebad94f061fa945d8eb0768ab547248e534106aabd75
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2d6aabc024a9071194ecaba16e168843a901ead25baec1294e2f84669278e88
 size 15024

last-checkpoint/rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3ccbce26d5445d255b71fa885c331603b0569189aadfd8e26af00d6b613ea6d8
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb74a0040f8ba9822b2c68449d73ed216e2062a54dd68c08c25cbf03157232fd
 size 15024

last-checkpoint/rng_state_2.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:85bef604423df6ed484dfd8f8152787384d3c740b0ab75e1ad5845fc4a4e8d49
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:c0d974e2950b9a96052853a1cbadd24f05269641f39a01c0fae36387781a1099
 size 15024

last-checkpoint/rng_state_3.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f64cb6a90efc5bf7ecaae9cd3f6e6770b251a934668463b687818995580d5af7
 size 15024

 version https://git-lfs.github.com/spec/v1
+oid sha256:6cc52cbab8dfb53f8f8377d2b4352ad997ec146176d3479eaeea19408fcf7136
 size 15024

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:104ca30e28a5b1dab3af7faae7997b363c4540da87a225b9c13fa07ba946661c
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:27a06debcc524d5e29377ca1c81e86a2cd28c93506013f68ac7d1bf85491fb4e
 size 1064

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": NaN,
   "best_model_checkpoint": "miner_id_24/checkpoint-25",
-  "epoch": 0.10775862068965517,
   "eval_steps": 25,
-  "global_step": 25,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -198,6 +198,189 @@
       "eval_samples_per_second": 35.756,
       "eval_steps_per_second": 9.297,
       "step": 25
     }
   ],
   "logging_steps": 1,
@@ -212,7 +395,7 @@
         "early_stopping_threshold": 0.0
       },
       "attributes": {
-        "early_stopping_patience_counter": 0
       }
     },
     "TrainerControl": {
@@ -221,12 +404,12 @@
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
-        "should_training_stop": false
       },
       "attributes": {}
     }
   },
-  "total_flos": 2.8155439495092634e+17,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null

 {
   "best_metric": NaN,
   "best_model_checkpoint": "miner_id_24/checkpoint-25",
+  "epoch": 0.21551724137931033,
   "eval_steps": 25,
+  "global_step": 50,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 35.756,
       "eval_steps_per_second": 9.297,
       "step": 25
+    },
+    {
+      "epoch": 0.11206896551724138,
+      "grad_norm": NaN,
+      "learning_rate": 8.883279133655399e-05,
+      "loss": 0.0,
+      "step": 26
+    },
+    {
+      "epoch": 0.11637931034482758,
+      "grad_norm": NaN,
+      "learning_rate": 8.78438832714026e-05,
+      "loss": 0.0,
+      "step": 27
+    },
+    {
+      "epoch": 0.1206896551724138,
+      "grad_norm": NaN,
+      "learning_rate": 8.681980515339464e-05,
+      "loss": 0.0,
+      "step": 28
+    },
+    {
+      "epoch": 0.125,
+      "grad_norm": NaN,
+      "learning_rate": 8.57616535910292e-05,
+      "loss": 0.0,
+      "step": 29
+    },
+    {
+      "epoch": 0.12931034482758622,
+      "grad_norm": NaN,
+      "learning_rate": 8.467056167950311e-05,
+      "loss": 0.0,
+      "step": 30
+    },
+    {
+      "epoch": 0.1336206896551724,
+      "grad_norm": NaN,
+      "learning_rate": 8.354769778736406e-05,
+      "loss": 0.0,
+      "step": 31
+    },
+    {
+      "epoch": 0.13793103448275862,
+      "grad_norm": NaN,
+      "learning_rate": 8.239426430539243e-05,
+      "loss": 0.0,
+      "step": 32
+    },
+    {
+      "epoch": 0.14224137931034483,
+      "grad_norm": NaN,
+      "learning_rate": 8.12114963590511e-05,
+      "loss": 0.0,
+      "step": 33
+    },
+    {
+      "epoch": 0.14655172413793102,
+      "grad_norm": NaN,
+      "learning_rate": 8.000066048588211e-05,
+      "loss": 0.0,
+      "step": 34
+    },
+    {
+      "epoch": 0.15086206896551724,
+      "grad_norm": NaN,
+      "learning_rate": 7.876305327926657e-05,
+      "loss": 0.0,
+      "step": 35
+    },
+    {
+      "epoch": 0.15517241379310345,
+      "grad_norm": NaN,
+      "learning_rate": 7.75e-05,
+      "loss": 0.0,
+      "step": 36
+    },
+    {
+      "epoch": 0.15948275862068967,
+      "grad_norm": NaN,
+      "learning_rate": 7.62128531571699e-05,
+      "loss": 0.0,
+      "step": 37
+    },
+    {
+      "epoch": 0.16379310344827586,
+      "grad_norm": NaN,
+      "learning_rate": 7.490299105985507e-05,
+      "loss": 0.0,
+      "step": 38
+    },
+    {
+      "epoch": 0.16810344827586207,
+      "grad_norm": NaN,
+      "learning_rate": 7.357181634119777e-05,
+      "loss": 0.0,
+      "step": 39
+    },
+    {
+      "epoch": 0.1724137931034483,
+      "grad_norm": NaN,
+      "learning_rate": 7.222075445642904e-05,
+      "loss": 0.0,
+      "step": 40
+    },
+    {
+      "epoch": 0.17672413793103448,
+      "grad_norm": NaN,
+      "learning_rate": 7.085125215645552e-05,
+      "loss": 0.0,
+      "step": 41
+    },
+    {
+      "epoch": 0.1810344827586207,
+      "grad_norm": NaN,
+      "learning_rate": 6.946477593864228e-05,
+      "loss": 0.0,
+      "step": 42
+    },
+    {
+      "epoch": 0.1853448275862069,
+      "grad_norm": NaN,
+      "learning_rate": 6.80628104764508e-05,
+      "loss": 0.0,
+      "step": 43
+    },
+    {
+      "epoch": 0.1896551724137931,
+      "grad_norm": NaN,
+      "learning_rate": 6.664685702961344e-05,
+      "loss": 0.0,
+      "step": 44
+    },
+    {
+      "epoch": 0.1939655172413793,
+      "grad_norm": NaN,
+      "learning_rate": 6.52184318365468e-05,
+      "loss": 0.0,
+      "step": 45
+    },
+    {
+      "epoch": 0.19827586206896552,
+      "grad_norm": NaN,
+      "learning_rate": 6.377906449072578e-05,
+      "loss": 0.0,
+      "step": 46
+    },
+    {
+      "epoch": 0.2025862068965517,
+      "grad_norm": NaN,
+      "learning_rate": 6.23302963027565e-05,
+      "loss": 0.0,
+      "step": 47
+    },
+    {
+      "epoch": 0.20689655172413793,
+      "grad_norm": NaN,
+      "learning_rate": 6.087367864990233e-05,
+      "loss": 0.0,
+      "step": 48
+    },
+    {
+      "epoch": 0.21120689655172414,
+      "grad_norm": NaN,
+      "learning_rate": 5.941077131483025e-05,
+      "loss": 0.0,
+      "step": 49
+    },
+    {
+      "epoch": 0.21551724137931033,
+      "grad_norm": NaN,
+      "learning_rate": 5.794314081535644e-05,
+      "loss": 0.0,
+      "step": 50
+    },
+    {
+      "epoch": 0.21551724137931033,
+      "eval_loss": NaN,
+      "eval_runtime": 1.3982,
+      "eval_samples_per_second": 35.76,
+      "eval_steps_per_second": 9.297,
+      "step": 50
     }
   ],
   "logging_steps": 1,
         "early_stopping_threshold": 0.0
       },
       "attributes": {
+        "early_stopping_patience_counter": 1
       }
     },
     "TrainerControl": {
         "should_evaluate": false,
         "should_log": false,
         "should_save": true,
+        "should_training_stop": true
       },
       "attributes": {}
     }
   },
+  "total_flos": 5.6275728548338074e+17,
   "train_batch_size": 2,
   "trial_name": null,
   "trial_params": null