Upload 12 files

Files changed (5) hide show

model.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:aee3fd748594dcf230b2822b9884b379889c6988b2ed992b3a500009f222ecff
+size 540029536

optimizer.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6bfaac227376285bff86ad9729861d4b3c43f9871edf9ee188edde7bfb115408
+size 1080178938

rng_state.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:ba27a5e51ec0477de1e2f5db295d5983ece41d5e085f8eb9c585e9de57ef6a49
+size 14244

scheduler.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c015a7929fba91dd37c2abe94ce0ce215b289951d5327e76cdcd20f461119e3d
+size 1064

trainer_state.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 10.0,
   "eval_steps": 500,
-  "global_step": 149110,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -1795,22 +1795,13 @@
       "learning_rate": 1.4754208302595401e-08,
       "loss": 0.0659,
       "step": 149000
-    },
-    {
-      "epoch": 10.0,
-      "step": 149110,
-      "total_flos": 9808298492528640.0,
-      "train_loss": 0.1504479006291696,
-      "train_runtime": 9647.5503,
-      "train_samples_per_second": 15.456,
-      "train_steps_per_second": 15.456
     }
   ],
   "logging_steps": 500,
   "max_steps": 149110,
   "num_train_epochs": 10,
   "save_steps": 500,
-  "total_flos": 9808298492528640.0,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 9.992622895848703,
   "eval_steps": 500,
+  "global_step": 149000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "learning_rate": 1.4754208302595401e-08,
       "loss": 0.0659,
       "step": 149000
     }
   ],
   "logging_steps": 500,
   "max_steps": 149110,
   "num_train_epochs": 10,
   "save_steps": 500,
+  "total_flos": 9801062808576000.0,
   "trial_name": null,
   "trial_params": null
 }