Training in progress, step 20000

Files changed (9) hide show

last-checkpoint/optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d7ce6f47f0b535e3c17cf93424dcb27acff863da3bee507ab09fd792b5441dce
 size 943333453

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb94510585a257f26748b3563d1ac24bf7b6dffebf090a50785a4066c9f51aff
 size 943333453

last-checkpoint/pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:936c68f355516686acc9fd8569ff44fad57e40ebab35445a8e00a909274717d0
 size 471708325

 version https://git-lfs.github.com/spec/v1
+oid sha256:b85cbaf1f19bee050d6730e73ebf9b86b0780dc26e6d96aaeeb9ee9e5f1f501a
 size 471708325

last-checkpoint/rng_state.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7d26e5aedc9783fd5b42389903a55518c26dc435542e82c46eab02c99a9e3e04
 size 14503

 version https://git-lfs.github.com/spec/v1
+oid sha256:d9949a52e3e65d0f2cec3a08459660e9711e9c1359d9f08ac2c07545128408d7
 size 14503

last-checkpoint/scaler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:320e7103d68ac581e0918aaf471171063cef4a15a2322663039e70f087daa791
 size 559

 version https://git-lfs.github.com/spec/v1
+oid sha256:21aa4819edee177e45714c40c36966f6d1435e96960cbe524e7640fd0aede9b3
 size 559

last-checkpoint/scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6b00fc05a490426638de1c3614fb5c6f7749b64a69fbff99c5dbd21e1e76058a
 size 623

 version https://git-lfs.github.com/spec/v1
+oid sha256:03db6b1df6a961019a71debb179f7739d4e74f092cdcb8c4d9c2a77019355bb7
 size 623

last-checkpoint/trainer_state.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
   "best_metric": null,
   "best_model_checkpoint": null,
-  "epoch": 0.48866301798279904,
-  "global_step": 15000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
@@ -54,11 +54,27 @@
       "eval_samples_per_second": 7.506,
       "eval_steps_per_second": 3.753,
       "step": 15000
     }
   ],
   "max_steps": 92088,
   "num_train_epochs": 3,
-  "total_flos": 3.309705437184e+16,
   "trial_name": null,
   "trial_params": null
 }

 {
   "best_metric": null,
   "best_model_checkpoint": null,
+  "epoch": 0.6515506906437321,
+  "global_step": 20000,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
       "eval_samples_per_second": 7.506,
       "eval_steps_per_second": 3.753,
       "step": 15000
+    },
+    {
+      "epoch": 0.65,
+      "learning_rate": 2.3488728173051864e-05,
+      "loss": 0.9992,
+      "step": 20000
+    },
+    {
+      "epoch": 0.65,
+      "eval_exact_match": 81.09024517475221,
+      "eval_f1": 85.49992934663945,
+      "eval_loss": 0.8323877453804016,
+      "eval_runtime": 1541.3611,
+      "eval_samples_per_second": 7.469,
+      "eval_steps_per_second": 3.735,
+      "step": 20000
     }
   ],
   "max_steps": 92088,
   "num_train_epochs": 3,
+  "total_flos": 4.412940582912e+16,
   "trial_name": null,
   "trial_params": null
 }

nbest_predictions.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

predictions.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:936c68f355516686acc9fd8569ff44fad57e40ebab35445a8e00a909274717d0
 size 471708325

 version https://git-lfs.github.com/spec/v1
+oid sha256:b85cbaf1f19bee050d6730e73ebf9b86b0780dc26e6d96aaeeb9ee9e5f1f501a
 size 471708325