Jeska
/

BertjeWDialDataQA20k

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Jeska commited on Nov 29, 2021

Commit

1918f07

·

1 Parent(s): 551ffec

End of training

Files changed (4) hide show

all_results.json +9 -9
eval_results.json +5 -5
train_results.json +4 -4
trainer_state.json +8 -8

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
     "epoch": 1.0,
-    "eval_loss": 2.0326364040374756,
-    "eval_runtime": 2556.1573,
     "eval_samples": 1000,
-    "eval_samples_per_second": 0.391,
-    "eval_steps_per_second": 0.049,
-    "perplexity": 7.634186651401794,
-    "train_loss": 2.207404653632681,
-    "train_runtime": 238732.8731,
     "train_samples": 19004,
-    "train_samples_per_second": 0.08,
-    "train_steps_per_second": 0.001
 }

 {
     "epoch": 1.0,
+    "eval_loss": 2.143171787261963,
+    "eval_runtime": 15.5445,
     "eval_samples": 1000,
+    "eval_samples_per_second": 64.332,
+    "eval_steps_per_second": 8.041,
+    "perplexity": 8.52643883529601,
+    "train_loss": 2.1925529711174243,
+    "train_runtime": 1129.3473,
     "train_samples": 19004,
+    "train_samples_per_second": 16.827,
+    "train_steps_per_second": 0.263
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 1.0,
-    "eval_loss": 2.0326364040374756,
-    "eval_runtime": 2556.1573,
     "eval_samples": 1000,
-    "eval_samples_per_second": 0.391,
-    "eval_steps_per_second": 0.049,
-    "perplexity": 7.634186651401794
 }

 {
     "epoch": 1.0,
+    "eval_loss": 2.143171787261963,
+    "eval_runtime": 15.5445,
     "eval_samples": 1000,
+    "eval_samples_per_second": 64.332,
+    "eval_steps_per_second": 8.041,
+    "perplexity": 8.52643883529601
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 2.207404653632681,
-    "train_runtime": 238732.8731,
     "train_samples": 19004,
-    "train_samples_per_second": 0.08,
-    "train_steps_per_second": 0.001
 }

 {
     "epoch": 1.0,
+    "train_loss": 2.1925529711174243,
+    "train_runtime": 1129.3473,
     "train_samples": 19004,
+    "train_samples_per_second": 16.827,
+    "train_steps_per_second": 0.263
 }

trainer_state.json CHANGED Viewed

@@ -9,20 +9,20 @@
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_loss": 2.0545575618743896,
-      "eval_runtime": 2627.6485,
-      "eval_samples_per_second": 0.381,
-      "eval_steps_per_second": 0.048,
       "step": 297
     },
     {
       "epoch": 1.0,
       "step": 297,
       "total_flos": 5001918049701888.0,
-      "train_loss": 2.207404653632681,
-      "train_runtime": 238732.8731,
-      "train_samples_per_second": 0.08,
-      "train_steps_per_second": 0.001
     }
   ],
   "max_steps": 297,

   "log_history": [
     {
       "epoch": 1.0,
+      "eval_loss": 2.1746253967285156,
+      "eval_runtime": 15.7469,
+      "eval_samples_per_second": 63.505,
+      "eval_steps_per_second": 7.938,
       "step": 297
     },
     {
       "epoch": 1.0,
       "step": 297,
       "total_flos": 5001918049701888.0,
+      "train_loss": 2.1925529711174243,
+      "train_runtime": 1129.3473,
+      "train_samples_per_second": 16.827,
+      "train_steps_per_second": 0.263
     }
   ],
   "max_steps": 297,