End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [cardiffnlp/twitter-roberta-base-2019-90m](https://huggingface.co/cardiffnlp/twitter-roberta-base-2019-90m) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 3.2425
 ## Model description

 This model is a fine-tuned version of [cardiffnlp/twitter-roberta-base-2019-90m](https://huggingface.co/cardiffnlp/twitter-roberta-base-2019-90m) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.0187
 ## Model description

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
-    "epoch": 6.74,
-    "eval_loss": 2.2311766147613525,
-    "eval_runtime": 346.8001,
-    "eval_samples": 299980,
-    "eval_samples_per_second": 864.994,
-    "eval_steps_per_second": 54.063,
-    "perplexity": 9.310814879187836,
-    "train_loss": 2.443978935546875,
-    "train_runtime": 257950.5102,
-    "train_samples": 5699618,
-    "train_samples_per_second": 148.866,
-    "train_steps_per_second": 9.304
 }

 {
+    "epoch": 20.21,
+    "eval_loss": 3.0186915397644043,
+    "eval_runtime": 115.34,
+    "eval_samples": 99982,
+    "eval_samples_per_second": 866.845,
+    "eval_steps_per_second": 54.179,
+    "perplexity": 20.464497177444322,
+    "train_loss": 3.3721608984375,
+    "train_runtime": 188638.1929,
+    "train_samples": 1899664,
+    "train_samples_per_second": 203.564,
+    "train_steps_per_second": 12.723
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 6.74,
-    "eval_loss": 2.2311766147613525,
-    "eval_runtime": 346.8001,
-    "eval_samples": 299980,
-    "eval_samples_per_second": 864.994,
-    "eval_steps_per_second": 54.063,
-    "perplexity": 9.310814879187836
 }

 {
+    "epoch": 20.21,
+    "eval_loss": 3.0186915397644043,
+    "eval_runtime": 115.34,
+    "eval_samples": 99982,
+    "eval_samples_per_second": 866.845,
+    "eval_steps_per_second": 54.179,
+    "perplexity": 20.464497177444322
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 6.74,
-    "train_loss": 2.443978935546875,
-    "train_runtime": 257950.5102,
-    "train_samples": 5699618,
-    "train_samples_per_second": 148.866,
-    "train_steps_per_second": 9.304
 }

 {
+    "epoch": 20.21,
+    "train_loss": 3.3721608984375,
+    "train_runtime": 188638.1929,
+    "train_samples": 1899664,
+    "train_samples_per_second": 203.564,
+    "train_steps_per_second": 12.723
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff