Model save

Browse files

Files changed (8) hide show

.ipynb_checkpoints/tokenizer_config-checkpoint.json +1 -0
.ipynb_checkpoints/train_results-checkpoint.json +9 -0
all_results.json +4 -4
pytorch_model.bin +1 -1
special_tokens_map.json +1 -1
train_results.json +4 -4
trainer_state.json +55 -55
training_args.bin +1 -1

.ipynb_checkpoints/tokenizer_config-checkpoint.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"unk_token": "[UNK]", "bos_token": "<s>", "eos_token": "</s>", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "\|", "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "./wav2vec2-xls-r-300m-ar", "tokenizer_class": "Wav2Vec2CTCTokenizer"}

.ipynb_checkpoints/train_results-checkpoint.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 5.0,
+    "total_flos": 1.3476444758728704e+17,
+    "train_loss": 16.66825189590454,
+    "train_runtime": 91.9274,
+    "train_samples": 128,
+    "train_samples_per_second": 6.962,
+    "train_steps_per_second": 0.109
+}

all_results.json CHANGED Viewed

@@ -7,9 +7,9 @@
     "eval_steps_per_second": 0.334,
     "eval_wer": 1.0,
     "total_flos": 1.3476444758728704e+17,
-    "train_loss": 19.56191415786743,
-    "train_runtime": 92.9692,
     "train_samples": 128,
-    "train_samples_per_second": 6.884,
-    "train_steps_per_second": 0.108
 }

     "eval_steps_per_second": 0.334,
     "eval_wer": 1.0,
     "total_flos": 1.3476444758728704e+17,
+    "train_loss": 16.66825189590454,
+    "train_runtime": 91.9274,
     "train_samples": 128,
+    "train_samples_per_second": 6.962,
+    "train_steps_per_second": 0.109
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7ea93def4f37206b423024351165f6f76fb31abde5bd5c8aa0c1691f50e4ca3b
 size 1262067185

 version https://git-lfs.github.com/spec/v1
+oid sha256:ffac37d2a17fb457b11df915b6fb3a959357616b3a8f9bdd9aa20fc3083c8eb9
 size 1262067185

special_tokens_map.json CHANGED Viewed

@@ -1 +1 @@

- {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}]}

+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}]}

train_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 5.0,
     "total_flos": 1.3476444758728704e+17,
-    "train_loss": 19.56191415786743,
-    "train_runtime": 92.9692,
     "train_samples": 128,
-    "train_samples_per_second": 6.884,
-    "train_steps_per_second": 0.108
 }

 {
     "epoch": 5.0,
     "total_flos": 1.3476444758728704e+17,
+    "train_loss": 16.66825189590454,
+    "train_runtime": 91.9274,
     "train_samples": 128,
+    "train_samples_per_second": 6.962,
+    "train_steps_per_second": 0.109
 }

trainer_state.json CHANGED Viewed

@@ -10,150 +10,150 @@
     {
       "epoch": 0.5,
       "learning_rate": 7.5e-05,
-      "loss": 22.283,
       "step": 1
     },
     {
       "epoch": 0.5,
-      "eval_loss": 38.53455352783203,
-      "eval_runtime": 5.6686,
-      "eval_samples_per_second": 22.581,
-      "eval_steps_per_second": 0.353,
       "eval_wer": 1.0,
       "step": 1
     },
     {
       "epoch": 1.0,
       "learning_rate": 7.5e-05,
-      "loss": 22.622,
       "step": 2
     },
     {
       "epoch": 1.0,
-      "eval_loss": 38.53455352783203,
-      "eval_runtime": 5.4852,
-      "eval_samples_per_second": 23.336,
-      "eval_steps_per_second": 0.365,
       "eval_wer": 1.0,
       "step": 2
     },
     {
       "epoch": 1.5,
       "learning_rate": 6.75e-05,
-      "loss": 23.0656,
       "step": 3
     },
     {
       "epoch": 1.5,
-      "eval_loss": 37.73825454711914,
-      "eval_runtime": 5.4328,
-      "eval_samples_per_second": 23.561,
-      "eval_steps_per_second": 0.368,
       "eval_wer": 1.0,
       "step": 3
     },
     {
       "epoch": 2.0,
-      "learning_rate": 6.75e-05,
-      "loss": 20.8353,
       "step": 4
     },
     {
       "epoch": 2.0,
-      "eval_loss": 37.73825454711914,
-      "eval_runtime": 5.7103,
-      "eval_samples_per_second": 22.416,
-      "eval_steps_per_second": 0.35,
       "eval_wer": 1.0,
       "step": 4
     },
     {
       "epoch": 2.5,
       "learning_rate": 5.9999999999999995e-05,
-      "loss": 21.4977,
       "step": 5
     },
     {
       "epoch": 2.5,
-      "eval_loss": 36.794700622558594,
-      "eval_runtime": 5.4096,
-      "eval_samples_per_second": 23.661,
-      "eval_steps_per_second": 0.37,
       "eval_wer": 1.0,
       "step": 5
     },
     {
       "epoch": 3.0,
       "learning_rate": 5.2499999999999995e-05,
-      "loss": 20.1685,
       "step": 6
     },
     {
       "epoch": 3.0,
-      "eval_loss": 35.34020233154297,
-      "eval_runtime": 5.6574,
-      "eval_samples_per_second": 22.625,
-      "eval_steps_per_second": 0.354,
       "eval_wer": 1.0,
       "step": 6
     },
     {
       "epoch": 3.5,
       "learning_rate": 4.4999999999999996e-05,
-      "loss": 19.3566,
       "step": 7
     },
     {
       "epoch": 3.5,
-      "eval_loss": 33.572959899902344,
-      "eval_runtime": 5.6556,
-      "eval_samples_per_second": 22.632,
-      "eval_steps_per_second": 0.354,
       "eval_wer": 1.0,
       "step": 7
     },
     {
       "epoch": 4.0,
       "learning_rate": 3.75e-05,
-      "loss": 15.8992,
       "step": 8
     },
     {
       "epoch": 4.0,
-      "eval_loss": 30.588499069213867,
-      "eval_runtime": 5.3488,
-      "eval_samples_per_second": 23.93,
-      "eval_steps_per_second": 0.374,
       "eval_wer": 1.0,
       "step": 8
     },
     {
       "epoch": 4.5,
       "learning_rate": 2.9999999999999997e-05,
-      "loss": 15.0607,
       "step": 9
     },
     {
       "epoch": 4.5,
-      "eval_loss": 27.82217788696289,
-      "eval_runtime": 5.6203,
-      "eval_samples_per_second": 22.774,
-      "eval_steps_per_second": 0.356,
       "eval_wer": 1.0,
       "step": 9
     },
     {
       "epoch": 5.0,
       "learning_rate": 2.2499999999999998e-05,
-      "loss": 14.8305,
       "step": 10
     },
     {
       "epoch": 5.0,
-      "eval_loss": 25.9698429107666,
-      "eval_runtime": 5.6638,
-      "eval_samples_per_second": 22.599,
-      "eval_steps_per_second": 0.353,
       "eval_wer": 1.0,
       "step": 10
     },
@@ -161,10 +161,10 @@
       "epoch": 5.0,
       "step": 10,
       "total_flos": 1.3476444758728704e+17,
-      "train_loss": 19.56191415786743,
-      "train_runtime": 92.9692,
-      "train_samples_per_second": 6.884,
-      "train_steps_per_second": 0.108
     }
   ],
   "max_steps": 10,

     {
       "epoch": 0.5,
       "learning_rate": 7.5e-05,
+      "loss": 18.7839,
       "step": 1
     },
     {
       "epoch": 0.5,
+      "eval_loss": 32.55470657348633,
+      "eval_runtime": 5.5933,
+      "eval_samples_per_second": 22.884,
+      "eval_steps_per_second": 0.358,
       "eval_wer": 1.0,
       "step": 1
     },
     {
       "epoch": 1.0,
       "learning_rate": 7.5e-05,
+      "loss": 19.4045,
       "step": 2
     },
     {
       "epoch": 1.0,
+      "eval_loss": 32.55470657348633,
+      "eval_runtime": 5.6123,
+      "eval_samples_per_second": 22.807,
+      "eval_steps_per_second": 0.356,
       "eval_wer": 1.0,
       "step": 2
     },
     {
       "epoch": 1.5,
       "learning_rate": 6.75e-05,
+      "loss": 19.6279,
       "step": 3
     },
     {
       "epoch": 1.5,
+      "eval_loss": 31.884950637817383,
+      "eval_runtime": 5.4543,
+      "eval_samples_per_second": 23.468,
+      "eval_steps_per_second": 0.367,
       "eval_wer": 1.0,
       "step": 3
     },
     {
       "epoch": 2.0,
+      "learning_rate": 5.9999999999999995e-05,
+      "loss": 17.7216,
       "step": 4
     },
     {
       "epoch": 2.0,
+      "eval_loss": 31.10820960998535,
+      "eval_runtime": 5.4982,
+      "eval_samples_per_second": 23.28,
+      "eval_steps_per_second": 0.364,
       "eval_wer": 1.0,
       "step": 4
     },
     {
       "epoch": 2.5,
       "learning_rate": 5.9999999999999995e-05,
+      "loss": 17.3103,
       "step": 5
     },
     {
       "epoch": 2.5,
+      "eval_loss": 31.10820960998535,
+      "eval_runtime": 5.9789,
+      "eval_samples_per_second": 21.409,
+      "eval_steps_per_second": 0.335,
       "eval_wer": 1.0,
       "step": 5
     },
     {
       "epoch": 3.0,
       "learning_rate": 5.2499999999999995e-05,
+      "loss": 17.2026,
       "step": 6
     },
     {
       "epoch": 3.0,
+      "eval_loss": 29.966575622558594,
+      "eval_runtime": 5.3861,
+      "eval_samples_per_second": 23.765,
+      "eval_steps_per_second": 0.371,
       "eval_wer": 1.0,
       "step": 6
     },
     {
       "epoch": 3.5,
       "learning_rate": 4.4999999999999996e-05,
+      "loss": 16.7911,
       "step": 7
     },
     {
       "epoch": 3.5,
+      "eval_loss": 28.54442596435547,
+      "eval_runtime": 5.434,
+      "eval_samples_per_second": 23.555,
+      "eval_steps_per_second": 0.368,
       "eval_wer": 1.0,
       "step": 7
     },
     {
       "epoch": 4.0,
       "learning_rate": 3.75e-05,
+      "loss": 13.7364,
       "step": 8
     },
     {
       "epoch": 4.0,
+      "eval_loss": 25.79315185546875,
+      "eval_runtime": 5.4455,
+      "eval_samples_per_second": 23.506,
+      "eval_steps_per_second": 0.367,
       "eval_wer": 1.0,
       "step": 8
     },
     {
       "epoch": 4.5,
       "learning_rate": 2.9999999999999997e-05,
+      "loss": 13.1602,
       "step": 9
     },
     {
       "epoch": 4.5,
+      "eval_loss": 23.46338653564453,
+      "eval_runtime": 5.3714,
+      "eval_samples_per_second": 23.83,
+      "eval_steps_per_second": 0.372,
       "eval_wer": 1.0,
       "step": 9
     },
     {
       "epoch": 5.0,
       "learning_rate": 2.2499999999999998e-05,
+      "loss": 12.9439,
       "step": 10
     },
     {
       "epoch": 5.0,
+      "eval_loss": 21.93878936767578,
+      "eval_runtime": 5.4116,
+      "eval_samples_per_second": 23.653,
+      "eval_steps_per_second": 0.37,
       "eval_wer": 1.0,
       "step": 10
     },
       "epoch": 5.0,
       "step": 10,
       "total_flos": 1.3476444758728704e+17,
+      "train_loss": 16.66825189590454,
+      "train_runtime": 91.9274,
+      "train_samples_per_second": 6.962,
+      "train_steps_per_second": 0.109
     }
   ],
   "max_steps": 10,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:205b839c6738065c780db23902fe5de7ab8a5a6745c332ab60e9b1d434f7d4e6
 size 3055

 version https://git-lfs.github.com/spec/v1
+oid sha256:403aa5248b80fb24657e0dfbc1021fe9ec7e35859e5e11e0d7f4b5c307315ae2
 size 3055