Training in progress, step 400

Browse files

Files changed (7) hide show

added_tokens.json +1 -1
config.json +3 -11
pytorch_model.bin +2 -2
special_tokens_map.json +1 -1
tokenizer_config.json +1 -1
training_args.bin +2 -2
vocab.json +1 -1

added_tokens.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"<s>": ~~140~~, "</s>": ~~141~~}


1	+ {"<s>": 177, "</s>": 178}

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,
@@ -59,20 +59,12 @@
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,
-  "mask_channel_length": 10,
-  "mask_channel_min_space": 1,
-  "mask_channel_other": 0.0,
-  "mask_channel_prob": 0.0,
-  "mask_channel_selection": "static",
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
-  "mask_time_min_space": 1,
-  "mask_time_other": 0.0,
   "mask_time_prob": 0.05,
-  "mask_time_selection": "static",
   "model_type": "wav2vec2",
   "num_adapter_layers": 3,
   "num_attention_heads": 16,
@@ -84,7 +76,7 @@
   "num_hidden_layers": 24,
   "num_negatives": 100,
   "output_hidden_size": 1024,
-  "pad_token_id": 139,
   "proj_codevector_dim": 768,
   "tdnn_dilation": [
     1,
@@ -110,6 +102,6 @@
   "torch_dtype": "float32",
   "transformers_version": "4.16.0.dev0",
   "use_weighted_layer_sum": false,
-  "vocab_size": 142,
   "xvector_output_dim": 512
 }

 {
+  "_name_or_path": "facebook/wav2vec2-xls-r-300m",
   "activation_dropout": 0.0,
   "adapter_kernel_size": 3,
   "adapter_stride": 2,
   "intermediate_size": 4096,
   "layer_norm_eps": 1e-05,
   "layerdrop": 0.0,
   "mask_feature_length": 10,
   "mask_feature_min_masks": 0,
   "mask_feature_prob": 0.0,
   "mask_time_length": 10,
   "mask_time_min_masks": 2,
   "mask_time_prob": 0.05,
   "model_type": "wav2vec2",
   "num_adapter_layers": 3,
   "num_attention_heads": 16,
   "num_hidden_layers": 24,
   "num_negatives": 100,
   "output_hidden_size": 1024,
+  "pad_token_id": 176,
   "proj_codevector_dim": 768,
   "tdnn_dilation": [
     1,
   "torch_dtype": "float32",
   "transformers_version": "4.16.0.dev0",
   "use_weighted_layer_sum": false,
+  "vocab_size": 179,
   "xvector_output_dim": 512
 }

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b0ba4c4cf228305b2995884e4422a72b3beed7dbd09cc6f56feb1f1d4bdfe501
-size 1262505841

 version https://git-lfs.github.com/spec/v1
+oid sha256:88f20f6e89a675b120eba8601af65ec70b8a6b3f20a32bf672b18ee257570478
+size 1262657585

special_tokens_map.json CHANGED Viewed

@@ -1 +1 @@

- {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}~~, {"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}~~]}


1	+ {"bos_token": "<s>", "eos_token": "</s>", "unk_token": "[UNK]", "pad_token": "[PAD]", "additional_special_tokens": [{"content": "<s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}, {"content": "</s>", "single_word": false, "lstrip": false, "rstrip": false, "normalized": true}]}

tokenizer_config.json CHANGED Viewed

	@@ -1 +1 @@
1	- {"unk_token": "[UNK]", "bos_token": "<s>", "eos_token": "</s>", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "\|", "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "../~~robust~~-~~asr~~-italian", "tokenizer_class": "Wav2Vec2CTCTokenizer"}


1	+ {"unk_token": "[UNK]", "bos_token": "<s>", "eos_token": "</s>", "pad_token": "[PAD]", "do_lower_case": false, "word_delimiter_token": "\|", "special_tokens_map_file": null, "tokenizer_file": null, "name_or_path": "../wav2vec2-xls-r-300m-italian", "tokenizer_class": "Wav2Vec2CTCTokenizer"}

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4b79d7de43fc2d318cf10cb0fd3f0a51d6135f75e4220295c3e09ecb71abfc13
-size 3055

 version https://git-lfs.github.com/spec/v1
+oid sha256:417385b9ff1065433b0750b3d81a236a56bc44cd5710c59b255b972eb9b3a94e
+size 3119

vocab.json CHANGED Viewed

@@ -1 +1 @@

- {"<": 1, "=": 2, ">": 3, "[": 4, "]": 5, "_": 6, "`": 7, "a": 8, "b": 9, "c": 10, "d": 11, "e": 12, "f": 13, "g": 14, "h": 15, "i": 16, "j": 17, "k": 18, "l": 19, "m": 20, "n": 21, "o": 22, "p": 23, "q": 24, "r": 25, "s": 26, "t": 27, "u": 28, "v": 29, "w": 30, "x": 31, "y": 32, "z": 33, "~": 34, "¡": 35, "«": 36, "°": 37, "´": 38, "µ": 39, "»": 40, "ß": 41, "à": 42, "á": 43, "ã": 44, "ä": 45, "å": 46, "æ": 47, "è": 48, "é": 49, "ê": 50, "ë": 51, "ì": 52, "í": 53, "î": 54, "ï": 55, "ð": 56, "ñ": 57, "ò": 58, "ó": 59, "ô": 60, "ö": 61, "ø": 62, "ù": 63, "ú": 64, "û": 65, "ü": 66, "þ": 67, "ÿ": 68, "ā": 69, "ć": 70, "č": 71, "đ": 72, "ė": 73, "ę": 74, "ě": 75, "ğ": 76, "ī": 77, "ı": 78, "ľ": 79, "ł": 80, "ń": 81, "ň": 82, "ō": 83, "ő": 84, "œ": 85, "ř": 86, "ś": 87, "ş": 88, "š": 89, "ū": 90, "ź": 91, "ž": 92, "ș": 93, "ț": 94, "ə": 95, "ʹ": 96, "ʻ": 97, "ʼ": 98, "ʾ": 99, "ʿ": 100, "̇": 101, "а": 102, "б": 103, "е": 104, "л": 105, "ц": 106, "ъ": 107, "ё": 108, "љ": 109, "ד": 110, "ה": 111, "ו": 112, "ḥ": 113, "ṛ": 114, "ṣ": 115, "ṭ": 116, "–": 117, "’": 118, "„": 119, "…": 120, "あ": 121, "ア": 122, "カ": 123, "キ": 124, "サ": 125, "ノ": 126, "ン": 127, "ー": 128, "万": 129, "三": 130, "丰": 131, "古": 132, "多": 133, "峰": 134, "張": 135, "旅": 136, "禅": 137, "|": 0, "[UNK]": ~~138~~, "[PAD]": ~~139~~}

+ {"<": 1, "=": 2, ">": 3, "[": 4, "]": 5, "_": 6, "`": 7, "a": 8, "b": 9, "c": 10, "d": 11, "e": 12, "f": 13, "g": 14, "h": 15, "i": 16, "j": 17, "k": 18, "l": 19, "m": 20, "n": 21, "o": 22, "p": 23, "q": 24, "r": 25, "s": 26, "t": 27, "u": 28, "v": 29, "w": 30, "x": 31, "y": 32, "z": 33, "{": 34, "}": 35, "~": 36, "¡": 37, "«": 38, "°": 39, "´": 40, "µ": 41, "º": 42, "»": 43, "ß": 44, "à": 45, "á": 46, "ã": 47, "ä": 48, "å": 49, "æ": 50, "è": 51, "é": 52, "ê": 53, "ë": 54, "ì": 55, "í": 56, "î": 57, "ï": 58, "ð": 59, "ñ": 60, "ò": 61, "ó": 62, "ô": 63, "ö": 64, "ø": 65, "ù": 66, "ú": 67, "û": 68, "ü": 69, "þ": 70, "ÿ": 71, "ā": 72, "ą": 73, "ć": 74, "č": 75, "đ": 76, "ė": 77, "ę": 78, "ě": 79, "ğ": 80, "ħ": 81, "ī": 82, "ı": 83, "ľ": 84, "ł": 85, "ń": 86, "ň": 87, "ō": 88, "ő": 89, "œ": 90, "ř": 91, "ś": 92, "ş": 93, "š": 94, "ū": 95, "ŭ": 96, "ź": 97, "ż": 98, "ž": 99, "ș": 100, "ț": 101, "ə": 102, "ʹ": 103, "ʻ": 104, "ʼ": 105, "ʾ": 106, "ʿ": 107, "ː": 108, "̇": 109, "̨": 110, "а": 111, "б": 112, "д": 113, "е": 114, "л": 115, "н": 116, "о": 117, "с": 118, "у": 119, "ц": 120, "ъ": 121, "ё": 122, "љ": 123, "ң": 124, "ד": 125, "ה": 126, "ו": 127, "ة": 128, "ر": 129, "س": 130, "ص": 131, "غ": 132, "ل": 133, "ي": 134, "ḥ": 135, "ṛ": 136, "ṣ": 137, "ṭ": 138, "ễ": 139, "‑": 140, "–": 141, "—": 142, "’": 143, "„": 144, "…": 145, "′": 146, "☆": 147, "あ": 148, "ア": 149, "カ": 150, "キ": 151, "サ": 152, "ザ": 153, "ノ": 154, "フ": 155, "リ": 156, "ン": 157, "・": 158, "ー": 159, "万": 160, "三": 161, "丰": 162, "古": 163, "多": 164, "家": 165, "峰": 166, "張": 167, "旅": 168, "禅": 169, "ꞌ": 170, "심": 171, "악": 172, "음": 173, "중": 174, "|": 0, "[UNK]": 175, "[PAD]": 176}