yesj1234 commited on Oct 15, 2023

Commit

8b8b1c8

•

1 Parent(s): 03bc364

Upload folder using huggingface_hub

Browse files

Files changed (43) hide show

README.md +110 -0
added_tokens.json +6 -0
all_results.json +14 -0
checkpoint-6750/added_tokens.json +6 -0
checkpoint-6750/config.json +117 -0
checkpoint-6750/optimizer.pt +3 -0
checkpoint-6750/preprocessor_config.json +10 -0
checkpoint-6750/pytorch_model.bin +3 -0
checkpoint-6750/rng_state_0.pth +3 -0
checkpoint-6750/rng_state_1.pth +3 -0
checkpoint-6750/rng_state_2.pth +3 -0
checkpoint-6750/rng_state_3.pth +3 -0
checkpoint-6750/scheduler.pt +3 -0
checkpoint-6750/special_tokens_map.json +10 -0
checkpoint-6750/tokenizer_config.json +56 -0
checkpoint-6750/trainer_state.json +1234 -0
checkpoint-6750/training_args.bin +3 -0
checkpoint-6750/vocab.json +679 -0
checkpoint-6900/added_tokens.json +6 -0
checkpoint-6900/config.json +117 -0
checkpoint-6900/optimizer.pt +3 -0
checkpoint-6900/preprocessor_config.json +10 -0
checkpoint-6900/pytorch_model.bin +3 -0
checkpoint-6900/rng_state_0.pth +3 -0
checkpoint-6900/rng_state_1.pth +3 -0
checkpoint-6900/rng_state_2.pth +3 -0
checkpoint-6900/rng_state_3.pth +3 -0
checkpoint-6900/scheduler.pt +3 -0
checkpoint-6900/special_tokens_map.json +10 -0
checkpoint-6900/tokenizer_config.json +56 -0
checkpoint-6900/trainer_state.json +1261 -0
checkpoint-6900/training_args.bin +3 -0
checkpoint-6900/vocab.json +679 -0
config.json +117 -0
eval_results.json +9 -0
preprocessor_config.json +10 -0
pytorch_model.bin +3 -0
special_tokens_map.json +10 -0
tokenizer_config.json +56 -0
train_results.json +8 -0
trainer_state.json +1270 -0
training_args.bin +3 -0
vocab.json +679 -0

README.md ADDED Viewed

	@@ -0,0 +1,110 @@

+---
+license: apache-2.0
+base_model: facebook/wav2vec2-large-xlsr-53
+tags:
+- automatic-speech-recognition
+- ./sample_speech.py
+- generated_from_trainer
+model-index:
+- name: ja-xlsr
+  results: []
+---
+<!-- This model card has been generated automatically according to the information the Trainer had access to. You
+should probably proofread and complete it, then remove this comment. -->
+# ja-xlsr
+This model is a fine-tuned version of [facebook/wav2vec2-large-xlsr-53](https://huggingface.co/facebook/wav2vec2-large-xlsr-53) on the ./SAMPLE_SPEECH.PY - NA dataset.
+It achieves the following results on the evaluation set:
+- Loss: 2.5952
+- Cer: 0.3240
+## Model description
+More information needed
+## Intended uses & limitations
+More information needed
+## Training and evaluation data
+More information needed
+## Training procedure
+### Training hyperparameters
+The following hyperparameters were used during training:
+- learning_rate: 0.0003
+- train_batch_size: 4
+- eval_batch_size: 4
+- seed: 42
+- distributed_type: multi-GPU
+- num_devices: 4
+- total_train_batch_size: 16
+- total_eval_batch_size: 16
+- optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
+- lr_scheduler_type: linear
+- lr_scheduler_warmup_steps: 50
+- num_epochs: 300
+### Training results
+| Training Loss | Epoch  | Step | Validation Loss | Cer    |
+|:-------------:|:------:|:----:|:---------------:|:------:|
+| 4.9138        | 6.52   | 150  | 4.7965          | 1.0    |
+| 4.7484        | 13.04  | 300  | 4.6081          | 1.0    |
+| 4.5894        | 19.57  | 450  | 4.4697          | 0.9851 |
+| 4.2024        | 26.09  | 600  | 4.0373          | 0.9077 |
+| 2.7314        | 32.61  | 750  | 2.5507          | 0.5341 |
+| 1.2293        | 39.13  | 900  | 2.0146          | 0.4139 |
+| 0.5544        | 45.65  | 1050 | 1.9821          | 0.3556 |
+| 0.3224        | 52.17  | 1200 | 2.0190          | 0.3587 |
+| 0.1951        | 58.7   | 1350 | 2.1229          | 0.3612 |
+| 0.1539        | 65.22  | 1500 | 2.1114          | 0.3470 |
+| 0.1165        | 71.74  | 1650 | 2.2748          | 0.3315 |
+| 0.1119        | 78.26  | 1800 | 2.2391          | 0.3488 |
+| 0.0989        | 84.78  | 1950 | 2.3438          | 0.3383 |
+| 0.0915        | 91.3   | 2100 | 2.1218          | 0.3587 |
+| 0.0721        | 97.83  | 2250 | 2.2428          | 0.3519 |
+| 0.0742        | 104.35 | 2400 | 2.2293          | 0.3364 |
+| 0.0629        | 110.87 | 2550 | 2.2878          | 0.3371 |
+| 0.0495        | 117.39 | 2700 | 2.2672          | 0.3408 |
+| 0.0466        | 123.91 | 2850 | 2.2532          | 0.3525 |
+| 0.0424        | 130.43 | 3000 | 2.2844          | 0.3259 |
+| 0.0446        | 136.96 | 3150 | 2.2763          | 0.3253 |
+| 0.0411        | 143.48 | 3300 | 2.3011          | 0.3302 |
+| 0.0419        | 150.0  | 3450 | 2.3201          | 0.3420 |
+| 0.0333        | 156.52 | 3600 | 2.3644          | 0.3439 |
+| 0.0384        | 163.04 | 3750 | 2.3685          | 0.3532 |
+| 0.0367        | 169.57 | 3900 | 2.3970          | 0.3470 |
+| 0.0307        | 176.09 | 4050 | 2.3530          | 0.3309 |
+| 0.0328        | 182.61 | 4200 | 2.3415          | 0.3315 |
+| 0.0271        | 189.13 | 4350 | 2.4165          | 0.3309 |
+| 0.0213        | 195.65 | 4500 | 2.4478          | 0.3451 |
+| 0.0193        | 202.17 | 4650 | 2.5241          | 0.3556 |
+| 0.0204        | 208.7  | 4800 | 2.5700          | 0.3463 |
+| 0.0185        | 215.22 | 4950 | 2.5837          | 0.3178 |
+| 0.0161        | 221.74 | 5100 | 2.5139          | 0.3377 |
+| 0.0167        | 228.26 | 5250 | 2.5288          | 0.3352 |
+| 0.0148        | 234.78 | 5400 | 2.5741          | 0.3389 |
+| 0.0141        | 241.3  | 5550 | 2.5174          | 0.3389 |
+| 0.0122        | 247.83 | 5700 | 2.5573          | 0.3352 |
+| 0.0115        | 254.35 | 5850 | 2.5790          | 0.3296 |
+| 0.0141        | 260.87 | 6000 | 2.5774          | 0.3203 |
+| 0.0123        | 267.39 | 6150 | 2.6147          | 0.3309 |
+| 0.0214        | 273.91 | 6300 | 2.6202          | 0.3302 |
+| 0.0107        | 280.43 | 6450 | 2.6264          | 0.3234 |
+| 0.0086        | 286.96 | 6600 | 2.6075          | 0.3216 |
+| 0.0106        | 293.48 | 6750 | 2.5960          | 0.3247 |
+| 0.0085        | 300.0  | 6900 | 2.5952          | 0.3240 |
+### Framework versions
+- Transformers 4.34.0
+- Pytorch 2.1.0+cu121
+- Datasets 2.14.5
+- Tokenizers 0.14.1

added_tokens.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "</s>": 678,
+  "<s>": 677,
+  "[PAD]": 676,
+  "[UNK]": 675
+}

all_results.json ADDED Viewed

	@@ -0,0 +1,14 @@

+{
+    "epoch": 300.0,
+    "eval_cer": 0.32403965303593557,
+    "eval_loss": 2.5951595306396484,
+    "eval_runtime": 1.15,
+    "eval_samples": 45,
+    "eval_samples_per_second": 39.131,
+    "eval_steps_per_second": 2.609,
+    "train_loss": 0.8083851718038753,
+    "train_runtime": 4592.71,
+    "train_samples": 359,
+    "train_samples_per_second": 23.45,
+    "train_steps_per_second": 1.502
+}

checkpoint-6750/added_tokens.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "</s>": 678,
+  "<s>": 677,
+  "[PAD]": 676,
+  "[UNK]": 675
+}

checkpoint-6750/config.json ADDED Viewed

	@@ -0,0 +1,117 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.05,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.05,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.05,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 676,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.34.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 679,
+  "xvector_output_dim": 512
+}

checkpoint-6750/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c8daec975379a76bfdf399bf91e3a3bbd6c15f5ba6d356d3ce5e603c47d25404
+size 2495727542

checkpoint-6750/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-6750/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b17410927892415a7457024d513c3b2a1c577f6e7069f28e38903bc839265581
+size 1264686250

checkpoint-6750/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9463127f1583b222ce5d7b9ac8b3b7a262658dbfc27fe01496ed3b356881b274
+size 15024

checkpoint-6750/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:712146ec2b46d8aa5a69d7d6c52e8f3df3aeda3960e40b713509a3f29fd0b8c7
+size 15088

checkpoint-6750/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:fe1c33fa4f9b3268e0fa630c5389145b247b3ef88df73b2a672b869dbe1f14f2
+size 15024

checkpoint-6750/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ae6bc567733fbdec5df2244a91a8731abd7cca88032ec6e1be21ba8eadc79e86
+size 15024

checkpoint-6750/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a15bc5149d23b4fbf0dec535f6501039fd33564ee898ebce9b8b537524a2f244
+size 1064

checkpoint-6750/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "additional_special_tokens": [
+    "<s>",
+    "</s>"
+  ],
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

checkpoint-6750/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "675": {
+      "content": "[UNK]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "676": {
+      "content": "[PAD]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "677": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "678": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<s>",
+    "</s>"
+  ],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "config": null,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "tokenizer_file": null,
+  "tokenizer_type": "wav2vec2",
+  "trust_remote_code": false,
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

checkpoint-6750/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1234 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 293.4782608695652,
+  "eval_steps": 150,
+  "global_step": 6750,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 2.17,
+      "learning_rate": 0.0003,
+      "loss": 35.2887,
+      "step": 50
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 0.00029781021897810217,
+      "loss": 5.9569,
+      "step": 100
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 0.00029562043795620436,
+      "loss": 4.9138,
+      "step": 150
+    },
+    {
+      "epoch": 6.52,
+      "eval_cer": 1.0,
+      "eval_loss": 4.7965407371521,
+      "eval_runtime": 1.256,
+      "eval_samples_per_second": 35.828,
+      "eval_steps_per_second": 2.389,
+      "step": 150
+    },
+    {
+      "epoch": 8.7,
+      "learning_rate": 0.00029343065693430656,
+      "loss": 4.887,
+      "step": 200
+    },
+    {
+      "epoch": 10.87,
+      "learning_rate": 0.00029124087591240875,
+      "loss": 4.8447,
+      "step": 250
+    },
+    {
+      "epoch": 13.04,
+      "learning_rate": 0.00028905109489051094,
+      "loss": 4.7484,
+      "step": 300
+    },
+    {
+      "epoch": 13.04,
+      "eval_cer": 1.0,
+      "eval_loss": 4.608075141906738,
+      "eval_runtime": 1.2451,
+      "eval_samples_per_second": 36.142,
+      "eval_steps_per_second": 2.409,
+      "step": 300
+    },
+    {
+      "epoch": 15.22,
+      "learning_rate": 0.00028686131386861314,
+      "loss": 4.6529,
+      "step": 350
+    },
+    {
+      "epoch": 17.39,
+      "learning_rate": 0.0002846715328467153,
+      "loss": 4.6373,
+      "step": 400
+    },
+    {
+      "epoch": 19.57,
+      "learning_rate": 0.00028248175182481747,
+      "loss": 4.5894,
+      "step": 450
+    },
+    {
+      "epoch": 19.57,
+      "eval_cer": 0.9851301115241635,
+      "eval_loss": 4.469708442687988,
+      "eval_runtime": 1.2325,
+      "eval_samples_per_second": 36.51,
+      "eval_steps_per_second": 2.434,
+      "step": 450
+    },
+    {
+      "epoch": 21.74,
+      "learning_rate": 0.00028029197080291966,
+      "loss": 4.5045,
+      "step": 500
+    },
+    {
+      "epoch": 23.91,
+      "learning_rate": 0.00027810218978102186,
+      "loss": 4.4076,
+      "step": 550
+    },
+    {
+      "epoch": 26.09,
+      "learning_rate": 0.00027591240875912405,
+      "loss": 4.2024,
+      "step": 600
+    },
+    {
+      "epoch": 26.09,
+      "eval_cer": 0.9076827757125155,
+      "eval_loss": 4.037315845489502,
+      "eval_runtime": 1.2357,
+      "eval_samples_per_second": 36.417,
+      "eval_steps_per_second": 2.428,
+      "step": 600
+    },
+    {
+      "epoch": 28.26,
+      "learning_rate": 0.00027372262773722625,
+      "loss": 3.8743,
+      "step": 650
+    },
+    {
+      "epoch": 30.43,
+      "learning_rate": 0.00027153284671532844,
+      "loss": 3.3488,
+      "step": 700
+    },
+    {
+      "epoch": 32.61,
+      "learning_rate": 0.00026934306569343063,
+      "loss": 2.7314,
+      "step": 750
+    },
+    {
+      "epoch": 32.61,
+      "eval_cer": 0.5340768277571252,
+      "eval_loss": 2.5507473945617676,
+      "eval_runtime": 1.2278,
+      "eval_samples_per_second": 36.651,
+      "eval_steps_per_second": 2.443,
+      "step": 750
+    },
+    {
+      "epoch": 34.78,
+      "learning_rate": 0.00026715328467153283,
+      "loss": 2.1968,
+      "step": 800
+    },
+    {
+      "epoch": 36.96,
+      "learning_rate": 0.000264963503649635,
+      "loss": 1.6522,
+      "step": 850
+    },
+    {
+      "epoch": 39.13,
+      "learning_rate": 0.0002627737226277372,
+      "loss": 1.2293,
+      "step": 900
+    },
+    {
+      "epoch": 39.13,
+      "eval_cer": 0.4138785625774473,
+      "eval_loss": 2.01461124420166,
+      "eval_runtime": 1.2246,
+      "eval_samples_per_second": 36.746,
+      "eval_steps_per_second": 2.45,
+      "step": 900
+    },
+    {
+      "epoch": 41.3,
+      "learning_rate": 0.0002605839416058394,
+      "loss": 0.9292,
+      "step": 950
+    },
+    {
+      "epoch": 43.48,
+      "learning_rate": 0.00025839416058394155,
+      "loss": 0.7208,
+      "step": 1000
+    },
+    {
+      "epoch": 45.65,
+      "learning_rate": 0.00025620437956204374,
+      "loss": 0.5544,
+      "step": 1050
+    },
+    {
+      "epoch": 45.65,
+      "eval_cer": 0.355638166047088,
+      "eval_loss": 1.9821244478225708,
+      "eval_runtime": 1.2073,
+      "eval_samples_per_second": 37.275,
+      "eval_steps_per_second": 2.485,
+      "step": 1050
+    },
+    {
+      "epoch": 47.83,
+      "learning_rate": 0.00025401459854014594,
+      "loss": 0.4757,
+      "step": 1100
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 0.00025182481751824813,
+      "loss": 0.3895,
+      "step": 1150
+    },
+    {
+      "epoch": 52.17,
+      "learning_rate": 0.0002496350364963503,
+      "loss": 0.3224,
+      "step": 1200
+    },
+    {
+      "epoch": 52.17,
+      "eval_cer": 0.3587360594795539,
+      "eval_loss": 2.0189881324768066,
+      "eval_runtime": 1.1983,
+      "eval_samples_per_second": 37.554,
+      "eval_steps_per_second": 2.504,
+      "step": 1200
+    },
+    {
+      "epoch": 54.35,
+      "learning_rate": 0.0002474452554744525,
+      "loss": 0.279,
+      "step": 1250
+    },
+    {
+      "epoch": 56.52,
+      "learning_rate": 0.0002452554744525547,
+      "loss": 0.2285,
+      "step": 1300
+    },
+    {
+      "epoch": 58.7,
+      "learning_rate": 0.0002430656934306569,
+      "loss": 0.1951,
+      "step": 1350
+    },
+    {
+      "epoch": 58.7,
+      "eval_cer": 0.36121437422552666,
+      "eval_loss": 2.1229116916656494,
+      "eval_runtime": 1.2603,
+      "eval_samples_per_second": 35.706,
+      "eval_steps_per_second": 2.38,
+      "step": 1350
+    },
+    {
+      "epoch": 60.87,
+      "learning_rate": 0.0002408759124087591,
+      "loss": 0.1964,
+      "step": 1400
+    },
+    {
+      "epoch": 63.04,
+      "learning_rate": 0.0002386861313868613,
+      "loss": 0.1622,
+      "step": 1450
+    },
+    {
+      "epoch": 65.22,
+      "learning_rate": 0.0002364963503649635,
+      "loss": 0.1539,
+      "step": 1500
+    },
+    {
+      "epoch": 65.22,
+      "eval_cer": 0.3469640644361834,
+      "eval_loss": 2.111368179321289,
+      "eval_runtime": 1.2194,
+      "eval_samples_per_second": 36.903,
+      "eval_steps_per_second": 2.46,
+      "step": 1500
+    },
+    {
+      "epoch": 67.39,
+      "learning_rate": 0.00023430656934306568,
+      "loss": 0.1492,
+      "step": 1550
+    },
+    {
+      "epoch": 69.57,
+      "learning_rate": 0.00023211678832116788,
+      "loss": 0.1404,
+      "step": 1600
+    },
+    {
+      "epoch": 71.74,
+      "learning_rate": 0.00022992700729927004,
+      "loss": 0.1165,
+      "step": 1650
+    },
+    {
+      "epoch": 71.74,
+      "eval_cer": 0.33147459727385375,
+      "eval_loss": 2.274796485900879,
+      "eval_runtime": 1.1874,
+      "eval_samples_per_second": 37.898,
+      "eval_steps_per_second": 2.527,
+      "step": 1650
+    },
+    {
+      "epoch": 73.91,
+      "learning_rate": 0.00022773722627737224,
+      "loss": 0.1268,
+      "step": 1700
+    },
+    {
+      "epoch": 76.09,
+      "learning_rate": 0.00022554744525547443,
+      "loss": 0.1186,
+      "step": 1750
+    },
+    {
+      "epoch": 78.26,
+      "learning_rate": 0.00022335766423357663,
+      "loss": 0.1119,
+      "step": 1800
+    },
+    {
+      "epoch": 78.26,
+      "eval_cer": 0.34882280049566294,
+      "eval_loss": 2.2390518188476562,
+      "eval_runtime": 1.3465,
+      "eval_samples_per_second": 33.42,
+      "eval_steps_per_second": 2.228,
+      "step": 1800
+    },
+    {
+      "epoch": 80.43,
+      "learning_rate": 0.00022116788321167882,
+      "loss": 0.0988,
+      "step": 1850
+    },
+    {
+      "epoch": 82.61,
+      "learning_rate": 0.00021897810218978101,
+      "loss": 0.112,
+      "step": 1900
+    },
+    {
+      "epoch": 84.78,
+      "learning_rate": 0.0002167883211678832,
+      "loss": 0.0989,
+      "step": 1950
+    },
+    {
+      "epoch": 84.78,
+      "eval_cer": 0.3382899628252788,
+      "eval_loss": 2.343754529953003,
+      "eval_runtime": 1.2055,
+      "eval_samples_per_second": 37.329,
+      "eval_steps_per_second": 2.489,
+      "step": 1950
+    },
+    {
+      "epoch": 86.96,
+      "learning_rate": 0.00021459854014598537,
+      "loss": 0.097,
+      "step": 2000
+    },
+    {
+      "epoch": 89.13,
+      "learning_rate": 0.00021240875912408757,
+      "loss": 0.0854,
+      "step": 2050
+    },
+    {
+      "epoch": 91.3,
+      "learning_rate": 0.00021021897810218976,
+      "loss": 0.0915,
+      "step": 2100
+    },
+    {
+      "epoch": 91.3,
+      "eval_cer": 0.3587360594795539,
+      "eval_loss": 2.121840000152588,
+      "eval_runtime": 1.2037,
+      "eval_samples_per_second": 37.386,
+      "eval_steps_per_second": 2.492,
+      "step": 2100
+    },
+    {
+      "epoch": 93.48,
+      "learning_rate": 0.00020802919708029196,
+      "loss": 0.078,
+      "step": 2150
+    },
+    {
+      "epoch": 95.65,
+      "learning_rate": 0.00020583941605839415,
+      "loss": 0.0857,
+      "step": 2200
+    },
+    {
+      "epoch": 97.83,
+      "learning_rate": 0.00020364963503649632,
+      "loss": 0.0721,
+      "step": 2250
+    },
+    {
+      "epoch": 97.83,
+      "eval_cer": 0.35192069392812886,
+      "eval_loss": 2.242812395095825,
+      "eval_runtime": 1.1964,
+      "eval_samples_per_second": 37.614,
+      "eval_steps_per_second": 2.508,
+      "step": 2250
+    },
+    {
+      "epoch": 100.0,
+      "learning_rate": 0.0002014598540145985,
+      "loss": 0.0799,
+      "step": 2300
+    },
+    {
+      "epoch": 102.17,
+      "learning_rate": 0.0001992700729927007,
+      "loss": 0.0798,
+      "step": 2350
+    },
+    {
+      "epoch": 104.35,
+      "learning_rate": 0.0001970802919708029,
+      "loss": 0.0742,
+      "step": 2400
+    },
+    {
+      "epoch": 104.35,
+      "eval_cer": 0.33643122676579923,
+      "eval_loss": 2.229339838027954,
+      "eval_runtime": 1.2156,
+      "eval_samples_per_second": 37.019,
+      "eval_steps_per_second": 2.468,
+      "step": 2400
+    },
+    {
+      "epoch": 106.52,
+      "learning_rate": 0.0001948905109489051,
+      "loss": 0.0692,
+      "step": 2450
+    },
+    {
+      "epoch": 108.7,
+      "learning_rate": 0.0001927007299270073,
+      "loss": 0.0664,
+      "step": 2500
+    },
+    {
+      "epoch": 110.87,
+      "learning_rate": 0.00019051094890510948,
+      "loss": 0.0629,
+      "step": 2550
+    },
+    {
+      "epoch": 110.87,
+      "eval_cer": 0.33705080545229243,
+      "eval_loss": 2.2878150939941406,
+      "eval_runtime": 1.2044,
+      "eval_samples_per_second": 37.364,
+      "eval_steps_per_second": 2.491,
+      "step": 2550
+    },
+    {
+      "epoch": 113.04,
+      "learning_rate": 0.00018832116788321167,
+      "loss": 0.0619,
+      "step": 2600
+    },
+    {
+      "epoch": 115.22,
+      "learning_rate": 0.00018613138686131387,
+      "loss": 0.0582,
+      "step": 2650
+    },
+    {
+      "epoch": 117.39,
+      "learning_rate": 0.00018394160583941606,
+      "loss": 0.0495,
+      "step": 2700
+    },
+    {
+      "epoch": 117.39,
+      "eval_cer": 0.34076827757125155,
+      "eval_loss": 2.2671637535095215,
+      "eval_runtime": 1.2039,
+      "eval_samples_per_second": 37.379,
+      "eval_steps_per_second": 2.492,
+      "step": 2700
+    },
+    {
+      "epoch": 119.57,
+      "learning_rate": 0.00018175182481751826,
+      "loss": 0.0614,
+      "step": 2750
+    },
+    {
+      "epoch": 121.74,
+      "learning_rate": 0.00017956204379562042,
+      "loss": 0.0565,
+      "step": 2800
+    },
+    {
+      "epoch": 123.91,
+      "learning_rate": 0.00017737226277372262,
+      "loss": 0.0466,
+      "step": 2850
+    },
+    {
+      "epoch": 123.91,
+      "eval_cer": 0.35254027261462206,
+      "eval_loss": 2.2532107830047607,
+      "eval_runtime": 1.3563,
+      "eval_samples_per_second": 33.179,
+      "eval_steps_per_second": 2.212,
+      "step": 2850
+    },
+    {
+      "epoch": 126.09,
+      "learning_rate": 0.00017518248175182478,
+      "loss": 0.0465,
+      "step": 2900
+    },
+    {
+      "epoch": 128.26,
+      "learning_rate": 0.00017299270072992698,
+      "loss": 0.0496,
+      "step": 2950
+    },
+    {
+      "epoch": 130.43,
+      "learning_rate": 0.00017080291970802917,
+      "loss": 0.0424,
+      "step": 3000
+    },
+    {
+      "epoch": 130.43,
+      "eval_cer": 0.32589838909541513,
+      "eval_loss": 2.2844393253326416,
+      "eval_runtime": 1.2006,
+      "eval_samples_per_second": 37.48,
+      "eval_steps_per_second": 2.499,
+      "step": 3000
+    },
+    {
+      "epoch": 132.61,
+      "learning_rate": 0.00016861313868613137,
+      "loss": 0.0483,
+      "step": 3050
+    },
+    {
+      "epoch": 134.78,
+      "learning_rate": 0.00016642335766423356,
+      "loss": 0.0488,
+      "step": 3100
+    },
+    {
+      "epoch": 136.96,
+      "learning_rate": 0.00016423357664233575,
+      "loss": 0.0446,
+      "step": 3150
+    },
+    {
+      "epoch": 136.96,
+      "eval_cer": 0.3252788104089219,
+      "eval_loss": 2.2763445377349854,
+      "eval_runtime": 1.2043,
+      "eval_samples_per_second": 37.368,
+      "eval_steps_per_second": 2.491,
+      "step": 3150
+    },
+    {
+      "epoch": 139.13,
+      "learning_rate": 0.00016204379562043795,
+      "loss": 0.0424,
+      "step": 3200
+    },
+    {
+      "epoch": 141.3,
+      "learning_rate": 0.00015985401459854014,
+      "loss": 0.0429,
+      "step": 3250
+    },
+    {
+      "epoch": 143.48,
+      "learning_rate": 0.00015766423357664234,
+      "loss": 0.0411,
+      "step": 3300
+    },
+    {
+      "epoch": 143.48,
+      "eval_cer": 0.3302354399008674,
+      "eval_loss": 2.301079034805298,
+      "eval_runtime": 1.345,
+      "eval_samples_per_second": 33.458,
+      "eval_steps_per_second": 2.231,
+      "step": 3300
+    },
+    {
+      "epoch": 145.65,
+      "learning_rate": 0.00015547445255474453,
+      "loss": 0.0392,
+      "step": 3350
+    },
+    {
+      "epoch": 147.83,
+      "learning_rate": 0.00015328467153284672,
+      "loss": 0.0426,
+      "step": 3400
+    },
+    {
+      "epoch": 150.0,
+      "learning_rate": 0.00015109489051094892,
+      "loss": 0.0419,
+      "step": 3450
+    },
+    {
+      "epoch": 150.0,
+      "eval_cer": 0.3420074349442379,
+      "eval_loss": 2.320059299468994,
+      "eval_runtime": 1.2411,
+      "eval_samples_per_second": 36.259,
+      "eval_steps_per_second": 2.417,
+      "step": 3450
+    },
+    {
+      "epoch": 152.17,
+      "learning_rate": 0.00014890510948905108,
+      "loss": 0.0386,
+      "step": 3500
+    },
+    {
+      "epoch": 154.35,
+      "learning_rate": 0.00014671532846715328,
+      "loss": 0.0402,
+      "step": 3550
+    },
+    {
+      "epoch": 156.52,
+      "learning_rate": 0.00014452554744525547,
+      "loss": 0.0333,
+      "step": 3600
+    },
+    {
+      "epoch": 156.52,
+      "eval_cer": 0.34386617100371747,
+      "eval_loss": 2.364445209503174,
+      "eval_runtime": 1.2337,
+      "eval_samples_per_second": 36.475,
+      "eval_steps_per_second": 2.432,
+      "step": 3600
+    },
+    {
+      "epoch": 158.7,
+      "learning_rate": 0.00014233576642335764,
+      "loss": 0.0434,
+      "step": 3650
+    },
+    {
+      "epoch": 160.87,
+      "learning_rate": 0.00014014598540145983,
+      "loss": 0.0393,
+      "step": 3700
+    },
+    {
+      "epoch": 163.04,
+      "learning_rate": 0.00013795620437956203,
+      "loss": 0.0384,
+      "step": 3750
+    },
+    {
+      "epoch": 163.04,
+      "eval_cer": 0.35315985130111527,
+      "eval_loss": 2.3685200214385986,
+      "eval_runtime": 1.2136,
+      "eval_samples_per_second": 37.081,
+      "eval_steps_per_second": 2.472,
+      "step": 3750
+    },
+    {
+      "epoch": 165.22,
+      "learning_rate": 0.00013576642335766422,
+      "loss": 0.0324,
+      "step": 3800
+    },
+    {
+      "epoch": 167.39,
+      "learning_rate": 0.00013357664233576641,
+      "loss": 0.0438,
+      "step": 3850
+    },
+    {
+      "epoch": 169.57,
+      "learning_rate": 0.0001313868613138686,
+      "loss": 0.0367,
+      "step": 3900
+    },
+    {
+      "epoch": 169.57,
+      "eval_cer": 0.3469640644361834,
+      "eval_loss": 2.397036552429199,
+      "eval_runtime": 1.2259,
+      "eval_samples_per_second": 36.708,
+      "eval_steps_per_second": 2.447,
+      "step": 3900
+    },
+    {
+      "epoch": 171.74,
+      "learning_rate": 0.00012919708029197077,
+      "loss": 0.0336,
+      "step": 3950
+    },
+    {
+      "epoch": 173.91,
+      "learning_rate": 0.00012700729927007297,
+      "loss": 0.037,
+      "step": 4000
+    },
+    {
+      "epoch": 176.09,
+      "learning_rate": 0.00012481751824817516,
+      "loss": 0.0307,
+      "step": 4050
+    },
+    {
+      "epoch": 176.09,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.3530125617980957,
+      "eval_runtime": 1.2484,
+      "eval_samples_per_second": 36.047,
+      "eval_steps_per_second": 2.403,
+      "step": 4050
+    },
+    {
+      "epoch": 178.26,
+      "learning_rate": 0.00012262773722627736,
+      "loss": 0.0284,
+      "step": 4100
+    },
+    {
+      "epoch": 180.43,
+      "learning_rate": 0.00012043795620437955,
+      "loss": 0.0233,
+      "step": 4150
+    },
+    {
+      "epoch": 182.61,
+      "learning_rate": 0.00011824817518248174,
+      "loss": 0.0328,
+      "step": 4200
+    },
+    {
+      "epoch": 182.61,
+      "eval_cer": 0.33147459727385375,
+      "eval_loss": 2.3414556980133057,
+      "eval_runtime": 1.2281,
+      "eval_samples_per_second": 36.64,
+      "eval_steps_per_second": 2.443,
+      "step": 4200
+    },
+    {
+      "epoch": 184.78,
+      "learning_rate": 0.00011605839416058394,
+      "loss": 0.0285,
+      "step": 4250
+    },
+    {
+      "epoch": 186.96,
+      "learning_rate": 0.00011386861313868612,
+      "loss": 0.0222,
+      "step": 4300
+    },
+    {
+      "epoch": 189.13,
+      "learning_rate": 0.00011167883211678831,
+      "loss": 0.0271,
+      "step": 4350
+    },
+    {
+      "epoch": 189.13,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.4165024757385254,
+      "eval_runtime": 1.1891,
+      "eval_samples_per_second": 37.844,
+      "eval_steps_per_second": 2.523,
+      "step": 4350
+    },
+    {
+      "epoch": 191.3,
+      "learning_rate": 0.00010948905109489051,
+      "loss": 0.0307,
+      "step": 4400
+    },
+    {
+      "epoch": 193.48,
+      "learning_rate": 0.00010729927007299269,
+      "loss": 0.023,
+      "step": 4450
+    },
+    {
+      "epoch": 195.65,
+      "learning_rate": 0.00010510948905109488,
+      "loss": 0.0213,
+      "step": 4500
+    },
+    {
+      "epoch": 195.65,
+      "eval_cer": 0.3451053283767038,
+      "eval_loss": 2.447828769683838,
+      "eval_runtime": 1.1406,
+      "eval_samples_per_second": 39.452,
+      "eval_steps_per_second": 2.63,
+      "step": 4500
+    },
+    {
+      "epoch": 197.83,
+      "learning_rate": 0.00010291970802919708,
+      "loss": 0.021,
+      "step": 4550
+    },
+    {
+      "epoch": 200.0,
+      "learning_rate": 0.00010072992700729926,
+      "loss": 0.0246,
+      "step": 4600
+    },
+    {
+      "epoch": 202.17,
+      "learning_rate": 9.854014598540145e-05,
+      "loss": 0.0193,
+      "step": 4650
+    },
+    {
+      "epoch": 202.17,
+      "eval_cer": 0.355638166047088,
+      "eval_loss": 2.524061918258667,
+      "eval_runtime": 1.203,
+      "eval_samples_per_second": 37.406,
+      "eval_steps_per_second": 2.494,
+      "step": 4650
+    },
+    {
+      "epoch": 204.35,
+      "learning_rate": 9.635036496350364e-05,
+      "loss": 0.0223,
+      "step": 4700
+    },
+    {
+      "epoch": 206.52,
+      "learning_rate": 9.416058394160584e-05,
+      "loss": 0.0223,
+      "step": 4750
+    },
+    {
+      "epoch": 208.7,
+      "learning_rate": 9.197080291970803e-05,
+      "loss": 0.0204,
+      "step": 4800
+    },
+    {
+      "epoch": 208.7,
+      "eval_cer": 0.34634448574969023,
+      "eval_loss": 2.570009708404541,
+      "eval_runtime": 1.2664,
+      "eval_samples_per_second": 35.533,
+      "eval_steps_per_second": 2.369,
+      "step": 4800
+    },
+    {
+      "epoch": 210.87,
+      "learning_rate": 8.978102189781021e-05,
+      "loss": 0.0202,
+      "step": 4850
+    },
+    {
+      "epoch": 213.04,
+      "learning_rate": 8.759124087591239e-05,
+      "loss": 0.0193,
+      "step": 4900
+    },
+    {
+      "epoch": 215.22,
+      "learning_rate": 8.540145985401459e-05,
+      "loss": 0.0185,
+      "step": 4950
+    },
+    {
+      "epoch": 215.22,
+      "eval_cer": 0.31784386617100374,
+      "eval_loss": 2.583724021911621,
+      "eval_runtime": 1.2549,
+      "eval_samples_per_second": 35.859,
+      "eval_steps_per_second": 2.391,
+      "step": 4950
+    },
+    {
+      "epoch": 217.39,
+      "learning_rate": 8.321167883211678e-05,
+      "loss": 0.0191,
+      "step": 5000
+    },
+    {
+      "epoch": 219.57,
+      "learning_rate": 8.102189781021897e-05,
+      "loss": 0.0169,
+      "step": 5050
+    },
+    {
+      "epoch": 221.74,
+      "learning_rate": 7.883211678832117e-05,
+      "loss": 0.0161,
+      "step": 5100
+    },
+    {
+      "epoch": 221.74,
+      "eval_cer": 0.33767038413878564,
+      "eval_loss": 2.513859987258911,
+      "eval_runtime": 1.2515,
+      "eval_samples_per_second": 35.958,
+      "eval_steps_per_second": 2.397,
+      "step": 5100
+    },
+    {
+      "epoch": 223.91,
+      "learning_rate": 7.664233576642336e-05,
+      "loss": 0.0183,
+      "step": 5150
+    },
+    {
+      "epoch": 226.09,
+      "learning_rate": 7.445255474452554e-05,
+      "loss": 0.0228,
+      "step": 5200
+    },
+    {
+      "epoch": 228.26,
+      "learning_rate": 7.226277372262774e-05,
+      "loss": 0.0167,
+      "step": 5250
+    },
+    {
+      "epoch": 228.26,
+      "eval_cer": 0.3351920693928129,
+      "eval_loss": 2.5287766456604004,
+      "eval_runtime": 1.2044,
+      "eval_samples_per_second": 37.363,
+      "eval_steps_per_second": 2.491,
+      "step": 5250
+    },
+    {
+      "epoch": 230.43,
+      "learning_rate": 7.007299270072992e-05,
+      "loss": 0.0181,
+      "step": 5300
+    },
+    {
+      "epoch": 232.61,
+      "learning_rate": 6.788321167883211e-05,
+      "loss": 0.0144,
+      "step": 5350
+    },
+    {
+      "epoch": 234.78,
+      "learning_rate": 6.56934306569343e-05,
+      "loss": 0.0148,
+      "step": 5400
+    },
+    {
+      "epoch": 234.78,
+      "eval_cer": 0.338909541511772,
+      "eval_loss": 2.574066400527954,
+      "eval_runtime": 1.2534,
+      "eval_samples_per_second": 35.904,
+      "eval_steps_per_second": 2.394,
+      "step": 5400
+    },
+    {
+      "epoch": 236.96,
+      "learning_rate": 6.350364963503648e-05,
+      "loss": 0.0143,
+      "step": 5450
+    },
+    {
+      "epoch": 239.13,
+      "learning_rate": 6.131386861313868e-05,
+      "loss": 0.0197,
+      "step": 5500
+    },
+    {
+      "epoch": 241.3,
+      "learning_rate": 5.912408759124087e-05,
+      "loss": 0.0141,
+      "step": 5550
+    },
+    {
+      "epoch": 241.3,
+      "eval_cer": 0.338909541511772,
+      "eval_loss": 2.5173895359039307,
+      "eval_runtime": 1.1989,
+      "eval_samples_per_second": 37.536,
+      "eval_steps_per_second": 2.502,
+      "step": 5550
+    },
+    {
+      "epoch": 243.48,
+      "learning_rate": 5.693430656934306e-05,
+      "loss": 0.0165,
+      "step": 5600
+    },
+    {
+      "epoch": 245.65,
+      "learning_rate": 5.4744525547445253e-05,
+      "loss": 0.0127,
+      "step": 5650
+    },
+    {
+      "epoch": 247.83,
+      "learning_rate": 5.255474452554744e-05,
+      "loss": 0.0122,
+      "step": 5700
+    },
+    {
+      "epoch": 247.83,
+      "eval_cer": 0.3351920693928129,
+      "eval_loss": 2.5573315620422363,
+      "eval_runtime": 1.2363,
+      "eval_samples_per_second": 36.4,
+      "eval_steps_per_second": 2.427,
+      "step": 5700
+    },
+    {
+      "epoch": 250.0,
+      "learning_rate": 5.036496350364963e-05,
+      "loss": 0.0135,
+      "step": 5750
+    },
+    {
+      "epoch": 252.17,
+      "learning_rate": 4.817518248175182e-05,
+      "loss": 0.0116,
+      "step": 5800
+    },
+    {
+      "epoch": 254.35,
+      "learning_rate": 4.5985401459854016e-05,
+      "loss": 0.0115,
+      "step": 5850
+    },
+    {
+      "epoch": 254.35,
+      "eval_cer": 0.32961586121437425,
+      "eval_loss": 2.579023838043213,
+      "eval_runtime": 1.2327,
+      "eval_samples_per_second": 36.506,
+      "eval_steps_per_second": 2.434,
+      "step": 5850
+    },
+    {
+      "epoch": 256.52,
+      "learning_rate": 4.3795620437956196e-05,
+      "loss": 0.0141,
+      "step": 5900
+    },
+    {
+      "epoch": 258.7,
+      "learning_rate": 4.160583941605839e-05,
+      "loss": 0.0143,
+      "step": 5950
+    },
+    {
+      "epoch": 260.87,
+      "learning_rate": 3.9416058394160584e-05,
+      "loss": 0.0141,
+      "step": 6000
+    },
+    {
+      "epoch": 260.87,
+      "eval_cer": 0.32032218091697645,
+      "eval_loss": 2.577375888824463,
+      "eval_runtime": 1.2321,
+      "eval_samples_per_second": 36.524,
+      "eval_steps_per_second": 2.435,
+      "step": 6000
+    },
+    {
+      "epoch": 263.04,
+      "learning_rate": 3.722627737226277e-05,
+      "loss": 0.0116,
+      "step": 6050
+    },
+    {
+      "epoch": 265.22,
+      "learning_rate": 3.503649635036496e-05,
+      "loss": 0.0101,
+      "step": 6100
+    },
+    {
+      "epoch": 267.39,
+      "learning_rate": 3.284671532846715e-05,
+      "loss": 0.0123,
+      "step": 6150
+    },
+    {
+      "epoch": 267.39,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.614670753479004,
+      "eval_runtime": 1.1319,
+      "eval_samples_per_second": 39.755,
+      "eval_steps_per_second": 2.65,
+      "step": 6150
+    },
+    {
+      "epoch": 269.57,
+      "learning_rate": 3.065693430656934e-05,
+      "loss": 0.0151,
+      "step": 6200
+    },
+    {
+      "epoch": 271.74,
+      "learning_rate": 2.846715328467153e-05,
+      "loss": 0.0099,
+      "step": 6250
+    },
+    {
+      "epoch": 273.91,
+      "learning_rate": 2.627737226277372e-05,
+      "loss": 0.0214,
+      "step": 6300
+    },
+    {
+      "epoch": 273.91,
+      "eval_cer": 0.3302354399008674,
+      "eval_loss": 2.620166778564453,
+      "eval_runtime": 1.262,
+      "eval_samples_per_second": 35.657,
+      "eval_steps_per_second": 2.377,
+      "step": 6300
+    },
+    {
+      "epoch": 276.09,
+      "learning_rate": 2.408759124087591e-05,
+      "loss": 0.0085,
+      "step": 6350
+    },
+    {
+      "epoch": 278.26,
+      "learning_rate": 2.1897810218978098e-05,
+      "loss": 0.0119,
+      "step": 6400
+    },
+    {
+      "epoch": 280.43,
+      "learning_rate": 1.9708029197080292e-05,
+      "loss": 0.0107,
+      "step": 6450
+    },
+    {
+      "epoch": 280.43,
+      "eval_cer": 0.32342007434944237,
+      "eval_loss": 2.6263809204101562,
+      "eval_runtime": 1.2547,
+      "eval_samples_per_second": 35.867,
+      "eval_steps_per_second": 2.391,
+      "step": 6450
+    },
+    {
+      "epoch": 282.61,
+      "learning_rate": 1.751824817518248e-05,
+      "loss": 0.0107,
+      "step": 6500
+    },
+    {
+      "epoch": 284.78,
+      "learning_rate": 1.532846715328467e-05,
+      "loss": 0.0105,
+      "step": 6550
+    },
+    {
+      "epoch": 286.96,
+      "learning_rate": 1.313868613138686e-05,
+      "loss": 0.0086,
+      "step": 6600
+    },
+    {
+      "epoch": 286.96,
+      "eval_cer": 0.3215613382899628,
+      "eval_loss": 2.607461452484131,
+      "eval_runtime": 1.204,
+      "eval_samples_per_second": 37.374,
+      "eval_steps_per_second": 2.492,
+      "step": 6600
+    },
+    {
+      "epoch": 289.13,
+      "learning_rate": 1.0948905109489049e-05,
+      "loss": 0.0095,
+      "step": 6650
+    },
+    {
+      "epoch": 291.3,
+      "learning_rate": 8.75912408759124e-06,
+      "loss": 0.0108,
+      "step": 6700
+    },
+    {
+      "epoch": 293.48,
+      "learning_rate": 6.56934306569343e-06,
+      "loss": 0.0106,
+      "step": 6750
+    },
+    {
+      "epoch": 293.48,
+      "eval_cer": 0.3246592317224288,
+      "eval_loss": 2.595982789993286,
+      "eval_runtime": 1.1323,
+      "eval_samples_per_second": 39.741,
+      "eval_steps_per_second": 2.649,
+      "step": 6750
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 6900,
+  "num_train_epochs": 300,
+  "save_steps": 150,
+  "total_flos": 2.260883648900445e+19,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-6750/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0741fe1648758c067baeb587c00ff9d0528d818e60814b62c8d0f8ca82d1c4d
+size 4472

checkpoint-6750/vocab.json ADDED Viewed

	@@ -0,0 +1,679 @@

+{
+  "0": 1,
+  "1": 2,
+  "2": 3,
+  "3": 4,
+  "4": 5,
+  "5": 6,
+  "6": 7,
+  "7": 8,
+  "8": 9,
+  "9": 10,
+  "[PAD]": 676,
+  "[UNK]": 675,
+  "|": 0,
+  "　": 11,
+  "、": 12,
+  "。": 13,
+  "々": 14,
+  "ぁ": 15,
+  "あ": 16,
+  "い": 17,
+  "う": 18,
+  "え": 19,
+  "お": 20,
+  "か": 21,
+  "が": 22,
+  "き": 23,
+  "ぎ": 24,
+  "く": 25,
+  "ぐ": 26,
+  "け": 27,
+  "げ": 28,
+  "こ": 29,
+  "ご": 30,
+  "さ": 31,
+  "ざ": 32,
+  "し": 33,
+  "じ": 34,
+  "す": 35,
+  "ず": 36,
+  "せ": 37,
+  "ぜ": 38,
+  "そ": 39,
+  "た": 40,
+  "だ": 41,
+  "ち": 42,
+  "っ": 43,
+  "つ": 44,
+  "て": 45,
+  "で": 46,
+  "と": 47,
+  "ど": 48,
+  "な": 49,
+  "に": 50,
+  "ぬ": 51,
+  "ね": 52,
+  "の": 53,
+  "は": 54,
+  "ば": 55,
+  "ぱ": 56,
+  "ひ": 57,
+  "び": 58,
+  "ふ": 59,
+  "ぶ": 60,
+  "ぷ": 61,
+  "へ": 62,
+  "べ": 63,
+  "ほ": 64,
+  "ぼ": 65,
+  "ぽ": 66,
+  "ま": 67,
+  "み": 68,
+  "む": 69,
+  "め": 70,
+  "も": 71,
+  "ゃ": 72,
+  "や": 73,
+  "ゆ": 74,
+  "ょ": 75,
+  "よ": 76,
+  "ら": 77,
+  "り": 78,
+  "る": 79,
+  "れ": 80,
+  "ろ": 81,
+  "わ": 82,
+  "を": 83,
+  "ん": 84,
+  "ァ": 85,
+  "ア": 86,
+  "ィ": 87,
+  "イ": 88,
+  "ウ": 89,
+  "ェ": 90,
+  "エ": 91,
+  "ォ": 92,
+  "オ": 93,
+  "カ": 94,
+  "ガ": 95,
+  "キ": 96,
+  "ギ": 97,
+  "ク": 98,
+  "グ": 99,
+  "ケ": 100,
+  "ゲ": 101,
+  "コ": 102,
+  "ゴ": 103,
+  "サ": 104,
+  "ザ": 105,
+  "シ": 106,
+  "ジ": 107,
+  "ス": 108,
+  "ズ": 109,
+  "セ": 110,
+  "ソ": 111,
+  "タ": 112,
+  "ダ": 113,
+  "チ": 114,
+  "ッ": 115,
+  "ツ": 116,
+  "テ": 117,
+  "デ": 118,
+  "ト": 119,
+  "ド": 120,
+  "ナ": 121,
+  "ニ": 122,
+  "ネ": 123,
+  "ノ": 124,
+  "ハ": 125,
+  "バ": 126,
+  "パ": 127,
+  "ヒ": 128,
+  "ビ": 129,
+  "ピ": 130,
+  "フ": 131,
+  "ブ": 132,
+  "プ": 133,
+  "ベ": 134,
+  "ペ": 135,
+  "ホ": 136,
+  "ボ": 137,
+  "ポ": 138,
+  "マ": 139,
+  "ミ": 140,
+  "ム": 141,
+  "メ": 142,
+  "モ": 143,
+  "ャ": 144,
+  "ヤ": 145,
+  "ュ": 146,
+  "ヨ": 147,
+  "ラ": 148,
+  "リ": 149,
+  "ル": 150,
+  "レ": 151,
+  "ロ": 152,
+  "ワ": 153,
+  "ン": 154,
+  "ヶ": 155,
+  "ー": 156,
+  "一": 157,
+  "万": 158,
+  "丈": 159,
+  "三": 160,
+  "上": 161,
+  "下": 162,
+  "不": 163,
+  "中": 164,
+  "丸": 165,
+  "主": 166,
+  "久": 167,
+  "九": 168,
+  "乾": 169,
+  "予": 170,
+  "事": 171,
+  "二": 172,
+  "五": 173,
+  "井": 174,
+  "交": 175,
+  "京": 176,
+  "人": 177,
+  "今": 178,
+  "仏": 179,
+  "仕": 180,
+  "他": 181,
+  "付": 182,
+  "代": 183,
+  "以": 184,
+  "件": 185,
+  "企": 186,
+  "伊": 187,
+  "休": 188,
+  "会": 189,
+  "伸": 190,
+  "住": 191,
+  "体": 192,
+  "何": 193,
+  "余": 194,
+  "作": 195,
+  "使": 196,
+  "例": 197,
+  "保": 198,
+  "信": 199,
+  "俣": 200,
+  "個": 201,
+  "倒": 202,
+  "候": 203,
+  "健": 204,
+  "備": 205,
+  "元": 206,
+  "充": 207,
+  "先": 208,
+  "入": 209,
+  "全": 210,
+  "公": 211,
+  "共": 212,
+  "内": 213,
+  "円": 214,
+  "写": 215,
+  "冬": 216,
+  "冷": 217,
+  "凍": 218,
+  "出": 219,
+  "分": 220,
+  "切": 221,
+  "初": 222,
+  "到": 223,
+  "制": 224,
+  "前": 225,
+  "力": 226,
+  "加": 227,
+  "動": 228,
+  "募": 229,
+  "勧": 230,
+  "化": 231,
+  "北": 232,
+  "南": 233,
+  "厚": 234,
+  "原": 235,
+  "去": 236,
+  "参": 237,
+  "友": 238,
+  "取": 239,
+  "口": 240,
+  "古": 241,
+  "可": 242,
+  "台": 243,
+  "号": 244,
+  "司": 245,
+  "合": 246,
+  "吉": 247,
+  "吊": 248,
+  "同": 249,
+  "名": 250,
+  "吹": 251,
+  "味": 252,
+  "呼": 253,
+  "和": 254,
+  "品": 255,
+  "唇": 256,
+  "商": 257,
+  "問": 258,
+  "噌": 259,
+  "回": 260,
+  "固": 261,
+  "国": 262,
+  "園": 263,
+  "地": 264,
+  "型": 265,
+  "域": 266,
+  "報": 267,
+  "場": 268,
+  "塗": 269,
+  "増": 270,
+  "声": 271,
+  "売": 272,
+  "変": 273,
+  "夏": 274,
+  "外": 275,
+  "多": 276,
+  "大": 277,
+  "天": 278,
+  "太": 279,
+  "夫": 280,
+  "失": 281,
+  "奈": 282,
+  "奥": 283,
+  "女": 284,
+  "好": 285,
+  "始": 286,
+  "嫌": 287,
+  "嬉": 288,
+  "子": 289,
+  "存": 290,
+  "孝": 291,
+  "学": 292,
+  "定": 293,
+  "実": 294,
+  "室": 295,
+  "宮": 296,
+  "家": 297,
+  "容": 298,
+  "寝": 299,
+  "寺": 300,
+  "対": 301,
+  "小": 302,
+  "少": 303,
+  "尾": 304,
+  "局": 305,
+  "届": 306,
+  "屋": 307,
+  "山": 308,
+  "岐": 309,
+  "岡": 310,
+  "岩": 311,
+  "岳": 312,
+  "島": 313,
+  "川": 314,
+  "帰": 315,
+  "常": 316,
+  "平": 317,
+  "年": 318,
+  "幻": 319,
+  "広": 320,
+  "底": 321,
+  "店": 322,
+  "座": 323,
+  "庫": 324,
+  "弁": 325,
+  "式": 326,
+  "張": 327,
+  "強": 328,
+  "当": 329,
+  "形": 330,
+  "影": 331,
+  "待": 332,
+  "後": 333,
+  "得": 334,
+  "忘": 335,
+  "応": 336,
+  "思": 337,
+  "怠": 338,
+  "恥": 339,
+  "悪": 340,
+  "情": 341,
+  "想": 342,
+  "意": 343,
+  "愛": 344,
+  "感": 345,
+  "慢": 346,
+  "成": 347,
+  "我": 348,
+  "戦": 349,
+  "戻": 350,
+  "所": 351,
+  "手": 352,
+  "打": 353,
+  "抜": 354,
+  "押": 355,
+  "拝": 356,
+  "拶": 357,
+  "持": 358,
+  "指": 359,
+  "挨": 360,
+  "掃": 361,
+  "援": 362,
+  "教": 363,
+  "数": 364,
+  "文": 365,
+  "料": 366,
+  "断": 367,
+  "新": 368,
+  "方": 369,
+  "旗": 370,
+  "日": 371,
+  "旦": 372,
+  "早": 373,
+  "明": 374,
+  "映": 375,
+  "春": 376,
+  "昨": 377,
+  "是": 378,
+  "昼": 379,
+  "時": 380,
+  "普": 381,
+  "景": 382,
+  "晴": 383,
+  "暑": 384,
+  "暗": 385,
+  "書": 386,
+  "最": 387,
+  "月": 388,
+  "有": 389,
+  "望": 390,
+  "期": 391,
+  "木": 392,
+  "本": 393,
+  "机": 394,
+  "村": 395,
+  "来": 396,
+  "杯": 397,
+  "東": 398,
+  "林": 399,
+  "枚": 400,
+  "柴": 401,
+  "校": 402,
+  "梨": 403,
+  "棒": 404,
+  "森": 405,
+  "椿": 406,
+  "楽": 407,
+  "構": 408,
+  "横": 409,
+  "樹": 410,
+  "機": 411,
+  "欄": 412,
+  "次": 413,
+  "欲": 414,
+  "正": 415,
+  "残": 416,
+  "段": 417,
+  "母": 418,
+  "毎": 419,
+  "比": 420,
+  "毛": 421,
+  "気": 422,
+  "水": 423,
+  "汁": 424,
+  "汗": 425,
+  "況": 426,
+  "泉": 427,
+  "泊": 428,
+  "法": 429,
+  "注": 430,
+  "洋": 431,
+  "活": 432,
+  "流": 433,
+  "海": 434,
+  "消": 435,
+  "減": 436,
+  "渡": 437,
+  "温": 438,
+  "準": 439,
+  "漫": 440,
+  "激": 441,
+  "濃": 442,
+  "瀬": 443,
+  "火": 444,
+  "炎": 445,
+  "炭": 446,
+  "焚": 447,
+  "焦": 448,
+  "然": 449,
+  "焼": 450,
+  "照": 451,
+  "煮": 452,
+  "熊": 453,
+  "熱": 454,
+  "燃": 455,
+  "燕": 456,
+  "燥": 457,
+  "父": 458,
+  "物": 459,
+  "特": 460,
+  "犬": 461,
+  "状": 462,
+  "狙": 463,
+  "独": 464,
+  "狭": 465,
+  "猫": 466,
+  "獣": 467,
+  "王": 468,
+  "球": 469,
+  "理": 470,
+  "生": 471,
+  "用": 472,
+  "田": 473,
+  "甲": 474,
+  "申": 475,
+  "町": 476,
+  "画": 477,
+  "界": 478,
+  "留": 479,
+  "番": 480,
+  "疲": 481,
+  "癒": 482,
+  "発": 483,
+  "登": 484,
+  "白": 485,
+  "百": 486,
+  "的": 487,
+  "皆": 488,
+  "皿": 489,
+  "監": 490,
+  "目": 491,
+  "直": 492,
+  "相": 493,
+  "省": 494,
+  "県": 495,
+  "真": 496,
+  "督": 497,
+  "瞬": 498,
+  "知": 499,
+  "硬": 500,
+  "確": 501,
+  "礼": 502,
+  "社": 503,
+  "神": 504,
+  "福": 505,
+  "私": 506,
+  "移": 507,
+  "稲": 508,
+  "穂": 509,
+  "空": 510,
+  "立": 511,
+  "端": 512,
+  "答": 513,
+  "箇": 514,
+  "箱": 515,
+  "籍": 516,
+  "米": 517,
+  "粛": 518,
+  "精": 519,
+  "糖": 520,
+  "系": 521,
+  "納": 522,
+  "素": 523,
+  "細": 524,
+  "終": 525,
+  "結": 526,
+  "絶": 527,
+  "継": 528,
+  "綺": 529,
+  "綿": 530,
+  "緒": 531,
+  "締": 532,
+  "練": 533,
+  "縁": 534,
+  "繰": 535,
+  "缶": 536,
+  "置": 537,
+  "羊": 538,
+  "美": 539,
+  "義": 540,
+  "考": 541,
+  "者": 542,
+  "耳": 543,
+  "聞": 544,
+  "肉": 545,
+  "育": 546,
+  "腹": 547,
+  "自": 548,
+  "良": 549,
+  "色": 550,
+  "若": 551,
+  "茶": 552,
+  "荒": 553,
+  "荘": 554,
+  "荷": 555,
+  "落": 556,
+  "蔵": 557,
+  "薬": 558,
+  "蝶": 559,
+  "行": 560,
+  "街": 561,
+  "褒": 562,
+  "西": 563,
+  "要": 564,
+  "見": 565,
+  "視": 566,
+  "覧": 567,
+  "親": 568,
+  "観": 569,
+  "言": 570,
+  "記": 571,
+  "設": 572,
+  "許": 573,
+  "訳": 574,
+  "試": 575,
+  "話": 576,
+  "詳": 577,
+  "説": 578,
+  "読": 579,
+  "誰": 580,
+  "調": 581,
+  "請": 582,
+  "謝": 583,
+  "識": 584,
+  "議": 585,
+  "谷": 586,
+  "買": 587,
+  "質": 588,
+  "赤": 589,
+  "走": 590,
+  "越": 591,
+  "路": 592,
+  "身": 593,
+  "車": 594,
+  "転": 595,
+  "載": 596,
+  "辛": 597,
+  "辺": 598,
+  "込": 599,
+  "近": 600,
+  "返": 601,
+  "追": 602,
+  "途": 603,
+  "通": 604,
+  "速": 605,
+  "連": 606,
+  "週": 607,
+  "遅": 608,
+  "運": 609,
+  "過": 610,
+  "達": 611,
+  "違": 612,
+  "適": 613,
+  "選": 614,
+  "郎": 615,
+  "部": 616,
+  "配": 617,
+  "酒": 618,
+  "重": 619,
+  "野": 620,
+  "量": 621,
+  "釣": 622,
+  "録": 623,
+  "鍵": 624,
+  "長": 625,
+  "開": 626,
+  "間": 627,
+  "関": 628,
+  "閣": 629,
+  "阜": 630,
+  "降": 631,
+  "限": 632,
+  "院": 633,
+  "除": 634,
+  "陸": 635,
+  "雅": 636,
+  "集": 637,
+  "雉": 638,
+  "難": 639,
+  "雨": 640,
+  "雪": 641,
+  "電": 642,
+  "青": 643,
+  "非": 644,
+  "面": 645,
+  "音": 646,
+  "響": 647,
+  "頂": 648,
+  "頃": 649,
+  "順": 650,
+  "頼": 651,
+  "顔": 652,
+  "風": 653,
+  "食": 654,
+  "飲": 655,
+  "飼": 656,
+  "馬": 657,
+  "験": 658,
+  "驚": 659,
+  "高": 660,
+  "髪": 661,
+  "鬼": 662,
+  "鶏": 663,
+  "鹿": 664,
+  "麗": 665,
+  "！": 666,
+  "（": 667,
+  "）": 668,
+  "／": 669,
+  "１": 670,
+  "２": 671,
+  "３": 672,
+  "？": 673,
+  "ｍ": 674
+}

checkpoint-6900/added_tokens.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "</s>": 678,
+  "<s>": 677,
+  "[PAD]": 676,
+  "[UNK]": 675
+}

checkpoint-6900/config.json ADDED Viewed

	@@ -0,0 +1,117 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.05,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.05,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.05,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 676,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.34.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 679,
+  "xvector_output_dim": 512
+}

checkpoint-6900/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0f04f9516a42bb196e6cc56b5cd1d974b58484227ad668914a82979adf8cd0a7
+size 2495727542

checkpoint-6900/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

checkpoint-6900/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b61e6d7c21931997e82553ee1094451457e43f95812c2ee82aeedf4e89cd76d
+size 1264686250

checkpoint-6900/rng_state_0.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ff4da61760aaf758f2249f49785073e751c7c6b42d97b629295e03370b0a75be
+size 15024

checkpoint-6900/rng_state_1.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f76c96944cc56b3748e8c49262f1123ebca7ad10cc063156d199e514526afb6c
+size 15024

checkpoint-6900/rng_state_2.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:dae4d9f5026d88180e0d86b0cbfe9e17a45f3cdd811ef47e83023919fadebe6f
+size 15088

checkpoint-6900/rng_state_3.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33ce8c97c0237f1aab733e8352d232b013d6ac9640ccd659e47357857fe20a3c
+size 15024

checkpoint-6900/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4aff4c539403cd22a610cf466ddff5a536ad52bb5e611a9ba04bb4e840639794
+size 1064

checkpoint-6900/special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "additional_special_tokens": [
+    "<s>",
+    "</s>"
+  ],
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

checkpoint-6900/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "675": {
+      "content": "[UNK]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "676": {
+      "content": "[PAD]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "677": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "678": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<s>",
+    "</s>"
+  ],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "config": null,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "tokenizer_file": null,
+  "tokenizer_type": "wav2vec2",
+  "trust_remote_code": false,
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

checkpoint-6900/trainer_state.json ADDED Viewed

	@@ -0,0 +1,1261 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 300.0,
+  "eval_steps": 150,
+  "global_step": 6900,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 2.17,
+      "learning_rate": 0.0003,
+      "loss": 35.2887,
+      "step": 50
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 0.00029781021897810217,
+      "loss": 5.9569,
+      "step": 100
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 0.00029562043795620436,
+      "loss": 4.9138,
+      "step": 150
+    },
+    {
+      "epoch": 6.52,
+      "eval_cer": 1.0,
+      "eval_loss": 4.7965407371521,
+      "eval_runtime": 1.256,
+      "eval_samples_per_second": 35.828,
+      "eval_steps_per_second": 2.389,
+      "step": 150
+    },
+    {
+      "epoch": 8.7,
+      "learning_rate": 0.00029343065693430656,
+      "loss": 4.887,
+      "step": 200
+    },
+    {
+      "epoch": 10.87,
+      "learning_rate": 0.00029124087591240875,
+      "loss": 4.8447,
+      "step": 250
+    },
+    {
+      "epoch": 13.04,
+      "learning_rate": 0.00028905109489051094,
+      "loss": 4.7484,
+      "step": 300
+    },
+    {
+      "epoch": 13.04,
+      "eval_cer": 1.0,
+      "eval_loss": 4.608075141906738,
+      "eval_runtime": 1.2451,
+      "eval_samples_per_second": 36.142,
+      "eval_steps_per_second": 2.409,
+      "step": 300
+    },
+    {
+      "epoch": 15.22,
+      "learning_rate": 0.00028686131386861314,
+      "loss": 4.6529,
+      "step": 350
+    },
+    {
+      "epoch": 17.39,
+      "learning_rate": 0.0002846715328467153,
+      "loss": 4.6373,
+      "step": 400
+    },
+    {
+      "epoch": 19.57,
+      "learning_rate": 0.00028248175182481747,
+      "loss": 4.5894,
+      "step": 450
+    },
+    {
+      "epoch": 19.57,
+      "eval_cer": 0.9851301115241635,
+      "eval_loss": 4.469708442687988,
+      "eval_runtime": 1.2325,
+      "eval_samples_per_second": 36.51,
+      "eval_steps_per_second": 2.434,
+      "step": 450
+    },
+    {
+      "epoch": 21.74,
+      "learning_rate": 0.00028029197080291966,
+      "loss": 4.5045,
+      "step": 500
+    },
+    {
+      "epoch": 23.91,
+      "learning_rate": 0.00027810218978102186,
+      "loss": 4.4076,
+      "step": 550
+    },
+    {
+      "epoch": 26.09,
+      "learning_rate": 0.00027591240875912405,
+      "loss": 4.2024,
+      "step": 600
+    },
+    {
+      "epoch": 26.09,
+      "eval_cer": 0.9076827757125155,
+      "eval_loss": 4.037315845489502,
+      "eval_runtime": 1.2357,
+      "eval_samples_per_second": 36.417,
+      "eval_steps_per_second": 2.428,
+      "step": 600
+    },
+    {
+      "epoch": 28.26,
+      "learning_rate": 0.00027372262773722625,
+      "loss": 3.8743,
+      "step": 650
+    },
+    {
+      "epoch": 30.43,
+      "learning_rate": 0.00027153284671532844,
+      "loss": 3.3488,
+      "step": 700
+    },
+    {
+      "epoch": 32.61,
+      "learning_rate": 0.00026934306569343063,
+      "loss": 2.7314,
+      "step": 750
+    },
+    {
+      "epoch": 32.61,
+      "eval_cer": 0.5340768277571252,
+      "eval_loss": 2.5507473945617676,
+      "eval_runtime": 1.2278,
+      "eval_samples_per_second": 36.651,
+      "eval_steps_per_second": 2.443,
+      "step": 750
+    },
+    {
+      "epoch": 34.78,
+      "learning_rate": 0.00026715328467153283,
+      "loss": 2.1968,
+      "step": 800
+    },
+    {
+      "epoch": 36.96,
+      "learning_rate": 0.000264963503649635,
+      "loss": 1.6522,
+      "step": 850
+    },
+    {
+      "epoch": 39.13,
+      "learning_rate": 0.0002627737226277372,
+      "loss": 1.2293,
+      "step": 900
+    },
+    {
+      "epoch": 39.13,
+      "eval_cer": 0.4138785625774473,
+      "eval_loss": 2.01461124420166,
+      "eval_runtime": 1.2246,
+      "eval_samples_per_second": 36.746,
+      "eval_steps_per_second": 2.45,
+      "step": 900
+    },
+    {
+      "epoch": 41.3,
+      "learning_rate": 0.0002605839416058394,
+      "loss": 0.9292,
+      "step": 950
+    },
+    {
+      "epoch": 43.48,
+      "learning_rate": 0.00025839416058394155,
+      "loss": 0.7208,
+      "step": 1000
+    },
+    {
+      "epoch": 45.65,
+      "learning_rate": 0.00025620437956204374,
+      "loss": 0.5544,
+      "step": 1050
+    },
+    {
+      "epoch": 45.65,
+      "eval_cer": 0.355638166047088,
+      "eval_loss": 1.9821244478225708,
+      "eval_runtime": 1.2073,
+      "eval_samples_per_second": 37.275,
+      "eval_steps_per_second": 2.485,
+      "step": 1050
+    },
+    {
+      "epoch": 47.83,
+      "learning_rate": 0.00025401459854014594,
+      "loss": 0.4757,
+      "step": 1100
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 0.00025182481751824813,
+      "loss": 0.3895,
+      "step": 1150
+    },
+    {
+      "epoch": 52.17,
+      "learning_rate": 0.0002496350364963503,
+      "loss": 0.3224,
+      "step": 1200
+    },
+    {
+      "epoch": 52.17,
+      "eval_cer": 0.3587360594795539,
+      "eval_loss": 2.0189881324768066,
+      "eval_runtime": 1.1983,
+      "eval_samples_per_second": 37.554,
+      "eval_steps_per_second": 2.504,
+      "step": 1200
+    },
+    {
+      "epoch": 54.35,
+      "learning_rate": 0.0002474452554744525,
+      "loss": 0.279,
+      "step": 1250
+    },
+    {
+      "epoch": 56.52,
+      "learning_rate": 0.0002452554744525547,
+      "loss": 0.2285,
+      "step": 1300
+    },
+    {
+      "epoch": 58.7,
+      "learning_rate": 0.0002430656934306569,
+      "loss": 0.1951,
+      "step": 1350
+    },
+    {
+      "epoch": 58.7,
+      "eval_cer": 0.36121437422552666,
+      "eval_loss": 2.1229116916656494,
+      "eval_runtime": 1.2603,
+      "eval_samples_per_second": 35.706,
+      "eval_steps_per_second": 2.38,
+      "step": 1350
+    },
+    {
+      "epoch": 60.87,
+      "learning_rate": 0.0002408759124087591,
+      "loss": 0.1964,
+      "step": 1400
+    },
+    {
+      "epoch": 63.04,
+      "learning_rate": 0.0002386861313868613,
+      "loss": 0.1622,
+      "step": 1450
+    },
+    {
+      "epoch": 65.22,
+      "learning_rate": 0.0002364963503649635,
+      "loss": 0.1539,
+      "step": 1500
+    },
+    {
+      "epoch": 65.22,
+      "eval_cer": 0.3469640644361834,
+      "eval_loss": 2.111368179321289,
+      "eval_runtime": 1.2194,
+      "eval_samples_per_second": 36.903,
+      "eval_steps_per_second": 2.46,
+      "step": 1500
+    },
+    {
+      "epoch": 67.39,
+      "learning_rate": 0.00023430656934306568,
+      "loss": 0.1492,
+      "step": 1550
+    },
+    {
+      "epoch": 69.57,
+      "learning_rate": 0.00023211678832116788,
+      "loss": 0.1404,
+      "step": 1600
+    },
+    {
+      "epoch": 71.74,
+      "learning_rate": 0.00022992700729927004,
+      "loss": 0.1165,
+      "step": 1650
+    },
+    {
+      "epoch": 71.74,
+      "eval_cer": 0.33147459727385375,
+      "eval_loss": 2.274796485900879,
+      "eval_runtime": 1.1874,
+      "eval_samples_per_second": 37.898,
+      "eval_steps_per_second": 2.527,
+      "step": 1650
+    },
+    {
+      "epoch": 73.91,
+      "learning_rate": 0.00022773722627737224,
+      "loss": 0.1268,
+      "step": 1700
+    },
+    {
+      "epoch": 76.09,
+      "learning_rate": 0.00022554744525547443,
+      "loss": 0.1186,
+      "step": 1750
+    },
+    {
+      "epoch": 78.26,
+      "learning_rate": 0.00022335766423357663,
+      "loss": 0.1119,
+      "step": 1800
+    },
+    {
+      "epoch": 78.26,
+      "eval_cer": 0.34882280049566294,
+      "eval_loss": 2.2390518188476562,
+      "eval_runtime": 1.3465,
+      "eval_samples_per_second": 33.42,
+      "eval_steps_per_second": 2.228,
+      "step": 1800
+    },
+    {
+      "epoch": 80.43,
+      "learning_rate": 0.00022116788321167882,
+      "loss": 0.0988,
+      "step": 1850
+    },
+    {
+      "epoch": 82.61,
+      "learning_rate": 0.00021897810218978101,
+      "loss": 0.112,
+      "step": 1900
+    },
+    {
+      "epoch": 84.78,
+      "learning_rate": 0.0002167883211678832,
+      "loss": 0.0989,
+      "step": 1950
+    },
+    {
+      "epoch": 84.78,
+      "eval_cer": 0.3382899628252788,
+      "eval_loss": 2.343754529953003,
+      "eval_runtime": 1.2055,
+      "eval_samples_per_second": 37.329,
+      "eval_steps_per_second": 2.489,
+      "step": 1950
+    },
+    {
+      "epoch": 86.96,
+      "learning_rate": 0.00021459854014598537,
+      "loss": 0.097,
+      "step": 2000
+    },
+    {
+      "epoch": 89.13,
+      "learning_rate": 0.00021240875912408757,
+      "loss": 0.0854,
+      "step": 2050
+    },
+    {
+      "epoch": 91.3,
+      "learning_rate": 0.00021021897810218976,
+      "loss": 0.0915,
+      "step": 2100
+    },
+    {
+      "epoch": 91.3,
+      "eval_cer": 0.3587360594795539,
+      "eval_loss": 2.121840000152588,
+      "eval_runtime": 1.2037,
+      "eval_samples_per_second": 37.386,
+      "eval_steps_per_second": 2.492,
+      "step": 2100
+    },
+    {
+      "epoch": 93.48,
+      "learning_rate": 0.00020802919708029196,
+      "loss": 0.078,
+      "step": 2150
+    },
+    {
+      "epoch": 95.65,
+      "learning_rate": 0.00020583941605839415,
+      "loss": 0.0857,
+      "step": 2200
+    },
+    {
+      "epoch": 97.83,
+      "learning_rate": 0.00020364963503649632,
+      "loss": 0.0721,
+      "step": 2250
+    },
+    {
+      "epoch": 97.83,
+      "eval_cer": 0.35192069392812886,
+      "eval_loss": 2.242812395095825,
+      "eval_runtime": 1.1964,
+      "eval_samples_per_second": 37.614,
+      "eval_steps_per_second": 2.508,
+      "step": 2250
+    },
+    {
+      "epoch": 100.0,
+      "learning_rate": 0.0002014598540145985,
+      "loss": 0.0799,
+      "step": 2300
+    },
+    {
+      "epoch": 102.17,
+      "learning_rate": 0.0001992700729927007,
+      "loss": 0.0798,
+      "step": 2350
+    },
+    {
+      "epoch": 104.35,
+      "learning_rate": 0.0001970802919708029,
+      "loss": 0.0742,
+      "step": 2400
+    },
+    {
+      "epoch": 104.35,
+      "eval_cer": 0.33643122676579923,
+      "eval_loss": 2.229339838027954,
+      "eval_runtime": 1.2156,
+      "eval_samples_per_second": 37.019,
+      "eval_steps_per_second": 2.468,
+      "step": 2400
+    },
+    {
+      "epoch": 106.52,
+      "learning_rate": 0.0001948905109489051,
+      "loss": 0.0692,
+      "step": 2450
+    },
+    {
+      "epoch": 108.7,
+      "learning_rate": 0.0001927007299270073,
+      "loss": 0.0664,
+      "step": 2500
+    },
+    {
+      "epoch": 110.87,
+      "learning_rate": 0.00019051094890510948,
+      "loss": 0.0629,
+      "step": 2550
+    },
+    {
+      "epoch": 110.87,
+      "eval_cer": 0.33705080545229243,
+      "eval_loss": 2.2878150939941406,
+      "eval_runtime": 1.2044,
+      "eval_samples_per_second": 37.364,
+      "eval_steps_per_second": 2.491,
+      "step": 2550
+    },
+    {
+      "epoch": 113.04,
+      "learning_rate": 0.00018832116788321167,
+      "loss": 0.0619,
+      "step": 2600
+    },
+    {
+      "epoch": 115.22,
+      "learning_rate": 0.00018613138686131387,
+      "loss": 0.0582,
+      "step": 2650
+    },
+    {
+      "epoch": 117.39,
+      "learning_rate": 0.00018394160583941606,
+      "loss": 0.0495,
+      "step": 2700
+    },
+    {
+      "epoch": 117.39,
+      "eval_cer": 0.34076827757125155,
+      "eval_loss": 2.2671637535095215,
+      "eval_runtime": 1.2039,
+      "eval_samples_per_second": 37.379,
+      "eval_steps_per_second": 2.492,
+      "step": 2700
+    },
+    {
+      "epoch": 119.57,
+      "learning_rate": 0.00018175182481751826,
+      "loss": 0.0614,
+      "step": 2750
+    },
+    {
+      "epoch": 121.74,
+      "learning_rate": 0.00017956204379562042,
+      "loss": 0.0565,
+      "step": 2800
+    },
+    {
+      "epoch": 123.91,
+      "learning_rate": 0.00017737226277372262,
+      "loss": 0.0466,
+      "step": 2850
+    },
+    {
+      "epoch": 123.91,
+      "eval_cer": 0.35254027261462206,
+      "eval_loss": 2.2532107830047607,
+      "eval_runtime": 1.3563,
+      "eval_samples_per_second": 33.179,
+      "eval_steps_per_second": 2.212,
+      "step": 2850
+    },
+    {
+      "epoch": 126.09,
+      "learning_rate": 0.00017518248175182478,
+      "loss": 0.0465,
+      "step": 2900
+    },
+    {
+      "epoch": 128.26,
+      "learning_rate": 0.00017299270072992698,
+      "loss": 0.0496,
+      "step": 2950
+    },
+    {
+      "epoch": 130.43,
+      "learning_rate": 0.00017080291970802917,
+      "loss": 0.0424,
+      "step": 3000
+    },
+    {
+      "epoch": 130.43,
+      "eval_cer": 0.32589838909541513,
+      "eval_loss": 2.2844393253326416,
+      "eval_runtime": 1.2006,
+      "eval_samples_per_second": 37.48,
+      "eval_steps_per_second": 2.499,
+      "step": 3000
+    },
+    {
+      "epoch": 132.61,
+      "learning_rate": 0.00016861313868613137,
+      "loss": 0.0483,
+      "step": 3050
+    },
+    {
+      "epoch": 134.78,
+      "learning_rate": 0.00016642335766423356,
+      "loss": 0.0488,
+      "step": 3100
+    },
+    {
+      "epoch": 136.96,
+      "learning_rate": 0.00016423357664233575,
+      "loss": 0.0446,
+      "step": 3150
+    },
+    {
+      "epoch": 136.96,
+      "eval_cer": 0.3252788104089219,
+      "eval_loss": 2.2763445377349854,
+      "eval_runtime": 1.2043,
+      "eval_samples_per_second": 37.368,
+      "eval_steps_per_second": 2.491,
+      "step": 3150
+    },
+    {
+      "epoch": 139.13,
+      "learning_rate": 0.00016204379562043795,
+      "loss": 0.0424,
+      "step": 3200
+    },
+    {
+      "epoch": 141.3,
+      "learning_rate": 0.00015985401459854014,
+      "loss": 0.0429,
+      "step": 3250
+    },
+    {
+      "epoch": 143.48,
+      "learning_rate": 0.00015766423357664234,
+      "loss": 0.0411,
+      "step": 3300
+    },
+    {
+      "epoch": 143.48,
+      "eval_cer": 0.3302354399008674,
+      "eval_loss": 2.301079034805298,
+      "eval_runtime": 1.345,
+      "eval_samples_per_second": 33.458,
+      "eval_steps_per_second": 2.231,
+      "step": 3300
+    },
+    {
+      "epoch": 145.65,
+      "learning_rate": 0.00015547445255474453,
+      "loss": 0.0392,
+      "step": 3350
+    },
+    {
+      "epoch": 147.83,
+      "learning_rate": 0.00015328467153284672,
+      "loss": 0.0426,
+      "step": 3400
+    },
+    {
+      "epoch": 150.0,
+      "learning_rate": 0.00015109489051094892,
+      "loss": 0.0419,
+      "step": 3450
+    },
+    {
+      "epoch": 150.0,
+      "eval_cer": 0.3420074349442379,
+      "eval_loss": 2.320059299468994,
+      "eval_runtime": 1.2411,
+      "eval_samples_per_second": 36.259,
+      "eval_steps_per_second": 2.417,
+      "step": 3450
+    },
+    {
+      "epoch": 152.17,
+      "learning_rate": 0.00014890510948905108,
+      "loss": 0.0386,
+      "step": 3500
+    },
+    {
+      "epoch": 154.35,
+      "learning_rate": 0.00014671532846715328,
+      "loss": 0.0402,
+      "step": 3550
+    },
+    {
+      "epoch": 156.52,
+      "learning_rate": 0.00014452554744525547,
+      "loss": 0.0333,
+      "step": 3600
+    },
+    {
+      "epoch": 156.52,
+      "eval_cer": 0.34386617100371747,
+      "eval_loss": 2.364445209503174,
+      "eval_runtime": 1.2337,
+      "eval_samples_per_second": 36.475,
+      "eval_steps_per_second": 2.432,
+      "step": 3600
+    },
+    {
+      "epoch": 158.7,
+      "learning_rate": 0.00014233576642335764,
+      "loss": 0.0434,
+      "step": 3650
+    },
+    {
+      "epoch": 160.87,
+      "learning_rate": 0.00014014598540145983,
+      "loss": 0.0393,
+      "step": 3700
+    },
+    {
+      "epoch": 163.04,
+      "learning_rate": 0.00013795620437956203,
+      "loss": 0.0384,
+      "step": 3750
+    },
+    {
+      "epoch": 163.04,
+      "eval_cer": 0.35315985130111527,
+      "eval_loss": 2.3685200214385986,
+      "eval_runtime": 1.2136,
+      "eval_samples_per_second": 37.081,
+      "eval_steps_per_second": 2.472,
+      "step": 3750
+    },
+    {
+      "epoch": 165.22,
+      "learning_rate": 0.00013576642335766422,
+      "loss": 0.0324,
+      "step": 3800
+    },
+    {
+      "epoch": 167.39,
+      "learning_rate": 0.00013357664233576641,
+      "loss": 0.0438,
+      "step": 3850
+    },
+    {
+      "epoch": 169.57,
+      "learning_rate": 0.0001313868613138686,
+      "loss": 0.0367,
+      "step": 3900
+    },
+    {
+      "epoch": 169.57,
+      "eval_cer": 0.3469640644361834,
+      "eval_loss": 2.397036552429199,
+      "eval_runtime": 1.2259,
+      "eval_samples_per_second": 36.708,
+      "eval_steps_per_second": 2.447,
+      "step": 3900
+    },
+    {
+      "epoch": 171.74,
+      "learning_rate": 0.00012919708029197077,
+      "loss": 0.0336,
+      "step": 3950
+    },
+    {
+      "epoch": 173.91,
+      "learning_rate": 0.00012700729927007297,
+      "loss": 0.037,
+      "step": 4000
+    },
+    {
+      "epoch": 176.09,
+      "learning_rate": 0.00012481751824817516,
+      "loss": 0.0307,
+      "step": 4050
+    },
+    {
+      "epoch": 176.09,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.3530125617980957,
+      "eval_runtime": 1.2484,
+      "eval_samples_per_second": 36.047,
+      "eval_steps_per_second": 2.403,
+      "step": 4050
+    },
+    {
+      "epoch": 178.26,
+      "learning_rate": 0.00012262773722627736,
+      "loss": 0.0284,
+      "step": 4100
+    },
+    {
+      "epoch": 180.43,
+      "learning_rate": 0.00012043795620437955,
+      "loss": 0.0233,
+      "step": 4150
+    },
+    {
+      "epoch": 182.61,
+      "learning_rate": 0.00011824817518248174,
+      "loss": 0.0328,
+      "step": 4200
+    },
+    {
+      "epoch": 182.61,
+      "eval_cer": 0.33147459727385375,
+      "eval_loss": 2.3414556980133057,
+      "eval_runtime": 1.2281,
+      "eval_samples_per_second": 36.64,
+      "eval_steps_per_second": 2.443,
+      "step": 4200
+    },
+    {
+      "epoch": 184.78,
+      "learning_rate": 0.00011605839416058394,
+      "loss": 0.0285,
+      "step": 4250
+    },
+    {
+      "epoch": 186.96,
+      "learning_rate": 0.00011386861313868612,
+      "loss": 0.0222,
+      "step": 4300
+    },
+    {
+      "epoch": 189.13,
+      "learning_rate": 0.00011167883211678831,
+      "loss": 0.0271,
+      "step": 4350
+    },
+    {
+      "epoch": 189.13,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.4165024757385254,
+      "eval_runtime": 1.1891,
+      "eval_samples_per_second": 37.844,
+      "eval_steps_per_second": 2.523,
+      "step": 4350
+    },
+    {
+      "epoch": 191.3,
+      "learning_rate": 0.00010948905109489051,
+      "loss": 0.0307,
+      "step": 4400
+    },
+    {
+      "epoch": 193.48,
+      "learning_rate": 0.00010729927007299269,
+      "loss": 0.023,
+      "step": 4450
+    },
+    {
+      "epoch": 195.65,
+      "learning_rate": 0.00010510948905109488,
+      "loss": 0.0213,
+      "step": 4500
+    },
+    {
+      "epoch": 195.65,
+      "eval_cer": 0.3451053283767038,
+      "eval_loss": 2.447828769683838,
+      "eval_runtime": 1.1406,
+      "eval_samples_per_second": 39.452,
+      "eval_steps_per_second": 2.63,
+      "step": 4500
+    },
+    {
+      "epoch": 197.83,
+      "learning_rate": 0.00010291970802919708,
+      "loss": 0.021,
+      "step": 4550
+    },
+    {
+      "epoch": 200.0,
+      "learning_rate": 0.00010072992700729926,
+      "loss": 0.0246,
+      "step": 4600
+    },
+    {
+      "epoch": 202.17,
+      "learning_rate": 9.854014598540145e-05,
+      "loss": 0.0193,
+      "step": 4650
+    },
+    {
+      "epoch": 202.17,
+      "eval_cer": 0.355638166047088,
+      "eval_loss": 2.524061918258667,
+      "eval_runtime": 1.203,
+      "eval_samples_per_second": 37.406,
+      "eval_steps_per_second": 2.494,
+      "step": 4650
+    },
+    {
+      "epoch": 204.35,
+      "learning_rate": 9.635036496350364e-05,
+      "loss": 0.0223,
+      "step": 4700
+    },
+    {
+      "epoch": 206.52,
+      "learning_rate": 9.416058394160584e-05,
+      "loss": 0.0223,
+      "step": 4750
+    },
+    {
+      "epoch": 208.7,
+      "learning_rate": 9.197080291970803e-05,
+      "loss": 0.0204,
+      "step": 4800
+    },
+    {
+      "epoch": 208.7,
+      "eval_cer": 0.34634448574969023,
+      "eval_loss": 2.570009708404541,
+      "eval_runtime": 1.2664,
+      "eval_samples_per_second": 35.533,
+      "eval_steps_per_second": 2.369,
+      "step": 4800
+    },
+    {
+      "epoch": 210.87,
+      "learning_rate": 8.978102189781021e-05,
+      "loss": 0.0202,
+      "step": 4850
+    },
+    {
+      "epoch": 213.04,
+      "learning_rate": 8.759124087591239e-05,
+      "loss": 0.0193,
+      "step": 4900
+    },
+    {
+      "epoch": 215.22,
+      "learning_rate": 8.540145985401459e-05,
+      "loss": 0.0185,
+      "step": 4950
+    },
+    {
+      "epoch": 215.22,
+      "eval_cer": 0.31784386617100374,
+      "eval_loss": 2.583724021911621,
+      "eval_runtime": 1.2549,
+      "eval_samples_per_second": 35.859,
+      "eval_steps_per_second": 2.391,
+      "step": 4950
+    },
+    {
+      "epoch": 217.39,
+      "learning_rate": 8.321167883211678e-05,
+      "loss": 0.0191,
+      "step": 5000
+    },
+    {
+      "epoch": 219.57,
+      "learning_rate": 8.102189781021897e-05,
+      "loss": 0.0169,
+      "step": 5050
+    },
+    {
+      "epoch": 221.74,
+      "learning_rate": 7.883211678832117e-05,
+      "loss": 0.0161,
+      "step": 5100
+    },
+    {
+      "epoch": 221.74,
+      "eval_cer": 0.33767038413878564,
+      "eval_loss": 2.513859987258911,
+      "eval_runtime": 1.2515,
+      "eval_samples_per_second": 35.958,
+      "eval_steps_per_second": 2.397,
+      "step": 5100
+    },
+    {
+      "epoch": 223.91,
+      "learning_rate": 7.664233576642336e-05,
+      "loss": 0.0183,
+      "step": 5150
+    },
+    {
+      "epoch": 226.09,
+      "learning_rate": 7.445255474452554e-05,
+      "loss": 0.0228,
+      "step": 5200
+    },
+    {
+      "epoch": 228.26,
+      "learning_rate": 7.226277372262774e-05,
+      "loss": 0.0167,
+      "step": 5250
+    },
+    {
+      "epoch": 228.26,
+      "eval_cer": 0.3351920693928129,
+      "eval_loss": 2.5287766456604004,
+      "eval_runtime": 1.2044,
+      "eval_samples_per_second": 37.363,
+      "eval_steps_per_second": 2.491,
+      "step": 5250
+    },
+    {
+      "epoch": 230.43,
+      "learning_rate": 7.007299270072992e-05,
+      "loss": 0.0181,
+      "step": 5300
+    },
+    {
+      "epoch": 232.61,
+      "learning_rate": 6.788321167883211e-05,
+      "loss": 0.0144,
+      "step": 5350
+    },
+    {
+      "epoch": 234.78,
+      "learning_rate": 6.56934306569343e-05,
+      "loss": 0.0148,
+      "step": 5400
+    },
+    {
+      "epoch": 234.78,
+      "eval_cer": 0.338909541511772,
+      "eval_loss": 2.574066400527954,
+      "eval_runtime": 1.2534,
+      "eval_samples_per_second": 35.904,
+      "eval_steps_per_second": 2.394,
+      "step": 5400
+    },
+    {
+      "epoch": 236.96,
+      "learning_rate": 6.350364963503648e-05,
+      "loss": 0.0143,
+      "step": 5450
+    },
+    {
+      "epoch": 239.13,
+      "learning_rate": 6.131386861313868e-05,
+      "loss": 0.0197,
+      "step": 5500
+    },
+    {
+      "epoch": 241.3,
+      "learning_rate": 5.912408759124087e-05,
+      "loss": 0.0141,
+      "step": 5550
+    },
+    {
+      "epoch": 241.3,
+      "eval_cer": 0.338909541511772,
+      "eval_loss": 2.5173895359039307,
+      "eval_runtime": 1.1989,
+      "eval_samples_per_second": 37.536,
+      "eval_steps_per_second": 2.502,
+      "step": 5550
+    },
+    {
+      "epoch": 243.48,
+      "learning_rate": 5.693430656934306e-05,
+      "loss": 0.0165,
+      "step": 5600
+    },
+    {
+      "epoch": 245.65,
+      "learning_rate": 5.4744525547445253e-05,
+      "loss": 0.0127,
+      "step": 5650
+    },
+    {
+      "epoch": 247.83,
+      "learning_rate": 5.255474452554744e-05,
+      "loss": 0.0122,
+      "step": 5700
+    },
+    {
+      "epoch": 247.83,
+      "eval_cer": 0.3351920693928129,
+      "eval_loss": 2.5573315620422363,
+      "eval_runtime": 1.2363,
+      "eval_samples_per_second": 36.4,
+      "eval_steps_per_second": 2.427,
+      "step": 5700
+    },
+    {
+      "epoch": 250.0,
+      "learning_rate": 5.036496350364963e-05,
+      "loss": 0.0135,
+      "step": 5750
+    },
+    {
+      "epoch": 252.17,
+      "learning_rate": 4.817518248175182e-05,
+      "loss": 0.0116,
+      "step": 5800
+    },
+    {
+      "epoch": 254.35,
+      "learning_rate": 4.5985401459854016e-05,
+      "loss": 0.0115,
+      "step": 5850
+    },
+    {
+      "epoch": 254.35,
+      "eval_cer": 0.32961586121437425,
+      "eval_loss": 2.579023838043213,
+      "eval_runtime": 1.2327,
+      "eval_samples_per_second": 36.506,
+      "eval_steps_per_second": 2.434,
+      "step": 5850
+    },
+    {
+      "epoch": 256.52,
+      "learning_rate": 4.3795620437956196e-05,
+      "loss": 0.0141,
+      "step": 5900
+    },
+    {
+      "epoch": 258.7,
+      "learning_rate": 4.160583941605839e-05,
+      "loss": 0.0143,
+      "step": 5950
+    },
+    {
+      "epoch": 260.87,
+      "learning_rate": 3.9416058394160584e-05,
+      "loss": 0.0141,
+      "step": 6000
+    },
+    {
+      "epoch": 260.87,
+      "eval_cer": 0.32032218091697645,
+      "eval_loss": 2.577375888824463,
+      "eval_runtime": 1.2321,
+      "eval_samples_per_second": 36.524,
+      "eval_steps_per_second": 2.435,
+      "step": 6000
+    },
+    {
+      "epoch": 263.04,
+      "learning_rate": 3.722627737226277e-05,
+      "loss": 0.0116,
+      "step": 6050
+    },
+    {
+      "epoch": 265.22,
+      "learning_rate": 3.503649635036496e-05,
+      "loss": 0.0101,
+      "step": 6100
+    },
+    {
+      "epoch": 267.39,
+      "learning_rate": 3.284671532846715e-05,
+      "loss": 0.0123,
+      "step": 6150
+    },
+    {
+      "epoch": 267.39,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.614670753479004,
+      "eval_runtime": 1.1319,
+      "eval_samples_per_second": 39.755,
+      "eval_steps_per_second": 2.65,
+      "step": 6150
+    },
+    {
+      "epoch": 269.57,
+      "learning_rate": 3.065693430656934e-05,
+      "loss": 0.0151,
+      "step": 6200
+    },
+    {
+      "epoch": 271.74,
+      "learning_rate": 2.846715328467153e-05,
+      "loss": 0.0099,
+      "step": 6250
+    },
+    {
+      "epoch": 273.91,
+      "learning_rate": 2.627737226277372e-05,
+      "loss": 0.0214,
+      "step": 6300
+    },
+    {
+      "epoch": 273.91,
+      "eval_cer": 0.3302354399008674,
+      "eval_loss": 2.620166778564453,
+      "eval_runtime": 1.262,
+      "eval_samples_per_second": 35.657,
+      "eval_steps_per_second": 2.377,
+      "step": 6300
+    },
+    {
+      "epoch": 276.09,
+      "learning_rate": 2.408759124087591e-05,
+      "loss": 0.0085,
+      "step": 6350
+    },
+    {
+      "epoch": 278.26,
+      "learning_rate": 2.1897810218978098e-05,
+      "loss": 0.0119,
+      "step": 6400
+    },
+    {
+      "epoch": 280.43,
+      "learning_rate": 1.9708029197080292e-05,
+      "loss": 0.0107,
+      "step": 6450
+    },
+    {
+      "epoch": 280.43,
+      "eval_cer": 0.32342007434944237,
+      "eval_loss": 2.6263809204101562,
+      "eval_runtime": 1.2547,
+      "eval_samples_per_second": 35.867,
+      "eval_steps_per_second": 2.391,
+      "step": 6450
+    },
+    {
+      "epoch": 282.61,
+      "learning_rate": 1.751824817518248e-05,
+      "loss": 0.0107,
+      "step": 6500
+    },
+    {
+      "epoch": 284.78,
+      "learning_rate": 1.532846715328467e-05,
+      "loss": 0.0105,
+      "step": 6550
+    },
+    {
+      "epoch": 286.96,
+      "learning_rate": 1.313868613138686e-05,
+      "loss": 0.0086,
+      "step": 6600
+    },
+    {
+      "epoch": 286.96,
+      "eval_cer": 0.3215613382899628,
+      "eval_loss": 2.607461452484131,
+      "eval_runtime": 1.204,
+      "eval_samples_per_second": 37.374,
+      "eval_steps_per_second": 2.492,
+      "step": 6600
+    },
+    {
+      "epoch": 289.13,
+      "learning_rate": 1.0948905109489049e-05,
+      "loss": 0.0095,
+      "step": 6650
+    },
+    {
+      "epoch": 291.3,
+      "learning_rate": 8.75912408759124e-06,
+      "loss": 0.0108,
+      "step": 6700
+    },
+    {
+      "epoch": 293.48,
+      "learning_rate": 6.56934306569343e-06,
+      "loss": 0.0106,
+      "step": 6750
+    },
+    {
+      "epoch": 293.48,
+      "eval_cer": 0.3246592317224288,
+      "eval_loss": 2.595982789993286,
+      "eval_runtime": 1.1323,
+      "eval_samples_per_second": 39.741,
+      "eval_steps_per_second": 2.649,
+      "step": 6750
+    },
+    {
+      "epoch": 295.65,
+      "learning_rate": 4.37956204379562e-06,
+      "loss": 0.0143,
+      "step": 6800
+    },
+    {
+      "epoch": 297.83,
+      "learning_rate": 2.18978102189781e-06,
+      "loss": 0.0105,
+      "step": 6850
+    },
+    {
+      "epoch": 300.0,
+      "learning_rate": 0.0,
+      "loss": 0.0085,
+      "step": 6900
+    },
+    {
+      "epoch": 300.0,
+      "eval_cer": 0.32403965303593557,
+      "eval_loss": 2.5951595306396484,
+      "eval_runtime": 1.2068,
+      "eval_samples_per_second": 37.288,
+      "eval_steps_per_second": 2.486,
+      "step": 6900
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 6900,
+  "num_train_epochs": 300,
+  "save_steps": 150,
+  "total_flos": 2.3112928880616276e+19,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-6900/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0741fe1648758c067baeb587c00ff9d0528d818e60814b62c8d0f8ca82d1c4d
+size 4472

checkpoint-6900/vocab.json ADDED Viewed

	@@ -0,0 +1,679 @@

+{
+  "0": 1,
+  "1": 2,
+  "2": 3,
+  "3": 4,
+  "4": 5,
+  "5": 6,
+  "6": 7,
+  "7": 8,
+  "8": 9,
+  "9": 10,
+  "[PAD]": 676,
+  "[UNK]": 675,
+  "|": 0,
+  "　": 11,
+  "、": 12,
+  "。": 13,
+  "々": 14,
+  "ぁ": 15,
+  "あ": 16,
+  "い": 17,
+  "う": 18,
+  "え": 19,
+  "お": 20,
+  "か": 21,
+  "が": 22,
+  "き": 23,
+  "ぎ": 24,
+  "く": 25,
+  "ぐ": 26,
+  "け": 27,
+  "げ": 28,
+  "こ": 29,
+  "ご": 30,
+  "さ": 31,
+  "ざ": 32,
+  "し": 33,
+  "じ": 34,
+  "す": 35,
+  "ず": 36,
+  "せ": 37,
+  "ぜ": 38,
+  "そ": 39,
+  "た": 40,
+  "だ": 41,
+  "ち": 42,
+  "っ": 43,
+  "つ": 44,
+  "て": 45,
+  "で": 46,
+  "と": 47,
+  "ど": 48,
+  "な": 49,
+  "に": 50,
+  "ぬ": 51,
+  "ね": 52,
+  "の": 53,
+  "は": 54,
+  "ば": 55,
+  "ぱ": 56,
+  "ひ": 57,
+  "び": 58,
+  "ふ": 59,
+  "ぶ": 60,
+  "ぷ": 61,
+  "へ": 62,
+  "べ": 63,
+  "ほ": 64,
+  "ぼ": 65,
+  "ぽ": 66,
+  "ま": 67,
+  "み": 68,
+  "む": 69,
+  "め": 70,
+  "も": 71,
+  "ゃ": 72,
+  "や": 73,
+  "ゆ": 74,
+  "ょ": 75,
+  "よ": 76,
+  "ら": 77,
+  "り": 78,
+  "る": 79,
+  "れ": 80,
+  "ろ": 81,
+  "わ": 82,
+  "を": 83,
+  "ん": 84,
+  "ァ": 85,
+  "ア": 86,
+  "ィ": 87,
+  "イ": 88,
+  "ウ": 89,
+  "ェ": 90,
+  "エ": 91,
+  "ォ": 92,
+  "オ": 93,
+  "カ": 94,
+  "ガ": 95,
+  "キ": 96,
+  "ギ": 97,
+  "ク": 98,
+  "グ": 99,
+  "ケ": 100,
+  "ゲ": 101,
+  "コ": 102,
+  "ゴ": 103,
+  "サ": 104,
+  "ザ": 105,
+  "シ": 106,
+  "ジ": 107,
+  "ス": 108,
+  "ズ": 109,
+  "セ": 110,
+  "ソ": 111,
+  "タ": 112,
+  "ダ": 113,
+  "チ": 114,
+  "ッ": 115,
+  "ツ": 116,
+  "テ": 117,
+  "デ": 118,
+  "ト": 119,
+  "ド": 120,
+  "ナ": 121,
+  "ニ": 122,
+  "ネ": 123,
+  "ノ": 124,
+  "ハ": 125,
+  "バ": 126,
+  "パ": 127,
+  "ヒ": 128,
+  "ビ": 129,
+  "ピ": 130,
+  "フ": 131,
+  "ブ": 132,
+  "プ": 133,
+  "ベ": 134,
+  "ペ": 135,
+  "ホ": 136,
+  "ボ": 137,
+  "ポ": 138,
+  "マ": 139,
+  "ミ": 140,
+  "ム": 141,
+  "メ": 142,
+  "モ": 143,
+  "ャ": 144,
+  "ヤ": 145,
+  "ュ": 146,
+  "ヨ": 147,
+  "ラ": 148,
+  "リ": 149,
+  "ル": 150,
+  "レ": 151,
+  "ロ": 152,
+  "ワ": 153,
+  "ン": 154,
+  "ヶ": 155,
+  "ー": 156,
+  "一": 157,
+  "万": 158,
+  "丈": 159,
+  "三": 160,
+  "上": 161,
+  "下": 162,
+  "不": 163,
+  "中": 164,
+  "丸": 165,
+  "主": 166,
+  "久": 167,
+  "九": 168,
+  "乾": 169,
+  "予": 170,
+  "事": 171,
+  "二": 172,
+  "五": 173,
+  "井": 174,
+  "交": 175,
+  "京": 176,
+  "人": 177,
+  "今": 178,
+  "仏": 179,
+  "仕": 180,
+  "他": 181,
+  "付": 182,
+  "代": 183,
+  "以": 184,
+  "件": 185,
+  "企": 186,
+  "伊": 187,
+  "休": 188,
+  "会": 189,
+  "伸": 190,
+  "住": 191,
+  "体": 192,
+  "何": 193,
+  "余": 194,
+  "作": 195,
+  "使": 196,
+  "例": 197,
+  "保": 198,
+  "信": 199,
+  "俣": 200,
+  "個": 201,
+  "倒": 202,
+  "候": 203,
+  "健": 204,
+  "備": 205,
+  "元": 206,
+  "充": 207,
+  "先": 208,
+  "入": 209,
+  "全": 210,
+  "公": 211,
+  "共": 212,
+  "内": 213,
+  "円": 214,
+  "写": 215,
+  "冬": 216,
+  "冷": 217,
+  "凍": 218,
+  "出": 219,
+  "分": 220,
+  "切": 221,
+  "初": 222,
+  "到": 223,
+  "制": 224,
+  "前": 225,
+  "力": 226,
+  "加": 227,
+  "動": 228,
+  "募": 229,
+  "勧": 230,
+  "化": 231,
+  "北": 232,
+  "南": 233,
+  "厚": 234,
+  "原": 235,
+  "去": 236,
+  "参": 237,
+  "友": 238,
+  "取": 239,
+  "口": 240,
+  "古": 241,
+  "可": 242,
+  "台": 243,
+  "号": 244,
+  "司": 245,
+  "合": 246,
+  "吉": 247,
+  "吊": 248,
+  "同": 249,
+  "名": 250,
+  "吹": 251,
+  "味": 252,
+  "呼": 253,
+  "和": 254,
+  "品": 255,
+  "唇": 256,
+  "商": 257,
+  "問": 258,
+  "噌": 259,
+  "回": 260,
+  "固": 261,
+  "国": 262,
+  "園": 263,
+  "地": 264,
+  "型": 265,
+  "域": 266,
+  "報": 267,
+  "場": 268,
+  "塗": 269,
+  "増": 270,
+  "声": 271,
+  "売": 272,
+  "変": 273,
+  "夏": 274,
+  "外": 275,
+  "多": 276,
+  "大": 277,
+  "天": 278,
+  "太": 279,
+  "夫": 280,
+  "失": 281,
+  "奈": 282,
+  "奥": 283,
+  "女": 284,
+  "好": 285,
+  "始": 286,
+  "嫌": 287,
+  "嬉": 288,
+  "子": 289,
+  "存": 290,
+  "孝": 291,
+  "学": 292,
+  "定": 293,
+  "実": 294,
+  "室": 295,
+  "宮": 296,
+  "家": 297,
+  "容": 298,
+  "寝": 299,
+  "寺": 300,
+  "対": 301,
+  "小": 302,
+  "少": 303,
+  "尾": 304,
+  "局": 305,
+  "届": 306,
+  "屋": 307,
+  "山": 308,
+  "岐": 309,
+  "岡": 310,
+  "岩": 311,
+  "岳": 312,
+  "島": 313,
+  "川": 314,
+  "帰": 315,
+  "常": 316,
+  "平": 317,
+  "年": 318,
+  "幻": 319,
+  "広": 320,
+  "底": 321,
+  "店": 322,
+  "座": 323,
+  "庫": 324,
+  "弁": 325,
+  "式": 326,
+  "張": 327,
+  "強": 328,
+  "当": 329,
+  "形": 330,
+  "影": 331,
+  "待": 332,
+  "後": 333,
+  "得": 334,
+  "忘": 335,
+  "応": 336,
+  "思": 337,
+  "怠": 338,
+  "恥": 339,
+  "悪": 340,
+  "情": 341,
+  "想": 342,
+  "意": 343,
+  "愛": 344,
+  "感": 345,
+  "慢": 346,
+  "成": 347,
+  "我": 348,
+  "戦": 349,
+  "戻": 350,
+  "所": 351,
+  "手": 352,
+  "打": 353,
+  "抜": 354,
+  "押": 355,
+  "拝": 356,
+  "拶": 357,
+  "持": 358,
+  "指": 359,
+  "挨": 360,
+  "掃": 361,
+  "援": 362,
+  "教": 363,
+  "数": 364,
+  "文": 365,
+  "料": 366,
+  "断": 367,
+  "新": 368,
+  "方": 369,
+  "旗": 370,
+  "日": 371,
+  "旦": 372,
+  "早": 373,
+  "明": 374,
+  "映": 375,
+  "春": 376,
+  "昨": 377,
+  "是": 378,
+  "昼": 379,
+  "時": 380,
+  "普": 381,
+  "景": 382,
+  "晴": 383,
+  "暑": 384,
+  "暗": 385,
+  "書": 386,
+  "最": 387,
+  "月": 388,
+  "有": 389,
+  "望": 390,
+  "期": 391,
+  "木": 392,
+  "本": 393,
+  "机": 394,
+  "村": 395,
+  "来": 396,
+  "杯": 397,
+  "東": 398,
+  "林": 399,
+  "枚": 400,
+  "柴": 401,
+  "校": 402,
+  "梨": 403,
+  "棒": 404,
+  "森": 405,
+  "椿": 406,
+  "楽": 407,
+  "構": 408,
+  "横": 409,
+  "樹": 410,
+  "機": 411,
+  "欄": 412,
+  "次": 413,
+  "欲": 414,
+  "正": 415,
+  "残": 416,
+  "段": 417,
+  "母": 418,
+  "毎": 419,
+  "比": 420,
+  "毛": 421,
+  "気": 422,
+  "水": 423,
+  "汁": 424,
+  "汗": 425,
+  "況": 426,
+  "泉": 427,
+  "泊": 428,
+  "法": 429,
+  "注": 430,
+  "洋": 431,
+  "活": 432,
+  "流": 433,
+  "海": 434,
+  "消": 435,
+  "減": 436,
+  "渡": 437,
+  "温": 438,
+  "準": 439,
+  "漫": 440,
+  "激": 441,
+  "濃": 442,
+  "瀬": 443,
+  "火": 444,
+  "炎": 445,
+  "炭": 446,
+  "焚": 447,
+  "焦": 448,
+  "然": 449,
+  "焼": 450,
+  "照": 451,
+  "煮": 452,
+  "熊": 453,
+  "熱": 454,
+  "燃": 455,
+  "燕": 456,
+  "燥": 457,
+  "父": 458,
+  "物": 459,
+  "特": 460,
+  "犬": 461,
+  "状": 462,
+  "狙": 463,
+  "独": 464,
+  "狭": 465,
+  "猫": 466,
+  "獣": 467,
+  "王": 468,
+  "球": 469,
+  "理": 470,
+  "生": 471,
+  "用": 472,
+  "田": 473,
+  "甲": 474,
+  "申": 475,
+  "町": 476,
+  "画": 477,
+  "界": 478,
+  "留": 479,
+  "番": 480,
+  "疲": 481,
+  "癒": 482,
+  "発": 483,
+  "登": 484,
+  "白": 485,
+  "百": 486,
+  "的": 487,
+  "皆": 488,
+  "皿": 489,
+  "監": 490,
+  "目": 491,
+  "直": 492,
+  "相": 493,
+  "省": 494,
+  "県": 495,
+  "真": 496,
+  "督": 497,
+  "瞬": 498,
+  "知": 499,
+  "硬": 500,
+  "確": 501,
+  "礼": 502,
+  "社": 503,
+  "神": 504,
+  "福": 505,
+  "私": 506,
+  "移": 507,
+  "稲": 508,
+  "穂": 509,
+  "空": 510,
+  "立": 511,
+  "端": 512,
+  "答": 513,
+  "箇": 514,
+  "箱": 515,
+  "籍": 516,
+  "米": 517,
+  "粛": 518,
+  "精": 519,
+  "糖": 520,
+  "系": 521,
+  "納": 522,
+  "素": 523,
+  "細": 524,
+  "終": 525,
+  "結": 526,
+  "絶": 527,
+  "継": 528,
+  "綺": 529,
+  "綿": 530,
+  "緒": 531,
+  "締": 532,
+  "練": 533,
+  "縁": 534,
+  "繰": 535,
+  "缶": 536,
+  "置": 537,
+  "羊": 538,
+  "美": 539,
+  "義": 540,
+  "考": 541,
+  "者": 542,
+  "耳": 543,
+  "聞": 544,
+  "肉": 545,
+  "育": 546,
+  "腹": 547,
+  "自": 548,
+  "良": 549,
+  "色": 550,
+  "若": 551,
+  "茶": 552,
+  "荒": 553,
+  "荘": 554,
+  "荷": 555,
+  "落": 556,
+  "蔵": 557,
+  "薬": 558,
+  "蝶": 559,
+  "行": 560,
+  "街": 561,
+  "褒": 562,
+  "西": 563,
+  "要": 564,
+  "見": 565,
+  "視": 566,
+  "覧": 567,
+  "親": 568,
+  "観": 569,
+  "言": 570,
+  "記": 571,
+  "設": 572,
+  "許": 573,
+  "訳": 574,
+  "試": 575,
+  "話": 576,
+  "詳": 577,
+  "説": 578,
+  "読": 579,
+  "誰": 580,
+  "調": 581,
+  "請": 582,
+  "謝": 583,
+  "識": 584,
+  "議": 585,
+  "谷": 586,
+  "買": 587,
+  "質": 588,
+  "赤": 589,
+  "走": 590,
+  "越": 591,
+  "路": 592,
+  "身": 593,
+  "車": 594,
+  "転": 595,
+  "載": 596,
+  "辛": 597,
+  "辺": 598,
+  "込": 599,
+  "近": 600,
+  "返": 601,
+  "追": 602,
+  "途": 603,
+  "通": 604,
+  "速": 605,
+  "連": 606,
+  "週": 607,
+  "遅": 608,
+  "運": 609,
+  "過": 610,
+  "達": 611,
+  "違": 612,
+  "適": 613,
+  "選": 614,
+  "郎": 615,
+  "部": 616,
+  "配": 617,
+  "酒": 618,
+  "重": 619,
+  "野": 620,
+  "量": 621,
+  "釣": 622,
+  "録": 623,
+  "鍵": 624,
+  "長": 625,
+  "開": 626,
+  "間": 627,
+  "関": 628,
+  "閣": 629,
+  "阜": 630,
+  "降": 631,
+  "限": 632,
+  "院": 633,
+  "除": 634,
+  "陸": 635,
+  "雅": 636,
+  "集": 637,
+  "雉": 638,
+  "難": 639,
+  "雨": 640,
+  "雪": 641,
+  "電": 642,
+  "青": 643,
+  "非": 644,
+  "面": 645,
+  "音": 646,
+  "響": 647,
+  "頂": 648,
+  "頃": 649,
+  "順": 650,
+  "頼": 651,
+  "顔": 652,
+  "風": 653,
+  "食": 654,
+  "飲": 655,
+  "飼": 656,
+  "馬": 657,
+  "験": 658,
+  "驚": 659,
+  "高": 660,
+  "髪": 661,
+  "鬼": 662,
+  "鶏": 663,
+  "鹿": 664,
+  "麗": 665,
+  "！": 666,
+  "（": 667,
+  "）": 668,
+  "／": 669,
+  "１": 670,
+  "２": 671,
+  "３": 672,
+  "？": 673,
+  "ｍ": 674
+}

config.json ADDED Viewed

	@@ -0,0 +1,117 @@

+{
+  "_name_or_path": "facebook/wav2vec2-large-xlsr-53",
+  "activation_dropout": 0.0,
+  "adapter_attn_dim": null,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 768,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": true,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": true,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_dropout": 0.0,
+  "feat_extract_norm": "layer",
+  "feat_proj_dropout": 0.05,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "gradient_checkpointing": false,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.05,
+  "hidden_size": 1024,
+  "initializer_range": 0.02,
+  "intermediate_size": 4096,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.05,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "num_adapter_layers": 3,
+  "num_attention_heads": 16,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 24,
+  "num_negatives": 100,
+  "output_hidden_size": 1024,
+  "pad_token_id": 676,
+  "proj_codevector_dim": 768,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.34.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 679,
+  "xvector_output_dim": 512
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+    "epoch": 300.0,
+    "eval_cer": 0.32403965303593557,
+    "eval_loss": 2.5951595306396484,
+    "eval_runtime": 1.15,
+    "eval_samples": 45,
+    "eval_samples_per_second": 39.131,
+    "eval_steps_per_second": 2.609
+}

preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0,
+  "processor_class": "Wav2Vec2Processor",
+  "return_attention_mask": true,
+  "sampling_rate": 16000
+}

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9b61e6d7c21931997e82553ee1094451457e43f95812c2ee82aeedf4e89cd76d
+size 1264686250

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+  "additional_special_tokens": [
+    "<s>",
+    "</s>"
+  ],
+  "bos_token": "<s>",
+  "eos_token": "</s>",
+  "pad_token": "[PAD]",
+  "unk_token": "[UNK]"
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,56 @@

+{
+  "added_tokens_decoder": {
+    "675": {
+      "content": "[UNK]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "676": {
+      "content": "[PAD]",
+      "lstrip": true,
+      "normalized": false,
+      "rstrip": true,
+      "single_word": false,
+      "special": false
+    },
+    "677": {
+      "content": "<s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    },
+    "678": {
+      "content": "</s>",
+      "lstrip": false,
+      "normalized": false,
+      "rstrip": false,
+      "single_word": false,
+      "special": true
+    }
+  },
+  "additional_special_tokens": [
+    "<s>",
+    "</s>"
+  ],
+  "bos_token": "<s>",
+  "clean_up_tokenization_spaces": true,
+  "config": null,
+  "do_lower_case": false,
+  "eos_token": "</s>",
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": "[PAD]",
+  "processor_class": "Wav2Vec2Processor",
+  "replace_word_delimiter_char": " ",
+  "target_lang": null,
+  "tokenizer_class": "Wav2Vec2CTCTokenizer",
+  "tokenizer_file": null,
+  "tokenizer_type": "wav2vec2",
+  "trust_remote_code": false,
+  "unk_token": "[UNK]",
+  "word_delimiter_token": "|"
+}

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 300.0,
+    "train_loss": 0.8083851718038753,
+    "train_runtime": 4592.71,
+    "train_samples": 359,
+    "train_samples_per_second": 23.45,
+    "train_steps_per_second": 1.502
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,1270 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 300.0,
+  "eval_steps": 150,
+  "global_step": 6900,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 2.17,
+      "learning_rate": 0.0003,
+      "loss": 35.2887,
+      "step": 50
+    },
+    {
+      "epoch": 4.35,
+      "learning_rate": 0.00029781021897810217,
+      "loss": 5.9569,
+      "step": 100
+    },
+    {
+      "epoch": 6.52,
+      "learning_rate": 0.00029562043795620436,
+      "loss": 4.9138,
+      "step": 150
+    },
+    {
+      "epoch": 6.52,
+      "eval_cer": 1.0,
+      "eval_loss": 4.7965407371521,
+      "eval_runtime": 1.256,
+      "eval_samples_per_second": 35.828,
+      "eval_steps_per_second": 2.389,
+      "step": 150
+    },
+    {
+      "epoch": 8.7,
+      "learning_rate": 0.00029343065693430656,
+      "loss": 4.887,
+      "step": 200
+    },
+    {
+      "epoch": 10.87,
+      "learning_rate": 0.00029124087591240875,
+      "loss": 4.8447,
+      "step": 250
+    },
+    {
+      "epoch": 13.04,
+      "learning_rate": 0.00028905109489051094,
+      "loss": 4.7484,
+      "step": 300
+    },
+    {
+      "epoch": 13.04,
+      "eval_cer": 1.0,
+      "eval_loss": 4.608075141906738,
+      "eval_runtime": 1.2451,
+      "eval_samples_per_second": 36.142,
+      "eval_steps_per_second": 2.409,
+      "step": 300
+    },
+    {
+      "epoch": 15.22,
+      "learning_rate": 0.00028686131386861314,
+      "loss": 4.6529,
+      "step": 350
+    },
+    {
+      "epoch": 17.39,
+      "learning_rate": 0.0002846715328467153,
+      "loss": 4.6373,
+      "step": 400
+    },
+    {
+      "epoch": 19.57,
+      "learning_rate": 0.00028248175182481747,
+      "loss": 4.5894,
+      "step": 450
+    },
+    {
+      "epoch": 19.57,
+      "eval_cer": 0.9851301115241635,
+      "eval_loss": 4.469708442687988,
+      "eval_runtime": 1.2325,
+      "eval_samples_per_second": 36.51,
+      "eval_steps_per_second": 2.434,
+      "step": 450
+    },
+    {
+      "epoch": 21.74,
+      "learning_rate": 0.00028029197080291966,
+      "loss": 4.5045,
+      "step": 500
+    },
+    {
+      "epoch": 23.91,
+      "learning_rate": 0.00027810218978102186,
+      "loss": 4.4076,
+      "step": 550
+    },
+    {
+      "epoch": 26.09,
+      "learning_rate": 0.00027591240875912405,
+      "loss": 4.2024,
+      "step": 600
+    },
+    {
+      "epoch": 26.09,
+      "eval_cer": 0.9076827757125155,
+      "eval_loss": 4.037315845489502,
+      "eval_runtime": 1.2357,
+      "eval_samples_per_second": 36.417,
+      "eval_steps_per_second": 2.428,
+      "step": 600
+    },
+    {
+      "epoch": 28.26,
+      "learning_rate": 0.00027372262773722625,
+      "loss": 3.8743,
+      "step": 650
+    },
+    {
+      "epoch": 30.43,
+      "learning_rate": 0.00027153284671532844,
+      "loss": 3.3488,
+      "step": 700
+    },
+    {
+      "epoch": 32.61,
+      "learning_rate": 0.00026934306569343063,
+      "loss": 2.7314,
+      "step": 750
+    },
+    {
+      "epoch": 32.61,
+      "eval_cer": 0.5340768277571252,
+      "eval_loss": 2.5507473945617676,
+      "eval_runtime": 1.2278,
+      "eval_samples_per_second": 36.651,
+      "eval_steps_per_second": 2.443,
+      "step": 750
+    },
+    {
+      "epoch": 34.78,
+      "learning_rate": 0.00026715328467153283,
+      "loss": 2.1968,
+      "step": 800
+    },
+    {
+      "epoch": 36.96,
+      "learning_rate": 0.000264963503649635,
+      "loss": 1.6522,
+      "step": 850
+    },
+    {
+      "epoch": 39.13,
+      "learning_rate": 0.0002627737226277372,
+      "loss": 1.2293,
+      "step": 900
+    },
+    {
+      "epoch": 39.13,
+      "eval_cer": 0.4138785625774473,
+      "eval_loss": 2.01461124420166,
+      "eval_runtime": 1.2246,
+      "eval_samples_per_second": 36.746,
+      "eval_steps_per_second": 2.45,
+      "step": 900
+    },
+    {
+      "epoch": 41.3,
+      "learning_rate": 0.0002605839416058394,
+      "loss": 0.9292,
+      "step": 950
+    },
+    {
+      "epoch": 43.48,
+      "learning_rate": 0.00025839416058394155,
+      "loss": 0.7208,
+      "step": 1000
+    },
+    {
+      "epoch": 45.65,
+      "learning_rate": 0.00025620437956204374,
+      "loss": 0.5544,
+      "step": 1050
+    },
+    {
+      "epoch": 45.65,
+      "eval_cer": 0.355638166047088,
+      "eval_loss": 1.9821244478225708,
+      "eval_runtime": 1.2073,
+      "eval_samples_per_second": 37.275,
+      "eval_steps_per_second": 2.485,
+      "step": 1050
+    },
+    {
+      "epoch": 47.83,
+      "learning_rate": 0.00025401459854014594,
+      "loss": 0.4757,
+      "step": 1100
+    },
+    {
+      "epoch": 50.0,
+      "learning_rate": 0.00025182481751824813,
+      "loss": 0.3895,
+      "step": 1150
+    },
+    {
+      "epoch": 52.17,
+      "learning_rate": 0.0002496350364963503,
+      "loss": 0.3224,
+      "step": 1200
+    },
+    {
+      "epoch": 52.17,
+      "eval_cer": 0.3587360594795539,
+      "eval_loss": 2.0189881324768066,
+      "eval_runtime": 1.1983,
+      "eval_samples_per_second": 37.554,
+      "eval_steps_per_second": 2.504,
+      "step": 1200
+    },
+    {
+      "epoch": 54.35,
+      "learning_rate": 0.0002474452554744525,
+      "loss": 0.279,
+      "step": 1250
+    },
+    {
+      "epoch": 56.52,
+      "learning_rate": 0.0002452554744525547,
+      "loss": 0.2285,
+      "step": 1300
+    },
+    {
+      "epoch": 58.7,
+      "learning_rate": 0.0002430656934306569,
+      "loss": 0.1951,
+      "step": 1350
+    },
+    {
+      "epoch": 58.7,
+      "eval_cer": 0.36121437422552666,
+      "eval_loss": 2.1229116916656494,
+      "eval_runtime": 1.2603,
+      "eval_samples_per_second": 35.706,
+      "eval_steps_per_second": 2.38,
+      "step": 1350
+    },
+    {
+      "epoch": 60.87,
+      "learning_rate": 0.0002408759124087591,
+      "loss": 0.1964,
+      "step": 1400
+    },
+    {
+      "epoch": 63.04,
+      "learning_rate": 0.0002386861313868613,
+      "loss": 0.1622,
+      "step": 1450
+    },
+    {
+      "epoch": 65.22,
+      "learning_rate": 0.0002364963503649635,
+      "loss": 0.1539,
+      "step": 1500
+    },
+    {
+      "epoch": 65.22,
+      "eval_cer": 0.3469640644361834,
+      "eval_loss": 2.111368179321289,
+      "eval_runtime": 1.2194,
+      "eval_samples_per_second": 36.903,
+      "eval_steps_per_second": 2.46,
+      "step": 1500
+    },
+    {
+      "epoch": 67.39,
+      "learning_rate": 0.00023430656934306568,
+      "loss": 0.1492,
+      "step": 1550
+    },
+    {
+      "epoch": 69.57,
+      "learning_rate": 0.00023211678832116788,
+      "loss": 0.1404,
+      "step": 1600
+    },
+    {
+      "epoch": 71.74,
+      "learning_rate": 0.00022992700729927004,
+      "loss": 0.1165,
+      "step": 1650
+    },
+    {
+      "epoch": 71.74,
+      "eval_cer": 0.33147459727385375,
+      "eval_loss": 2.274796485900879,
+      "eval_runtime": 1.1874,
+      "eval_samples_per_second": 37.898,
+      "eval_steps_per_second": 2.527,
+      "step": 1650
+    },
+    {
+      "epoch": 73.91,
+      "learning_rate": 0.00022773722627737224,
+      "loss": 0.1268,
+      "step": 1700
+    },
+    {
+      "epoch": 76.09,
+      "learning_rate": 0.00022554744525547443,
+      "loss": 0.1186,
+      "step": 1750
+    },
+    {
+      "epoch": 78.26,
+      "learning_rate": 0.00022335766423357663,
+      "loss": 0.1119,
+      "step": 1800
+    },
+    {
+      "epoch": 78.26,
+      "eval_cer": 0.34882280049566294,
+      "eval_loss": 2.2390518188476562,
+      "eval_runtime": 1.3465,
+      "eval_samples_per_second": 33.42,
+      "eval_steps_per_second": 2.228,
+      "step": 1800
+    },
+    {
+      "epoch": 80.43,
+      "learning_rate": 0.00022116788321167882,
+      "loss": 0.0988,
+      "step": 1850
+    },
+    {
+      "epoch": 82.61,
+      "learning_rate": 0.00021897810218978101,
+      "loss": 0.112,
+      "step": 1900
+    },
+    {
+      "epoch": 84.78,
+      "learning_rate": 0.0002167883211678832,
+      "loss": 0.0989,
+      "step": 1950
+    },
+    {
+      "epoch": 84.78,
+      "eval_cer": 0.3382899628252788,
+      "eval_loss": 2.343754529953003,
+      "eval_runtime": 1.2055,
+      "eval_samples_per_second": 37.329,
+      "eval_steps_per_second": 2.489,
+      "step": 1950
+    },
+    {
+      "epoch": 86.96,
+      "learning_rate": 0.00021459854014598537,
+      "loss": 0.097,
+      "step": 2000
+    },
+    {
+      "epoch": 89.13,
+      "learning_rate": 0.00021240875912408757,
+      "loss": 0.0854,
+      "step": 2050
+    },
+    {
+      "epoch": 91.3,
+      "learning_rate": 0.00021021897810218976,
+      "loss": 0.0915,
+      "step": 2100
+    },
+    {
+      "epoch": 91.3,
+      "eval_cer": 0.3587360594795539,
+      "eval_loss": 2.121840000152588,
+      "eval_runtime": 1.2037,
+      "eval_samples_per_second": 37.386,
+      "eval_steps_per_second": 2.492,
+      "step": 2100
+    },
+    {
+      "epoch": 93.48,
+      "learning_rate": 0.00020802919708029196,
+      "loss": 0.078,
+      "step": 2150
+    },
+    {
+      "epoch": 95.65,
+      "learning_rate": 0.00020583941605839415,
+      "loss": 0.0857,
+      "step": 2200
+    },
+    {
+      "epoch": 97.83,
+      "learning_rate": 0.00020364963503649632,
+      "loss": 0.0721,
+      "step": 2250
+    },
+    {
+      "epoch": 97.83,
+      "eval_cer": 0.35192069392812886,
+      "eval_loss": 2.242812395095825,
+      "eval_runtime": 1.1964,
+      "eval_samples_per_second": 37.614,
+      "eval_steps_per_second": 2.508,
+      "step": 2250
+    },
+    {
+      "epoch": 100.0,
+      "learning_rate": 0.0002014598540145985,
+      "loss": 0.0799,
+      "step": 2300
+    },
+    {
+      "epoch": 102.17,
+      "learning_rate": 0.0001992700729927007,
+      "loss": 0.0798,
+      "step": 2350
+    },
+    {
+      "epoch": 104.35,
+      "learning_rate": 0.0001970802919708029,
+      "loss": 0.0742,
+      "step": 2400
+    },
+    {
+      "epoch": 104.35,
+      "eval_cer": 0.33643122676579923,
+      "eval_loss": 2.229339838027954,
+      "eval_runtime": 1.2156,
+      "eval_samples_per_second": 37.019,
+      "eval_steps_per_second": 2.468,
+      "step": 2400
+    },
+    {
+      "epoch": 106.52,
+      "learning_rate": 0.0001948905109489051,
+      "loss": 0.0692,
+      "step": 2450
+    },
+    {
+      "epoch": 108.7,
+      "learning_rate": 0.0001927007299270073,
+      "loss": 0.0664,
+      "step": 2500
+    },
+    {
+      "epoch": 110.87,
+      "learning_rate": 0.00019051094890510948,
+      "loss": 0.0629,
+      "step": 2550
+    },
+    {
+      "epoch": 110.87,
+      "eval_cer": 0.33705080545229243,
+      "eval_loss": 2.2878150939941406,
+      "eval_runtime": 1.2044,
+      "eval_samples_per_second": 37.364,
+      "eval_steps_per_second": 2.491,
+      "step": 2550
+    },
+    {
+      "epoch": 113.04,
+      "learning_rate": 0.00018832116788321167,
+      "loss": 0.0619,
+      "step": 2600
+    },
+    {
+      "epoch": 115.22,
+      "learning_rate": 0.00018613138686131387,
+      "loss": 0.0582,
+      "step": 2650
+    },
+    {
+      "epoch": 117.39,
+      "learning_rate": 0.00018394160583941606,
+      "loss": 0.0495,
+      "step": 2700
+    },
+    {
+      "epoch": 117.39,
+      "eval_cer": 0.34076827757125155,
+      "eval_loss": 2.2671637535095215,
+      "eval_runtime": 1.2039,
+      "eval_samples_per_second": 37.379,
+      "eval_steps_per_second": 2.492,
+      "step": 2700
+    },
+    {
+      "epoch": 119.57,
+      "learning_rate": 0.00018175182481751826,
+      "loss": 0.0614,
+      "step": 2750
+    },
+    {
+      "epoch": 121.74,
+      "learning_rate": 0.00017956204379562042,
+      "loss": 0.0565,
+      "step": 2800
+    },
+    {
+      "epoch": 123.91,
+      "learning_rate": 0.00017737226277372262,
+      "loss": 0.0466,
+      "step": 2850
+    },
+    {
+      "epoch": 123.91,
+      "eval_cer": 0.35254027261462206,
+      "eval_loss": 2.2532107830047607,
+      "eval_runtime": 1.3563,
+      "eval_samples_per_second": 33.179,
+      "eval_steps_per_second": 2.212,
+      "step": 2850
+    },
+    {
+      "epoch": 126.09,
+      "learning_rate": 0.00017518248175182478,
+      "loss": 0.0465,
+      "step": 2900
+    },
+    {
+      "epoch": 128.26,
+      "learning_rate": 0.00017299270072992698,
+      "loss": 0.0496,
+      "step": 2950
+    },
+    {
+      "epoch": 130.43,
+      "learning_rate": 0.00017080291970802917,
+      "loss": 0.0424,
+      "step": 3000
+    },
+    {
+      "epoch": 130.43,
+      "eval_cer": 0.32589838909541513,
+      "eval_loss": 2.2844393253326416,
+      "eval_runtime": 1.2006,
+      "eval_samples_per_second": 37.48,
+      "eval_steps_per_second": 2.499,
+      "step": 3000
+    },
+    {
+      "epoch": 132.61,
+      "learning_rate": 0.00016861313868613137,
+      "loss": 0.0483,
+      "step": 3050
+    },
+    {
+      "epoch": 134.78,
+      "learning_rate": 0.00016642335766423356,
+      "loss": 0.0488,
+      "step": 3100
+    },
+    {
+      "epoch": 136.96,
+      "learning_rate": 0.00016423357664233575,
+      "loss": 0.0446,
+      "step": 3150
+    },
+    {
+      "epoch": 136.96,
+      "eval_cer": 0.3252788104089219,
+      "eval_loss": 2.2763445377349854,
+      "eval_runtime": 1.2043,
+      "eval_samples_per_second": 37.368,
+      "eval_steps_per_second": 2.491,
+      "step": 3150
+    },
+    {
+      "epoch": 139.13,
+      "learning_rate": 0.00016204379562043795,
+      "loss": 0.0424,
+      "step": 3200
+    },
+    {
+      "epoch": 141.3,
+      "learning_rate": 0.00015985401459854014,
+      "loss": 0.0429,
+      "step": 3250
+    },
+    {
+      "epoch": 143.48,
+      "learning_rate": 0.00015766423357664234,
+      "loss": 0.0411,
+      "step": 3300
+    },
+    {
+      "epoch": 143.48,
+      "eval_cer": 0.3302354399008674,
+      "eval_loss": 2.301079034805298,
+      "eval_runtime": 1.345,
+      "eval_samples_per_second": 33.458,
+      "eval_steps_per_second": 2.231,
+      "step": 3300
+    },
+    {
+      "epoch": 145.65,
+      "learning_rate": 0.00015547445255474453,
+      "loss": 0.0392,
+      "step": 3350
+    },
+    {
+      "epoch": 147.83,
+      "learning_rate": 0.00015328467153284672,
+      "loss": 0.0426,
+      "step": 3400
+    },
+    {
+      "epoch": 150.0,
+      "learning_rate": 0.00015109489051094892,
+      "loss": 0.0419,
+      "step": 3450
+    },
+    {
+      "epoch": 150.0,
+      "eval_cer": 0.3420074349442379,
+      "eval_loss": 2.320059299468994,
+      "eval_runtime": 1.2411,
+      "eval_samples_per_second": 36.259,
+      "eval_steps_per_second": 2.417,
+      "step": 3450
+    },
+    {
+      "epoch": 152.17,
+      "learning_rate": 0.00014890510948905108,
+      "loss": 0.0386,
+      "step": 3500
+    },
+    {
+      "epoch": 154.35,
+      "learning_rate": 0.00014671532846715328,
+      "loss": 0.0402,
+      "step": 3550
+    },
+    {
+      "epoch": 156.52,
+      "learning_rate": 0.00014452554744525547,
+      "loss": 0.0333,
+      "step": 3600
+    },
+    {
+      "epoch": 156.52,
+      "eval_cer": 0.34386617100371747,
+      "eval_loss": 2.364445209503174,
+      "eval_runtime": 1.2337,
+      "eval_samples_per_second": 36.475,
+      "eval_steps_per_second": 2.432,
+      "step": 3600
+    },
+    {
+      "epoch": 158.7,
+      "learning_rate": 0.00014233576642335764,
+      "loss": 0.0434,
+      "step": 3650
+    },
+    {
+      "epoch": 160.87,
+      "learning_rate": 0.00014014598540145983,
+      "loss": 0.0393,
+      "step": 3700
+    },
+    {
+      "epoch": 163.04,
+      "learning_rate": 0.00013795620437956203,
+      "loss": 0.0384,
+      "step": 3750
+    },
+    {
+      "epoch": 163.04,
+      "eval_cer": 0.35315985130111527,
+      "eval_loss": 2.3685200214385986,
+      "eval_runtime": 1.2136,
+      "eval_samples_per_second": 37.081,
+      "eval_steps_per_second": 2.472,
+      "step": 3750
+    },
+    {
+      "epoch": 165.22,
+      "learning_rate": 0.00013576642335766422,
+      "loss": 0.0324,
+      "step": 3800
+    },
+    {
+      "epoch": 167.39,
+      "learning_rate": 0.00013357664233576641,
+      "loss": 0.0438,
+      "step": 3850
+    },
+    {
+      "epoch": 169.57,
+      "learning_rate": 0.0001313868613138686,
+      "loss": 0.0367,
+      "step": 3900
+    },
+    {
+      "epoch": 169.57,
+      "eval_cer": 0.3469640644361834,
+      "eval_loss": 2.397036552429199,
+      "eval_runtime": 1.2259,
+      "eval_samples_per_second": 36.708,
+      "eval_steps_per_second": 2.447,
+      "step": 3900
+    },
+    {
+      "epoch": 171.74,
+      "learning_rate": 0.00012919708029197077,
+      "loss": 0.0336,
+      "step": 3950
+    },
+    {
+      "epoch": 173.91,
+      "learning_rate": 0.00012700729927007297,
+      "loss": 0.037,
+      "step": 4000
+    },
+    {
+      "epoch": 176.09,
+      "learning_rate": 0.00012481751824817516,
+      "loss": 0.0307,
+      "step": 4050
+    },
+    {
+      "epoch": 176.09,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.3530125617980957,
+      "eval_runtime": 1.2484,
+      "eval_samples_per_second": 36.047,
+      "eval_steps_per_second": 2.403,
+      "step": 4050
+    },
+    {
+      "epoch": 178.26,
+      "learning_rate": 0.00012262773722627736,
+      "loss": 0.0284,
+      "step": 4100
+    },
+    {
+      "epoch": 180.43,
+      "learning_rate": 0.00012043795620437955,
+      "loss": 0.0233,
+      "step": 4150
+    },
+    {
+      "epoch": 182.61,
+      "learning_rate": 0.00011824817518248174,
+      "loss": 0.0328,
+      "step": 4200
+    },
+    {
+      "epoch": 182.61,
+      "eval_cer": 0.33147459727385375,
+      "eval_loss": 2.3414556980133057,
+      "eval_runtime": 1.2281,
+      "eval_samples_per_second": 36.64,
+      "eval_steps_per_second": 2.443,
+      "step": 4200
+    },
+    {
+      "epoch": 184.78,
+      "learning_rate": 0.00011605839416058394,
+      "loss": 0.0285,
+      "step": 4250
+    },
+    {
+      "epoch": 186.96,
+      "learning_rate": 0.00011386861313868612,
+      "loss": 0.0222,
+      "step": 4300
+    },
+    {
+      "epoch": 189.13,
+      "learning_rate": 0.00011167883211678831,
+      "loss": 0.0271,
+      "step": 4350
+    },
+    {
+      "epoch": 189.13,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.4165024757385254,
+      "eval_runtime": 1.1891,
+      "eval_samples_per_second": 37.844,
+      "eval_steps_per_second": 2.523,
+      "step": 4350
+    },
+    {
+      "epoch": 191.3,
+      "learning_rate": 0.00010948905109489051,
+      "loss": 0.0307,
+      "step": 4400
+    },
+    {
+      "epoch": 193.48,
+      "learning_rate": 0.00010729927007299269,
+      "loss": 0.023,
+      "step": 4450
+    },
+    {
+      "epoch": 195.65,
+      "learning_rate": 0.00010510948905109488,
+      "loss": 0.0213,
+      "step": 4500
+    },
+    {
+      "epoch": 195.65,
+      "eval_cer": 0.3451053283767038,
+      "eval_loss": 2.447828769683838,
+      "eval_runtime": 1.1406,
+      "eval_samples_per_second": 39.452,
+      "eval_steps_per_second": 2.63,
+      "step": 4500
+    },
+    {
+      "epoch": 197.83,
+      "learning_rate": 0.00010291970802919708,
+      "loss": 0.021,
+      "step": 4550
+    },
+    {
+      "epoch": 200.0,
+      "learning_rate": 0.00010072992700729926,
+      "loss": 0.0246,
+      "step": 4600
+    },
+    {
+      "epoch": 202.17,
+      "learning_rate": 9.854014598540145e-05,
+      "loss": 0.0193,
+      "step": 4650
+    },
+    {
+      "epoch": 202.17,
+      "eval_cer": 0.355638166047088,
+      "eval_loss": 2.524061918258667,
+      "eval_runtime": 1.203,
+      "eval_samples_per_second": 37.406,
+      "eval_steps_per_second": 2.494,
+      "step": 4650
+    },
+    {
+      "epoch": 204.35,
+      "learning_rate": 9.635036496350364e-05,
+      "loss": 0.0223,
+      "step": 4700
+    },
+    {
+      "epoch": 206.52,
+      "learning_rate": 9.416058394160584e-05,
+      "loss": 0.0223,
+      "step": 4750
+    },
+    {
+      "epoch": 208.7,
+      "learning_rate": 9.197080291970803e-05,
+      "loss": 0.0204,
+      "step": 4800
+    },
+    {
+      "epoch": 208.7,
+      "eval_cer": 0.34634448574969023,
+      "eval_loss": 2.570009708404541,
+      "eval_runtime": 1.2664,
+      "eval_samples_per_second": 35.533,
+      "eval_steps_per_second": 2.369,
+      "step": 4800
+    },
+    {
+      "epoch": 210.87,
+      "learning_rate": 8.978102189781021e-05,
+      "loss": 0.0202,
+      "step": 4850
+    },
+    {
+      "epoch": 213.04,
+      "learning_rate": 8.759124087591239e-05,
+      "loss": 0.0193,
+      "step": 4900
+    },
+    {
+      "epoch": 215.22,
+      "learning_rate": 8.540145985401459e-05,
+      "loss": 0.0185,
+      "step": 4950
+    },
+    {
+      "epoch": 215.22,
+      "eval_cer": 0.31784386617100374,
+      "eval_loss": 2.583724021911621,
+      "eval_runtime": 1.2549,
+      "eval_samples_per_second": 35.859,
+      "eval_steps_per_second": 2.391,
+      "step": 4950
+    },
+    {
+      "epoch": 217.39,
+      "learning_rate": 8.321167883211678e-05,
+      "loss": 0.0191,
+      "step": 5000
+    },
+    {
+      "epoch": 219.57,
+      "learning_rate": 8.102189781021897e-05,
+      "loss": 0.0169,
+      "step": 5050
+    },
+    {
+      "epoch": 221.74,
+      "learning_rate": 7.883211678832117e-05,
+      "loss": 0.0161,
+      "step": 5100
+    },
+    {
+      "epoch": 221.74,
+      "eval_cer": 0.33767038413878564,
+      "eval_loss": 2.513859987258911,
+      "eval_runtime": 1.2515,
+      "eval_samples_per_second": 35.958,
+      "eval_steps_per_second": 2.397,
+      "step": 5100
+    },
+    {
+      "epoch": 223.91,
+      "learning_rate": 7.664233576642336e-05,
+      "loss": 0.0183,
+      "step": 5150
+    },
+    {
+      "epoch": 226.09,
+      "learning_rate": 7.445255474452554e-05,
+      "loss": 0.0228,
+      "step": 5200
+    },
+    {
+      "epoch": 228.26,
+      "learning_rate": 7.226277372262774e-05,
+      "loss": 0.0167,
+      "step": 5250
+    },
+    {
+      "epoch": 228.26,
+      "eval_cer": 0.3351920693928129,
+      "eval_loss": 2.5287766456604004,
+      "eval_runtime": 1.2044,
+      "eval_samples_per_second": 37.363,
+      "eval_steps_per_second": 2.491,
+      "step": 5250
+    },
+    {
+      "epoch": 230.43,
+      "learning_rate": 7.007299270072992e-05,
+      "loss": 0.0181,
+      "step": 5300
+    },
+    {
+      "epoch": 232.61,
+      "learning_rate": 6.788321167883211e-05,
+      "loss": 0.0144,
+      "step": 5350
+    },
+    {
+      "epoch": 234.78,
+      "learning_rate": 6.56934306569343e-05,
+      "loss": 0.0148,
+      "step": 5400
+    },
+    {
+      "epoch": 234.78,
+      "eval_cer": 0.338909541511772,
+      "eval_loss": 2.574066400527954,
+      "eval_runtime": 1.2534,
+      "eval_samples_per_second": 35.904,
+      "eval_steps_per_second": 2.394,
+      "step": 5400
+    },
+    {
+      "epoch": 236.96,
+      "learning_rate": 6.350364963503648e-05,
+      "loss": 0.0143,
+      "step": 5450
+    },
+    {
+      "epoch": 239.13,
+      "learning_rate": 6.131386861313868e-05,
+      "loss": 0.0197,
+      "step": 5500
+    },
+    {
+      "epoch": 241.3,
+      "learning_rate": 5.912408759124087e-05,
+      "loss": 0.0141,
+      "step": 5550
+    },
+    {
+      "epoch": 241.3,
+      "eval_cer": 0.338909541511772,
+      "eval_loss": 2.5173895359039307,
+      "eval_runtime": 1.1989,
+      "eval_samples_per_second": 37.536,
+      "eval_steps_per_second": 2.502,
+      "step": 5550
+    },
+    {
+      "epoch": 243.48,
+      "learning_rate": 5.693430656934306e-05,
+      "loss": 0.0165,
+      "step": 5600
+    },
+    {
+      "epoch": 245.65,
+      "learning_rate": 5.4744525547445253e-05,
+      "loss": 0.0127,
+      "step": 5650
+    },
+    {
+      "epoch": 247.83,
+      "learning_rate": 5.255474452554744e-05,
+      "loss": 0.0122,
+      "step": 5700
+    },
+    {
+      "epoch": 247.83,
+      "eval_cer": 0.3351920693928129,
+      "eval_loss": 2.5573315620422363,
+      "eval_runtime": 1.2363,
+      "eval_samples_per_second": 36.4,
+      "eval_steps_per_second": 2.427,
+      "step": 5700
+    },
+    {
+      "epoch": 250.0,
+      "learning_rate": 5.036496350364963e-05,
+      "loss": 0.0135,
+      "step": 5750
+    },
+    {
+      "epoch": 252.17,
+      "learning_rate": 4.817518248175182e-05,
+      "loss": 0.0116,
+      "step": 5800
+    },
+    {
+      "epoch": 254.35,
+      "learning_rate": 4.5985401459854016e-05,
+      "loss": 0.0115,
+      "step": 5850
+    },
+    {
+      "epoch": 254.35,
+      "eval_cer": 0.32961586121437425,
+      "eval_loss": 2.579023838043213,
+      "eval_runtime": 1.2327,
+      "eval_samples_per_second": 36.506,
+      "eval_steps_per_second": 2.434,
+      "step": 5850
+    },
+    {
+      "epoch": 256.52,
+      "learning_rate": 4.3795620437956196e-05,
+      "loss": 0.0141,
+      "step": 5900
+    },
+    {
+      "epoch": 258.7,
+      "learning_rate": 4.160583941605839e-05,
+      "loss": 0.0143,
+      "step": 5950
+    },
+    {
+      "epoch": 260.87,
+      "learning_rate": 3.9416058394160584e-05,
+      "loss": 0.0141,
+      "step": 6000
+    },
+    {
+      "epoch": 260.87,
+      "eval_cer": 0.32032218091697645,
+      "eval_loss": 2.577375888824463,
+      "eval_runtime": 1.2321,
+      "eval_samples_per_second": 36.524,
+      "eval_steps_per_second": 2.435,
+      "step": 6000
+    },
+    {
+      "epoch": 263.04,
+      "learning_rate": 3.722627737226277e-05,
+      "loss": 0.0116,
+      "step": 6050
+    },
+    {
+      "epoch": 265.22,
+      "learning_rate": 3.503649635036496e-05,
+      "loss": 0.0101,
+      "step": 6100
+    },
+    {
+      "epoch": 267.39,
+      "learning_rate": 3.284671532846715e-05,
+      "loss": 0.0123,
+      "step": 6150
+    },
+    {
+      "epoch": 267.39,
+      "eval_cer": 0.3308550185873606,
+      "eval_loss": 2.614670753479004,
+      "eval_runtime": 1.1319,
+      "eval_samples_per_second": 39.755,
+      "eval_steps_per_second": 2.65,
+      "step": 6150
+    },
+    {
+      "epoch": 269.57,
+      "learning_rate": 3.065693430656934e-05,
+      "loss": 0.0151,
+      "step": 6200
+    },
+    {
+      "epoch": 271.74,
+      "learning_rate": 2.846715328467153e-05,
+      "loss": 0.0099,
+      "step": 6250
+    },
+    {
+      "epoch": 273.91,
+      "learning_rate": 2.627737226277372e-05,
+      "loss": 0.0214,
+      "step": 6300
+    },
+    {
+      "epoch": 273.91,
+      "eval_cer": 0.3302354399008674,
+      "eval_loss": 2.620166778564453,
+      "eval_runtime": 1.262,
+      "eval_samples_per_second": 35.657,
+      "eval_steps_per_second": 2.377,
+      "step": 6300
+    },
+    {
+      "epoch": 276.09,
+      "learning_rate": 2.408759124087591e-05,
+      "loss": 0.0085,
+      "step": 6350
+    },
+    {
+      "epoch": 278.26,
+      "learning_rate": 2.1897810218978098e-05,
+      "loss": 0.0119,
+      "step": 6400
+    },
+    {
+      "epoch": 280.43,
+      "learning_rate": 1.9708029197080292e-05,
+      "loss": 0.0107,
+      "step": 6450
+    },
+    {
+      "epoch": 280.43,
+      "eval_cer": 0.32342007434944237,
+      "eval_loss": 2.6263809204101562,
+      "eval_runtime": 1.2547,
+      "eval_samples_per_second": 35.867,
+      "eval_steps_per_second": 2.391,
+      "step": 6450
+    },
+    {
+      "epoch": 282.61,
+      "learning_rate": 1.751824817518248e-05,
+      "loss": 0.0107,
+      "step": 6500
+    },
+    {
+      "epoch": 284.78,
+      "learning_rate": 1.532846715328467e-05,
+      "loss": 0.0105,
+      "step": 6550
+    },
+    {
+      "epoch": 286.96,
+      "learning_rate": 1.313868613138686e-05,
+      "loss": 0.0086,
+      "step": 6600
+    },
+    {
+      "epoch": 286.96,
+      "eval_cer": 0.3215613382899628,
+      "eval_loss": 2.607461452484131,
+      "eval_runtime": 1.204,
+      "eval_samples_per_second": 37.374,
+      "eval_steps_per_second": 2.492,
+      "step": 6600
+    },
+    {
+      "epoch": 289.13,
+      "learning_rate": 1.0948905109489049e-05,
+      "loss": 0.0095,
+      "step": 6650
+    },
+    {
+      "epoch": 291.3,
+      "learning_rate": 8.75912408759124e-06,
+      "loss": 0.0108,
+      "step": 6700
+    },
+    {
+      "epoch": 293.48,
+      "learning_rate": 6.56934306569343e-06,
+      "loss": 0.0106,
+      "step": 6750
+    },
+    {
+      "epoch": 293.48,
+      "eval_cer": 0.3246592317224288,
+      "eval_loss": 2.595982789993286,
+      "eval_runtime": 1.1323,
+      "eval_samples_per_second": 39.741,
+      "eval_steps_per_second": 2.649,
+      "step": 6750
+    },
+    {
+      "epoch": 295.65,
+      "learning_rate": 4.37956204379562e-06,
+      "loss": 0.0143,
+      "step": 6800
+    },
+    {
+      "epoch": 297.83,
+      "learning_rate": 2.18978102189781e-06,
+      "loss": 0.0105,
+      "step": 6850
+    },
+    {
+      "epoch": 300.0,
+      "learning_rate": 0.0,
+      "loss": 0.0085,
+      "step": 6900
+    },
+    {
+      "epoch": 300.0,
+      "eval_cer": 0.32403965303593557,
+      "eval_loss": 2.5951595306396484,
+      "eval_runtime": 1.2068,
+      "eval_samples_per_second": 37.288,
+      "eval_steps_per_second": 2.486,
+      "step": 6900
+    },
+    {
+      "epoch": 300.0,
+      "step": 6900,
+      "total_flos": 2.3112928880616276e+19,
+      "train_loss": 0.8083851718038753,
+      "train_runtime": 4592.71,
+      "train_samples_per_second": 23.45,
+      "train_steps_per_second": 1.502
+    }
+  ],
+  "logging_steps": 50,
+  "max_steps": 6900,
+  "num_train_epochs": 300,
+  "save_steps": 150,
+  "total_flos": 2.3112928880616276e+19,
+  "trial_name": null,
+  "trial_params": null
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c0741fe1648758c067baeb587c00ff9d0528d818e60814b62c8d0f8ca82d1c4d
+size 4472

vocab.json ADDED Viewed

	@@ -0,0 +1,679 @@

+{
+  "0": 1,
+  "1": 2,
+  "2": 3,
+  "3": 4,
+  "4": 5,
+  "5": 6,
+  "6": 7,
+  "7": 8,
+  "8": 9,
+  "9": 10,
+  "[PAD]": 676,
+  "[UNK]": 675,
+  "|": 0,
+  "　": 11,
+  "、": 12,
+  "。": 13,
+  "々": 14,
+  "ぁ": 15,
+  "あ": 16,
+  "い": 17,
+  "う": 18,
+  "え": 19,
+  "お": 20,
+  "か": 21,
+  "が": 22,
+  "き": 23,
+  "ぎ": 24,
+  "く": 25,
+  "ぐ": 26,
+  "け": 27,
+  "げ": 28,
+  "こ": 29,
+  "ご": 30,
+  "さ": 31,
+  "ざ": 32,
+  "し": 33,
+  "じ": 34,
+  "す": 35,
+  "ず": 36,
+  "せ": 37,
+  "ぜ": 38,
+  "そ": 39,
+  "た": 40,
+  "だ": 41,
+  "ち": 42,
+  "っ": 43,
+  "つ": 44,
+  "て": 45,
+  "で": 46,
+  "と": 47,
+  "ど": 48,
+  "な": 49,
+  "に": 50,
+  "ぬ": 51,
+  "ね": 52,
+  "の": 53,
+  "は": 54,
+  "ば": 55,
+  "ぱ": 56,
+  "ひ": 57,
+  "び": 58,
+  "ふ": 59,
+  "ぶ": 60,
+  "ぷ": 61,
+  "へ": 62,
+  "べ": 63,
+  "ほ": 64,
+  "ぼ": 65,
+  "ぽ": 66,
+  "ま": 67,
+  "み": 68,
+  "む": 69,
+  "め": 70,
+  "も": 71,
+  "ゃ": 72,
+  "や": 73,
+  "ゆ": 74,
+  "ょ": 75,
+  "よ": 76,
+  "ら": 77,
+  "り": 78,
+  "る": 79,
+  "れ": 80,
+  "ろ": 81,
+  "わ": 82,
+  "を": 83,
+  "ん": 84,
+  "ァ": 85,
+  "ア": 86,
+  "ィ": 87,
+  "イ": 88,
+  "ウ": 89,
+  "ェ": 90,
+  "エ": 91,
+  "ォ": 92,
+  "オ": 93,
+  "カ": 94,
+  "ガ": 95,
+  "キ": 96,
+  "ギ": 97,
+  "ク": 98,
+  "グ": 99,
+  "ケ": 100,
+  "ゲ": 101,
+  "コ": 102,
+  "ゴ": 103,
+  "サ": 104,
+  "ザ": 105,
+  "シ": 106,
+  "ジ": 107,
+  "ス": 108,
+  "ズ": 109,
+  "セ": 110,
+  "ソ": 111,
+  "タ": 112,
+  "ダ": 113,
+  "チ": 114,
+  "ッ": 115,
+  "ツ": 116,
+  "テ": 117,
+  "デ": 118,
+  "ト": 119,
+  "ド": 120,
+  "ナ": 121,
+  "ニ": 122,
+  "ネ": 123,
+  "ノ": 124,
+  "ハ": 125,
+  "バ": 126,
+  "パ": 127,
+  "ヒ": 128,
+  "ビ": 129,
+  "ピ": 130,
+  "フ": 131,
+  "ブ": 132,
+  "プ": 133,
+  "ベ": 134,
+  "ペ": 135,
+  "ホ": 136,
+  "ボ": 137,
+  "ポ": 138,
+  "マ": 139,
+  "ミ": 140,
+  "ム": 141,
+  "メ": 142,
+  "モ": 143,
+  "ャ": 144,
+  "ヤ": 145,
+  "ュ": 146,
+  "ヨ": 147,
+  "ラ": 148,
+  "リ": 149,
+  "ル": 150,
+  "レ": 151,
+  "ロ": 152,
+  "ワ": 153,
+  "ン": 154,
+  "ヶ": 155,
+  "ー": 156,
+  "一": 157,
+  "万": 158,
+  "丈": 159,
+  "三": 160,
+  "上": 161,
+  "下": 162,
+  "不": 163,
+  "中": 164,
+  "丸": 165,
+  "主": 166,
+  "久": 167,
+  "九": 168,
+  "乾": 169,
+  "予": 170,
+  "事": 171,
+  "二": 172,
+  "五": 173,
+  "井": 174,
+  "交": 175,
+  "京": 176,
+  "人": 177,
+  "今": 178,
+  "仏": 179,
+  "仕": 180,
+  "他": 181,
+  "付": 182,
+  "代": 183,
+  "以": 184,
+  "件": 185,
+  "企": 186,
+  "伊": 187,
+  "休": 188,
+  "会": 189,
+  "伸": 190,
+  "住": 191,
+  "体": 192,
+  "何": 193,
+  "余": 194,
+  "作": 195,
+  "使": 196,
+  "例": 197,
+  "保": 198,
+  "信": 199,
+  "俣": 200,
+  "個": 201,
+  "倒": 202,
+  "候": 203,
+  "健": 204,
+  "備": 205,
+  "元": 206,
+  "充": 207,
+  "先": 208,
+  "入": 209,
+  "全": 210,
+  "公": 211,
+  "共": 212,
+  "内": 213,
+  "円": 214,
+  "写": 215,
+  "冬": 216,
+  "冷": 217,
+  "凍": 218,
+  "出": 219,
+  "分": 220,
+  "切": 221,
+  "初": 222,
+  "到": 223,
+  "制": 224,
+  "前": 225,
+  "力": 226,
+  "加": 227,
+  "動": 228,
+  "募": 229,
+  "勧": 230,
+  "化": 231,
+  "北": 232,
+  "南": 233,
+  "厚": 234,
+  "原": 235,
+  "去": 236,
+  "参": 237,
+  "友": 238,
+  "取": 239,
+  "口": 240,
+  "古": 241,
+  "可": 242,
+  "台": 243,
+  "号": 244,
+  "司": 245,
+  "合": 246,
+  "吉": 247,
+  "吊": 248,
+  "同": 249,
+  "名": 250,
+  "吹": 251,
+  "味": 252,
+  "呼": 253,
+  "和": 254,
+  "品": 255,
+  "唇": 256,
+  "商": 257,
+  "問": 258,
+  "噌": 259,
+  "回": 260,
+  "固": 261,
+  "国": 262,
+  "園": 263,
+  "地": 264,
+  "型": 265,
+  "域": 266,
+  "報": 267,
+  "場": 268,
+  "塗": 269,
+  "増": 270,
+  "声": 271,
+  "売": 272,
+  "変": 273,
+  "夏": 274,
+  "外": 275,
+  "多": 276,
+  "大": 277,
+  "天": 278,
+  "太": 279,
+  "夫": 280,
+  "失": 281,
+  "奈": 282,
+  "奥": 283,
+  "女": 284,
+  "好": 285,
+  "始": 286,
+  "嫌": 287,
+  "嬉": 288,
+  "子": 289,
+  "存": 290,
+  "孝": 291,
+  "学": 292,
+  "定": 293,
+  "実": 294,
+  "室": 295,
+  "宮": 296,
+  "家": 297,
+  "容": 298,
+  "寝": 299,
+  "寺": 300,
+  "対": 301,
+  "小": 302,
+  "少": 303,
+  "尾": 304,
+  "局": 305,
+  "届": 306,
+  "屋": 307,
+  "山": 308,
+  "岐": 309,
+  "岡": 310,
+  "岩": 311,
+  "岳": 312,
+  "島": 313,
+  "川": 314,
+  "帰": 315,
+  "常": 316,
+  "平": 317,
+  "年": 318,
+  "幻": 319,
+  "広": 320,
+  "底": 321,
+  "店": 322,
+  "座": 323,
+  "庫": 324,
+  "弁": 325,
+  "式": 326,
+  "張": 327,
+  "強": 328,
+  "当": 329,
+  "形": 330,
+  "影": 331,
+  "待": 332,
+  "後": 333,
+  "得": 334,
+  "忘": 335,
+  "応": 336,
+  "思": 337,
+  "怠": 338,
+  "恥": 339,
+  "悪": 340,
+  "情": 341,
+  "想": 342,
+  "意": 343,
+  "愛": 344,
+  "感": 345,
+  "慢": 346,
+  "成": 347,
+  "我": 348,
+  "戦": 349,
+  "戻": 350,
+  "所": 351,
+  "手": 352,
+  "打": 353,
+  "抜": 354,
+  "押": 355,
+  "拝": 356,
+  "拶": 357,
+  "持": 358,
+  "指": 359,
+  "挨": 360,
+  "掃": 361,
+  "援": 362,
+  "教": 363,
+  "数": 364,
+  "文": 365,
+  "料": 366,
+  "断": 367,
+  "新": 368,
+  "方": 369,
+  "旗": 370,
+  "日": 371,
+  "旦": 372,
+  "早": 373,
+  "明": 374,
+  "映": 375,
+  "春": 376,
+  "昨": 377,
+  "是": 378,
+  "昼": 379,
+  "時": 380,
+  "普": 381,
+  "景": 382,
+  "晴": 383,
+  "暑": 384,
+  "暗": 385,
+  "書": 386,
+  "最": 387,
+  "月": 388,
+  "有": 389,
+  "望": 390,
+  "期": 391,
+  "木": 392,
+  "本": 393,
+  "机": 394,
+  "村": 395,
+  "来": 396,
+  "杯": 397,
+  "東": 398,
+  "林": 399,
+  "枚": 400,
+  "柴": 401,
+  "校": 402,
+  "梨": 403,
+  "棒": 404,
+  "森": 405,
+  "椿": 406,
+  "楽": 407,
+  "構": 408,
+  "横": 409,
+  "樹": 410,
+  "機": 411,
+  "欄": 412,
+  "次": 413,
+  "欲": 414,
+  "正": 415,
+  "残": 416,
+  "段": 417,
+  "母": 418,
+  "毎": 419,
+  "比": 420,
+  "毛": 421,
+  "気": 422,
+  "水": 423,
+  "汁": 424,
+  "汗": 425,
+  "況": 426,
+  "泉": 427,
+  "泊": 428,
+  "法": 429,
+  "注": 430,
+  "洋": 431,
+  "活": 432,
+  "流": 433,
+  "海": 434,
+  "消": 435,
+  "減": 436,
+  "渡": 437,
+  "温": 438,
+  "準": 439,
+  "漫": 440,
+  "激": 441,
+  "濃": 442,
+  "瀬": 443,
+  "火": 444,
+  "炎": 445,
+  "炭": 446,
+  "焚": 447,
+  "焦": 448,
+  "然": 449,
+  "焼": 450,
+  "照": 451,
+  "煮": 452,
+  "熊": 453,
+  "熱": 454,
+  "燃": 455,
+  "燕": 456,
+  "燥": 457,
+  "父": 458,
+  "物": 459,
+  "特": 460,
+  "犬": 461,
+  "状": 462,
+  "狙": 463,
+  "独": 464,
+  "狭": 465,
+  "猫": 466,
+  "獣": 467,
+  "王": 468,
+  "球": 469,
+  "理": 470,
+  "生": 471,
+  "用": 472,
+  "田": 473,
+  "甲": 474,
+  "申": 475,
+  "町": 476,
+  "画": 477,
+  "界": 478,
+  "留": 479,
+  "番": 480,
+  "疲": 481,
+  "癒": 482,
+  "発": 483,
+  "登": 484,
+  "白": 485,
+  "百": 486,
+  "的": 487,
+  "皆": 488,
+  "皿": 489,
+  "監": 490,
+  "目": 491,
+  "直": 492,
+  "相": 493,
+  "省": 494,
+  "県": 495,
+  "真": 496,
+  "督": 497,
+  "瞬": 498,
+  "知": 499,
+  "硬": 500,
+  "確": 501,
+  "礼": 502,
+  "社": 503,
+  "神": 504,
+  "福": 505,
+  "私": 506,
+  "移": 507,
+  "稲": 508,
+  "穂": 509,
+  "空": 510,
+  "立": 511,
+  "端": 512,
+  "答": 513,
+  "箇": 514,
+  "箱": 515,
+  "籍": 516,
+  "米": 517,
+  "粛": 518,
+  "精": 519,
+  "糖": 520,
+  "系": 521,
+  "納": 522,
+  "素": 523,
+  "細": 524,
+  "終": 525,
+  "結": 526,
+  "絶": 527,
+  "継": 528,
+  "綺": 529,
+  "綿": 530,
+  "緒": 531,
+  "締": 532,
+  "練": 533,
+  "縁": 534,
+  "繰": 535,
+  "缶": 536,
+  "置": 537,
+  "羊": 538,
+  "美": 539,
+  "義": 540,
+  "考": 541,
+  "者": 542,
+  "耳": 543,
+  "聞": 544,
+  "肉": 545,
+  "育": 546,
+  "腹": 547,
+  "自": 548,
+  "良": 549,
+  "色": 550,
+  "若": 551,
+  "茶": 552,
+  "荒": 553,
+  "荘": 554,
+  "荷": 555,
+  "落": 556,
+  "蔵": 557,
+  "薬": 558,
+  "蝶": 559,
+  "行": 560,
+  "街": 561,
+  "褒": 562,
+  "西": 563,
+  "要": 564,
+  "見": 565,
+  "視": 566,
+  "覧": 567,
+  "親": 568,
+  "観": 569,
+  "言": 570,
+  "記": 571,
+  "設": 572,
+  "許": 573,
+  "訳": 574,
+  "試": 575,
+  "話": 576,
+  "詳": 577,
+  "説": 578,
+  "読": 579,
+  "誰": 580,
+  "調": 581,
+  "請": 582,
+  "謝": 583,
+  "識": 584,
+  "議": 585,
+  "谷": 586,
+  "買": 587,
+  "質": 588,
+  "赤": 589,
+  "走": 590,
+  "越": 591,
+  "路": 592,
+  "身": 593,
+  "車": 594,
+  "転": 595,
+  "載": 596,
+  "辛": 597,
+  "辺": 598,
+  "込": 599,
+  "近": 600,
+  "返": 601,
+  "追": 602,
+  "途": 603,
+  "通": 604,
+  "速": 605,
+  "連": 606,
+  "週": 607,
+  "遅": 608,
+  "運": 609,
+  "過": 610,
+  "達": 611,
+  "違": 612,
+  "適": 613,
+  "選": 614,
+  "郎": 615,
+  "部": 616,
+  "配": 617,
+  "酒": 618,
+  "重": 619,
+  "野": 620,
+  "量": 621,
+  "釣": 622,
+  "録": 623,
+  "鍵": 624,
+  "長": 625,
+  "開": 626,
+  "間": 627,
+  "関": 628,
+  "閣": 629,
+  "阜": 630,
+  "降": 631,
+  "限": 632,
+  "院": 633,
+  "除": 634,
+  "陸": 635,
+  "雅": 636,
+  "集": 637,
+  "雉": 638,
+  "難": 639,
+  "雨": 640,
+  "雪": 641,
+  "電": 642,
+  "青": 643,
+  "非": 644,
+  "面": 645,
+  "音": 646,
+  "響": 647,
+  "頂": 648,
+  "頃": 649,
+  "順": 650,
+  "頼": 651,
+  "顔": 652,
+  "風": 653,
+  "食": 654,
+  "飲": 655,
+  "飼": 656,
+  "馬": 657,
+  "験": 658,
+  "驚": 659,
+  "高": 660,
+  "髪": 661,
+  "鬼": 662,
+  "鶏": 663,
+  "鹿": 664,
+  "麗": 665,
+  "！": 666,
+  "（": 667,
+  "）": 668,
+  "／": 669,
+  "１": 670,
+  "２": 671,
+  "３": 672,
+  "？": 673,
+  "ｍ": 674
+}