vumichien
/

wav2vec2-large-xlsr-japanese

Automatic Speech Recognition

xlsr-fine-tuning-week

Inference Endpoints

Model card Files Files and versions Community

patrickvonplaten commited on Mar 30, 2021

Commit

9965f67

•

1 Parent(s): 521ad3f

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -34,13 +34,13 @@ The model can be used directly (without a language model) as follows:
 import torch
 import torchaudio
 import librosa
-from datasets import load_dataset
 import MeCab
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 # config
 wakati = MeCab.Tagger("-Owakati")
-chars_to_ignore_regex = '[\\,\\、\\。\\．\\「\\」\\…\\？\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test[:2%]")
@@ -79,7 +79,7 @@ from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 #config
 wakati = MeCab.Tagger("-Owakati")
-chars_to_ignore_regex = '[\\,\\、\\。\\．\\「\\」\\…\\？\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test")

 import torch
 import torchaudio
 import librosa
+from datasets import load_dataset, load_metric
 import MeCab
 from transformers import Wav2Vec2ForCTC, Wav2Vec2Processor
 # config
 wakati = MeCab.Tagger("-Owakati")
+chars_to_ignore_regex = '[\\\\,\\\\、\\\\。\\\\．\\\\「\\\\」\\\\…\\\\？\\\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test[:2%]")
 #config
 wakati = MeCab.Tagger("-Owakati")
+chars_to_ignore_regex = '[\\\\,\\\\、\\\\。\\\\．\\\\「\\\\」\\\\…\\\\？\\\\・]'
 # load data, processor and model
 test_dataset = load_dataset("common_voice", "ja", split="test")