Spaces:

formospeech
/

taiwanese-hakka-kaldi

Sleeping

txya900619 commited on Apr 26

Commit

4902da8

•

1 Parent(s): 7b59ebe

fix: multi channel audio can't recog bug

Files changed (1) hide show

app.py CHANGED Viewed

@@ -16,6 +16,9 @@ models_config = OmegaConf.to_object(OmegaConf.load("configs/models.yaml"))
 def automatic_speech_recognition(model_id: str, dialect_id: str, audio_data: str):
     model = models_config[model_id]["model"][dialect_id]
     sample_rate, audio_array = audio_data
     audio_bytes = audio_array.tobytes()
     rec = KaldiRecognizer(model, sample_rate)
@@ -100,8 +103,8 @@ with demo:
         # 臺灣客語語音辨識系統
         ### Taiwanese Hakka Automatic-Speech-Recognition System
         ### 研發
-        - **[李鴻欣 Hung-Shin Lee](mailto:hungshinlee@gmail.com)（諾思資訊 North Co., Ltd.）**
-        - **[陳力瑋 Li-Wei Chen](mailto:wayne900619@gmail.com)（諾思資訊 North Co., Ltd.）**
         """
     )
     gr.Interface(
@@ -112,6 +115,7 @@ with demo:
             gr.Audio(
                 label="上傳或錄音",
                 type="numpy",
                 waveform_options=gr.WaveformOptions(
                     sample_rate=16000,
                 ),

 def automatic_speech_recognition(model_id: str, dialect_id: str, audio_data: str):
     model = models_config[model_id]["model"][dialect_id]
     sample_rate, audio_array = audio_data
+    if audio_array.ndim == 2:
+        audio_array = audio_array[:, 0]
     audio_bytes = audio_array.tobytes()
     rec = KaldiRecognizer(model, sample_rate)
         # 臺灣客語語音辨識系統
         ### Taiwanese Hakka Automatic-Speech-Recognition System
         ### 研發
+        - **[李鴻欣 Hung-Shin Lee](mailto:hungshinlee@gmail.com)（聯和科創 United Link Co., Ltd.）**
+        - **[陳力瑋 Li-Wei Chen](mailto:wayne900619@gmail.com)（聯和科創 United Link Co., Ltd.）**
         """
     )
     gr.Interface(
             gr.Audio(
                 label="上傳或錄音",
                 type="numpy",
+                format="wav",
                 waveform_options=gr.WaveformOptions(
                     sample_rate=16000,
                 ),