Spaces:

truongghieu
/

voice_regconition

Sleeping

truongghieu commited on Dec 10, 2023

Commit

9035dc4

•

1 Parent(s): b576a68

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,10 +4,10 @@ import numpy as np
 def recognize_speech(audio_data):
     audio_data = sr.AudioData(audio_data, sample_rate=16000,sample_width=2).get_wav_data(convert_rate=16000, convert_width=2)
     recognizer = sr.Recognizer()
     try:
         text = recognizer.recognize_google(audio_data)
         return f"Recognized Speech: {text}"
@@ -16,5 +16,7 @@ def recognize_speech(audio_data):
     except sr.RequestError as e:
         return f"Could not request results from Google Speech Recognition service; {e}"
-iface = gr.Interface(fn=recognize_speech, inputs="microphone", outputs="text")
 iface.launch()

 def recognize_speech(audio_data):
+    # nontype to numpy array
+    audio_data = np.frombuffer(audio_data, dtype=np.int16)
     audio_data = sr.AudioData(audio_data, sample_rate=16000,sample_width=2).get_wav_data(convert_rate=16000, convert_width=2)
     recognizer = sr.Recognizer()
     try:
         text = recognizer.recognize_google(audio_data)
         return f"Recognized Speech: {text}"
     except sr.RequestError as e:
         return f"Could not request results from Google Speech Recognition service; {e}"
+input_audio = gr.Audio(source="microphone", type="numpy", label="Recording", optional=False)
+iface = gr.Interface(fn=recognize_speech, inputs=input_audio, outputs="text")
 iface.launch()