Spaces:

antonbol
/

finetune_whisper

Runtime error

antonbol commited on Dec 6, 2022

Commit

0fc26e1

1 Parent(s): 0bd7f19

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,14 +5,8 @@ from PIL import Image
 pipe = pipeline(model="fimster/whisper-small-sv-SE")  # change to "your-username/the-name-you-picked"
 images = ["katt", "melon", "hund", "banan"]
 image = random.choice(images)
-# query_image = Image.open("./images/" + image + ".jpeg")
-with gr.Blocks() as demo:
-    with gr.Row():
-        gr.Label("Vad är detta? Spela in ditt svar med inspelningsknappen!")
-        input_img = gr.Image("./images/" + image + ".jpeg")
-demo.launch()
-def transcribe(audio):
     text = pipe(audio)["text"]
     returntext = ""
     if text.lower() != image.lower():
@@ -23,7 +17,7 @@ def transcribe(audio):
 iface = gr.Interface(
     fn=transcribe,
-    inputs=gr.Audio(source="microphone", type="filepath"),
     outputs="text",
     title="Whisper Small Swedish",
     description="Realtime demo for Swedish speech recognition using a fine-tuned Whisper small model.",

 pipe = pipeline(model="fimster/whisper-small-sv-SE")  # change to "your-username/the-name-you-picked"
 images = ["katt", "melon", "hund", "banan"]
 image = random.choice(images)
+def transcribe(audio, img):
     text = pipe(audio)["text"]
     returntext = ""
     if text.lower() != image.lower():
 iface = gr.Interface(
     fn=transcribe,
+    inputs=[gr.Audio(source="microphone", type="filepath"), gr.Image("./images/" + image + ".jpeg")],
     outputs="text",
     title="Whisper Small Swedish",
     description="Realtime demo for Swedish speech recognition using a fine-tuned Whisper small model.",