asr-inference

Running

File size: 1,553 Bytes

6c226f9
b7fa1b5
85b6c52
6c226f9
57f73ef
6c226f9
57f73ef
3c0cd8e
bab1585
 
57f73ef
6c226f9
 
13e0565
1faae08
13e0565
6c226f9
3c0cd8e
85b6c52
 
57f73ef
85b6c52
 
 
 
 
 
 
57f73ef
 
85b6c52
 
 
 
 
 
 
 
 
57f73ef
 
6c226f9
 
5208902
57f73ef

import gradio as gr
from whisper import generate
from AinaTheme import theme

MODEL_NAME = "projecte-aina/whisper-large-v3-ca-es-synth-cs"

def transcribe(inputs):
    if inputs is None:
        raise gr.Error("Cap fitxer d'àudio introduit! Si us plau pengeu un fitxer "\
                       "o enregistreu un àudio abans d'enviar la vostra sol·licitud")
    return generate(audio_path=inputs)


description_string = "Transcripció automàtica de micròfon o de fitxers d'àudio.\n Aquest demostrador s'ha desenvolupat per"\
              " comprovar els models de reconeixement de parla per a móbils. Per ara utilitza el checkpoint "\
              f"[{MODEL_NAME}](https://huggingface.co/{MODEL_NAME}) i la llibreria de 🤗 Transformers per a la transcripció."


def clear():
     return (
          None
     )


with gr.Blocks(theme=theme) as demo:
    gr.Markdown(description_string)
    with gr.Row():
        with gr.Column(scale=1):
            #input = gr.Audio(sources=["upload", "microphone"], type="filepath", label="Audio")
            input = gr.Audio(sources=["upload"], type="filepath", label="Audio")

        with gr.Column(scale=1):
            output = gr.Textbox(label="Output", lines=8)
    
    with gr.Row(variant="panel"):
            clear_btn = gr.Button("Clear")
            submit_btn = gr.Button("Submit", variant="primary")


    submit_btn.click(fn=transcribe, inputs=[input], outputs=[output])
    clear_btn.click(fn=clear,inputs=[], outputs=[input], queue=False,)


if __name__ == "__main__":
    demo.launch()