Spaces:

Neprox
/

STT-Swedish

Runtime error

Neprox commited on Dec 3, 2022

Commit

cad9f2f

•

1 Parent(s): f79cbc5

Add basic version of transcribing youtube video

Files changed (2) hide show

app.py CHANGED Viewed

@@ -1,15 +1,36 @@
 from transformers import pipeline
 import gradio as gr
-pipe = pipeline(model="Neprox/model")  # change to "your-username/the-name-you-picked"
-def transcribe(audio):
-    text = pipe(audio)["text"]
     return text
 iface = gr.Interface(
     fn=transcribe,
-    inputs=gr.Audio(source="microphone", type="filepath"),
     outputs="text",
     title="Whisper Small Swedish",
     description="Realtime demo for Swedish speech recognition using a fine-tuned Whisper small model.",

 from transformers import pipeline
 import gradio as gr
+from pytube import YouTube
+from transformers import Dataset, Audio
+pipe = pipeline(model="Neprox/model")
+def transcribe(audio, url):
+    if url:
+        # Download YouTube video
+        streams = YouTube(url).streams.filter(only_audio=True, file_extension='mp4')
+        audio_fpath = streams.first().download()
+        # TODO:
+        # Process up to 10 minutes by segmenting into 30 second blocks
+        # Use pyMovie for selecting time ranges
+        # query every block individually
+        # Annotate text with timestamps
+        audio_dataset = Dataset.from_dict({"audio": [audio_fpath]}).cast_column("audio", Audio())
+        text = pipe(audio_dataset[0]["audio"])
+        return text
+    else:
+        text = pipe(audio)["text"]
     return text
 iface = gr.Interface(
     fn=transcribe,
+    inputs=[
+        gr.Audio(source="microphone", type="filepath")
+        gr.Text(max_lines=1, placeholder="Enter YouTube Link with Swedish speech to be transcribed")
+    ],
     outputs="text",
     title="Whisper Small Swedish",
     description="Realtime demo for Swedish speech recognition using a fine-tuned Whisper small model.",

requirements.txt CHANGED Viewed

@@ -4,3 +4,4 @@ librosa
 jiwer
 datasets
 torch

 jiwer
 datasets
 torch
+git+https://github.com/pytube/pytube