Whisper-zh-HK

Sleeping

App Files Files Community

Ziyou Li

Chenzhou commited on Dec 12, 2022

Commit

ae3911f

•

0 Parent(s):

Duplicate from Chenzhou/Whisper-zh-HK

Browse files

Co-authored-by: Chenzhou Huang <Chenzhou@users.noreply.huggingface.co>

Files changed (4) hide show

.gitattributes +34 -0
README.md +13 -0
app.py +94 -0
requirements.txt +5 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,34 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: UITest
+emoji: 👁
+colorFrom: indigo
+colorTo: green
+sdk: gradio
+sdk_version: 3.12.0
+app_file: app.py
+pinned: false
+duplicated_from: Chenzhou/Whisper-zh-HK
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,94 @@

+from transformers import pipeline
+import gradio as gr
+import os
+import subprocess
+from pytube import YouTube
+pipe = pipeline(model="tilos/whisper-small-zh-HK")  # change to "your-username/the-name-you-picked"
+def video2mp3(video_file, output_ext="mp3"):
+    filename, ext = os.path.splitext(video_file)
+    subprocess.call(["ffmpeg", "-y", "-i", video_file, f"{filename}.{output_ext}"],
+                    stdout=subprocess.DEVNULL,
+                    stderr=subprocess.STDOUT)
+    return f"{filename}.{output_ext}"
+def transcribe(audio):
+    text = pipe(audio)["text"]
+    return text
+def get_text(url):
+    result = pipe(get_audio(url))
+    return result['text'].strip()
+def get_audio(url):
+    website = YouTube(url)
+    video = website.streams.filter(only_audio=True).first()
+    out_file = video.download(output_path=".")
+    base, ext = os.path.splitext(out_file)
+    new_file = base + '.mp3'
+    os.rename(out_file, new_file)
+    audio = new_file
+    return audio
+def offline_video(video):
+    audio_file = video2mp3(video)
+    text = transcribe(audio_file)
+    return text
+with gr.Blocks() as demo:
+    # video file input
+    gr.Interface(
+            title="Whisper: Real Time Cantonese Recognition",
+            description="Realtime demo for Cantonese speech recognition using a fine-tuned Whisper small model. "
+                        "Generate zh-HK subtitle from video file, audio file, your microphone, and Youtube URL",
+            fn=offline_video,
+            inputs="video",
+            outputs="text",
+            allow_flagging="never",
+        )
+    # audio file input
+    with gr.Row():
+        with gr.Column():
+            input_audio = gr.Audio(source="upload", type="filepath")
+            micro_btn = gr.Button('Generate Voice Subtitles')
+        with gr.Column():
+            output_audio = gr.Textbox(placeholder='Transcript from audio', label='Subtitles')
+            micro_btn.click(transcribe, inputs=input_audio, outputs=output_audio)
+    """
+    gr.Interface(
+            fn=transcribe,
+            title="Whisper: zh-HK Subtitle Generator",
+            description="Generate zh-HK subtitle from audio file, your microphone and Youtube",
+            inputs = gr.Audio(source="upload", type="filepath", optional=True),
+            outputs = "text",
+            allow_flagging= "never",
+    )
+    """
+    # microphone input
+    with gr.Row():
+        with gr.Column():
+            input_mircro = gr.Audio(source="microphone", type="filepath")
+            micro_btn = gr.Button('Generate Voice Subtitles')
+        with gr.Column():
+            output_micro = gr.Textbox(placeholder='Transcript from mic', label='Subtitles')
+            micro_btn.click(transcribe, inputs=input_mircro, outputs=output_micro)
+    # Youtube url input
+    with gr.Row():
+        with gr.Column():
+            inputs_url = gr.Textbox(placeholder='Youtube URL', label='URL')
+            url_btn = gr.Button('Generate Youtube Video Subtitles')
+            examples = gr.Examples(examples=["https://www.youtube.com/watch?v=Yw4EoGWe0vw"],inputs=[inputs_url])
+        with gr.Column():
+            output_url = gr.Textbox(placeholder='Transcript from video.', label='Transcript')
+            url_btn.click(get_text, inputs=inputs_url, outputs=output_url )
+demo.launch(debug=True)

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+torch
+numpy
+transformers
+gradio
+pytube