Spaces:

Kushtrim
/

whisper-large-v3-turbo-shqip-radio-transcriber

Sleeping

App Files Files Community

Kushtrim commited on Dec 30, 2024

Commit

d13b017

verified ·

1 Parent(s): 3e2ce7f

Upload 4 files

Browse files

Files changed (4) hide show

README.md +6 -4
app.py +131 -0
packages.txt +1 -0
requirements.txt +5 -0

README.md CHANGED Viewed

@@ -1,12 +1,14 @@
 ---
-title: Whisper Large V3 Turbo Shqip Radio Transcriber
-emoji: 📈
-colorFrom: yellow
 colorTo: red
 sdk: gradio
 sdk_version: 5.9.1
 app_file: app.py
 pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 ---
+title: Transkriptim i Radios në Shqip
+emoji: 🎤
+colorFrom: indigo
 colorTo: red
 sdk: gradio
 sdk_version: 5.9.1
 app_file: app.py
 pinned: false
+tags:
+- whisper-event
 ---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,131 @@

+from transformers import WhisperProcessor, WhisperForConditionalGeneration
+from huggingface_hub import login
+import gradio as gr
+import numpy as np
+import ffmpeg
+import torch
+import time
+import os
+login(os.environ["HF"], add_to_git_credential=True)
+# Load Whisper Tiny Model
+model_name = "Kushtrim/whisper-large-v3-turbo-shqip-115h"
+processor = WhisperProcessor.from_pretrained(model_name)
+model = WhisperForConditionalGeneration.from_pretrained(model_name)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model.to(device)
+def transcribe_chunk(audio_chunk):
+    """Përkthe një pjesë të audios duke përdorur Whisper."""
+    audio_array = np.frombuffer(audio_chunk, dtype=np.int16).astype(np.float32) / 32768.0
+    inputs = processor(audio_array, sampling_rate=16000, return_tensors="pt").to(device)
+    generated_ids = model.generate(
+        inputs.input_features,
+        forced_decoder_ids=processor.get_decoder_prompt_ids(language="en")  # English language
+    )
+    return processor.batch_decode(generated_ids, skip_special_tokens=True)[0]
+def stream_and_transcribe_radio(stream_url, chunk_duration=5):
+    """
+    Transkripto audio të drejtpërdrejtë nga një stream radioje.
+    Args:
+        stream_url (str): URL i stream-it audio.
+        chunk_duration (int): Kohëzgjatja e secilës pjesë për t'u përpunuar në sekonda.
+    """
+    process = (
+        ffmpeg.input(stream_url)
+        .output('pipe:', format='wav', acodec='pcm_s16le', ac=1, ar='16000')
+        .run_async(pipe_stdout=True, pipe_stderr=True)
+    )
+    chunk_size = chunk_duration * 16000 * 2  # 16000 mostra për sekondë, 2 byte për mostër
+    transcription_log = ""
+    try:
+        for i in range(60):  # Përpunoni për 5 minuta (60 pjesë nga 5 sekonda)
+            audio_chunk = process.stdout.read(chunk_size)
+            if not audio_chunk:
+                break
+            transcription = transcribe_chunk(audio_chunk)
+            current_time = time.strftime("%H:%M:%S", time.localtime())
+            new_transcription = f"[{current_time}] {transcription}"
+            transcription_log += new_transcription + "\n"
+            yield transcription_log  # Dërgo përditësimin e transkriptimit
+    finally:
+        process.kill()
+# Gradio Interface
+def transcribe_app(stream_url):
+    return stream_and_transcribe_radio(stream_url, chunk_duration=5)
+with gr.Blocks() as app:
+    gr.Markdown("""
+    <h1 style="text-align: center;">🎤 Transkriptim i Radios në Shqip</h1>
+    <p style="text-align: center;">
+        Ky aplikacion ju lejon të transkriptoni audio të drejtpërdrejtë nga një stream radioje për 5 minuta.
+        Vendosni URL-në e stream-it dhe klikoni "Fillo Transkriptimin".
+    </p>
+    <p style="text-align: center;">Autori: Kushtrim Visoka</p>
+    <p style="text-align: center;">
+        Modeli i përdorur për transkriptim:
+        <a href="https://huggingface.co/openai/whisper-tiny" target="_blank">openai/whisper-tiny</a>
+    </p>
+    """)
+    # Futja e URL-së së stream-it
+    stream_url_input = gr.Textbox(label="Vendosni URL-në e stream-it audio", value="https://s2.voscast.com:8825/radiodukagjini")
+    # Butoni për fillimin e transkriptimit
+    transcribe_button = gr.Button("Fillo Transkriptimin")
+    # Luajtësi i audios
+    audio_player = gr.HTML("""
+    <div style="text-align: center; margin-top: 20px;">
+        <audio controls autoplay style="width: 80%; max-width: 600px;">
+            <source src="https://s2.voscast.com:8825/radiodukagjini" type="audio/mpeg">
+            Shfletuesi juaj nuk e mbështet elementin audio.
+        </audio>
+    </div>
+    """)
+    # Dalja e transkriptimit
+    transcription_output = gr.Textbox(label="Dalja e Transkriptimit", lines=20, interactive=False)
+    # Përditëso transkriptimin dinamikisht
+    def update_transcription(stream_url):
+        for transcription in transcribe_app(stream_url):
+            yield transcription
+    # Përditëso luajtësin e audios dinamikisht
+    def update_audio_player(stream_url):
+        return f"""
+        <div style="text-align: center; margin-top: 20px;">
+            <audio controls autoplay style="width: 80%; max-width: 600px;">
+                <source src="{stream_url}" type="audio/mpeg">
+                Shfletuesi juaj nuk e mbështet elementin audio.
+            </audio>
+        </div>
+        """
+    # Lidhja e eventeve
+    transcribe_button.click(
+        update_transcription,
+        inputs=stream_url_input,
+        outputs=transcription_output
+    )
+    stream_url_input.change(
+        update_audio_player,
+        inputs=stream_url_input,
+        outputs=audio_player
+    )
+    # Rreshtimi i komponentëve
+    stream_url_input
+    transcribe_button
+    audio_player
+    transcription_output
+# Nis aplikacionin
+app.launch()

packages.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ ffmpeg

requirements.txt ADDED Viewed

	@@ -0,0 +1,5 @@

+transformers
+torch
+ffmpeg-python
+huggingface-hub
+pydub