Spaces:

Neprox
/

STT-Swedish

Runtime error

Neprox commited on Dec 3, 2022

Commit

98a9509

•

1 Parent(s): c1c59f8

Small fix

Files changed (1) hide show

app.py CHANGED Viewed

@@ -11,11 +11,11 @@ def download_from_youtube(url):
     fpath = streams.first().download()
     return fpath
-def create_30s_segments(fpath):
     if not os.path.exists("segmented_audios"):
         os.makedirs("segmented_audios")
-    sound = AudioFileClip(fpath)
     n_full_segments = int(sound.duration / 30)
     len_last_segment = sound.duration % 30
@@ -40,11 +40,13 @@ def create_30s_segments(fpath):
         segment_paths.append(segment_path)
         segment_start_times.append(start)
 def transcribe(audio, url):
     if url:
         fpath = download_from_youtube(url)
-        audio_segment_paths = create_30s_segments(fpath)
         audio_dataset = Dataset.from_dict({"audio": audio_segment_paths}).cast_column("audio", Audio())
         print(audio_dataset)

     fpath = streams.first().download()
     return fpath
+def divide_into_30s_segments(audio_fpath):
     if not os.path.exists("segmented_audios"):
         os.makedirs("segmented_audios")
+    sound = AudioFileClip(audio_fpath)
     n_full_segments = int(sound.duration / 30)
     len_last_segment = sound.duration % 30
         segment_paths.append(segment_path)
         segment_start_times.append(start)
+    return segment_paths, segment_start_times
 def transcribe(audio, url):
     if url:
         fpath = download_from_youtube(url)
+        segment_paths, segment_start_times = divide_into_30s_segments(fpath)
         audio_dataset = Dataset.from_dict({"audio": audio_segment_paths}).cast_column("audio", Audio())
         print(audio_dataset)