Spaces:

RafaG
/

TTS-Rapido

Running

App Files Files Community

RafaG commited on Feb 19

Commit

dbf3c82

•

1 Parent(s): a4f5564

Update app.py

Browse files

Files changed (1) hide show

app.py +37 -7

app.py CHANGED Viewed

@@ -17,11 +17,9 @@ import os
 import gradio as gr
 from pydub import AudioSegment
 from voice_map import SUPPORTED_VOICES
 def generate_audio(texto, modelo_de_voz, velocidade):
-    if velocidade is None:  # Verifique se velocidade é None
-        velocidade = 0  # Defina um valor padrão se velocidade for None
     if velocidade >= 0:
         rate_str = f"+{velocidade}%"
     else:
@@ -50,6 +48,35 @@ def generate_audio(texto, modelo_de_voz, velocidade):
     return wav_output_file  # Retorna o caminho completo do arquivo de áudio WAV
 from elevenlabs import generate
 def generate_audio_elevenlabsfree(texto, modelo_de_voz):
@@ -117,10 +144,13 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"
             # Defina os elementos de entrada e saída
             audio_input = gr.Textbox(label="Texto", value='Texto de exemplo!', interactive=True)
             voice_model_input = gr.Dropdown(SUPPORTED_VOICES, label="Modelo de Voz", value="pt-BR-AntonioNeural")
-            speed_input = gr.Slider(minimum=-200, maximum=200, label="Velocidade (%)", value=0)
-            audio_output = gr.Audio(label="Áudio", type="filepath", interactive=False)
             edgetts_button = gr.Button(value="Falar")
-            edgetts_button.click(fn=generate_audio, inputs=[audio_input, voice_model_input, speed_input], outputs=[audio_output])
             clear_button = gr.ClearButton(audio_input, value='Limpar')
             gr.Markdown("Agradecimentos a rany2 pelo Edge-TTS")
@@ -129,7 +159,7 @@ with gr.Blocks(theme=gr.themes.Default(primary_hue="green", secondary_hue="blue"
             audio_input = gr.Textbox(label="Texto (Acho que o limite é 250 caracteres)", value='Texto de exemplo!', interactive=True)
             voice_model_input = gr.Dropdown(['Arnold', 'Antoni','Bella', 'Rachel', 'Drew', 'Clyde', 'Paul' ], label="Modelo de Voz", value="Arnold")
             gr.Markdown("Se estiver usando huggingface e não rodar, vá em logs, que está acima da imagem do github e veja se já não passou o limite de request da API")
-            audio_output = gr.Audio(label="Áudio", type="filepath", interactive=False)
             elevenlabs_button = gr.Button(value="Falar")
             elevenlabs_button.click(fn=generate_audio_elevenlabsfree, inputs=[audio_input, voice_model_input], outputs=[audio_output])
             clear_button = gr.ClearButton(audio_input, value='Limpar')

 import gradio as gr
 from pydub import AudioSegment
 from voice_map import SUPPORTED_VOICES
+from pydub.silence import split_on_silence
 def generate_audio(texto, modelo_de_voz, velocidade):
     if velocidade >= 0:
         rate_str = f"+{velocidade}%"
     else:
     return wav_output_file  # Retorna o caminho completo do arquivo de áudio WAV
+def remove_silence(input_file, output_file):
+    audio = AudioSegment.from_wav(input_file)
+    # Encontra os segmentos de áudio que não são silêncio
+    segments = split_on_silence(audio, min_silence_len=500, silence_thresh=-40)
+    # Concatena os segmentos de áudio não silenciosos
+    non_silent_audio = AudioSegment.silent(duration=0)
+    for segment in segments:
+        non_silent_audio += segment
+    # Salva o áudio sem as partes de silêncio
+    non_silent_audio.export(output_file, format="wav")
+def controlador_generate_audio(audio_input, voice_model_input, speed_input, checkbox_cortar_silencio):
+    # Gerar áudio
+    audio_file = generate_audio(audio_input, voice_model_input, speed_input)
+    if audio_file:
+        print("Áudio gerado com sucesso:", audio_file)
+        # Verificar se o checkbox de cortar silêncio está marcado
+        if checkbox_cortar_silencio:
+            print("Cortando silêncio...")
+            # Remover silêncio do áudio
+            remove_silence(audio_file, audio_file)
+            print("Silêncio removido com sucesso!")
+    else:
+        print("Erro ao gerar áudio.")
+    return audio_file  # Retornar o caminho do arquivo de áudio
 from elevenlabs import generate
 def generate_audio_elevenlabsfree(texto, modelo_de_voz):
             # Defina os elementos de entrada e saída
             audio_input = gr.Textbox(label="Texto", value='Texto de exemplo!', interactive=True)
             voice_model_input = gr.Dropdown(SUPPORTED_VOICES, label="Modelo de Voz", value="pt-BR-AntonioNeural")
+            speed_input = gr.Slider(minimum=-200, maximum=200, label="Velocidade (%)", value=0, interactive=True)
+            checkbox_cortar_silencio = gr.Checkbox(label="Cortar Silencio", interactive=True)
+            audio_output = gr.Audio(label="Resultado", type="filepath", interactive=False)
             edgetts_button = gr.Button(value="Falar")
+            edgetts_button.click(controlador_generate_audio, inputs=[audio_input, voice_model_input, speed_input, checkbox_cortar_silencio], outputs=[audio_output])
+            #edgetts_button = gr.Button(value="Falar")
+            #edgetts_button.click(fn=generate_audio, inputs=[audio_input, voice_model_input, speed_input], outputs=[audio_output])
             clear_button = gr.ClearButton(audio_input, value='Limpar')
             gr.Markdown("Agradecimentos a rany2 pelo Edge-TTS")
             audio_input = gr.Textbox(label="Texto (Acho que o limite é 250 caracteres)", value='Texto de exemplo!', interactive=True)
             voice_model_input = gr.Dropdown(['Arnold', 'Antoni','Bella', 'Rachel', 'Drew', 'Clyde', 'Paul' ], label="Modelo de Voz", value="Arnold")
             gr.Markdown("Se estiver usando huggingface e não rodar, vá em logs, que está acima da imagem do github e veja se já não passou o limite de request da API")
+            audio_output = gr.Audio(label="Resultado", type="filepath", interactive=False)
             elevenlabs_button = gr.Button(value="Falar")
             elevenlabs_button.click(fn=generate_audio_elevenlabsfree, inputs=[audio_input, voice_model_input], outputs=[audio_output])
             clear_button = gr.ClearButton(audio_input, value='Limpar')