import logging import os import time import uuid import gradio as gr import soundfile as sf from model import get_pretrained_model, language_to_models title = "# Conversão de texto para fala (TTS)" description = """ **Projeto Open Source de Text-to-Speech para Produção de Conteúdo com Inteligência Artificial: Voz Inteligente para Criadores de Cursos e Podcasters** --- **Visão Geral do Projeto:** O projeto Text-to-Speech (TTS) de código aberto visa capacitar criadores de cursos online e podcasters a produzirem conteúdo de alta qualidade através da aplicação de tecnologias avançadas de inteligência artificial. Ao oferecer uma solução robusta e flexível, o projeto busca democratizar o acesso a vozes naturais e envolventes, eliminando barreiras linguísticas e proporcionando uma experiência de aprendizado ou entretenimento mais inclusiva. --- **Principais Recursos:** 1. **Voz Natural e Expressiva:** Utiliza modelos de síntese de voz avançados para gerar vozes que soam naturais, expressivas e adaptáveis ao contexto do conteúdo. 2. **Suporte Multilíngue:** Incorpora diversos idiomas para atender a uma audiência global, permitindo aos criadores atingir uma ampla variedade de públicos. 3. **Personalização de Voz:** Oferece ferramentas para ajustar a entonação, velocidade e estilo da voz, permitindo que os criadores personalizem a experiência auditiva de acordo com suas preferências e o tom do conteúdo. 4. **Integração de Acentos e Dialeto:** Inclui suporte para diferentes acentos e dialetos, enriquecendo a autenticidade da experiência de audição. 5. **Controle de Emoções:** Permite a inserção de nuances emocionais na voz, tornando possível transmitir entusiasmo, empatia ou seriedade conforme necessário. 6. **API Amigável:** Disponibiliza uma API intuitiva para facilitar a integração com plataformas de criação de conteúdo, ambientes de aprendizado online e ferramentas de produção de podcasts. 7. **Modelo de Treinamento Aberto:** Encoraja a contribuição da comunidade para a melhoria contínua do modelo, permitindo que a inteligência artificial se aprimore com o tempo e a diversidade de dados. --- **Objetivos do Projeto:** 1. **Acessibilidade Global:** Tornar a produção de conteúdo acessível a todos, independentemente do idioma ou localização geográfica. 2. **Facilitar a Criação de Cursos Online:** Capacitar educadores a criar cursos envolventes e interativos, melhorando a experiência de aprendizado dos alunos. 3. **Aprimorar Produções de Podcast:** Permitir que podcasters forneçam narrativas cativantes e experiências auditivas excepcionais aos ouvintes. 4. **Desenvolvimento Sustentável:** Fomentar uma comunidade aberta e colaborativa para garantir a evolução contínua do projeto. --- **Como Contribuir:** O projeto Text-to-Speech é totalmente aberto à contribuição da comunidade. Se você é um desenvolvedor, designer, linguista ou entusiasta da inteligência artificial, sua participação é bem-vinda. Contribua com códigos, sugestões de recursos, correções de bugs ou simplesmente compartilhe suas experiências para enriquecer a diversidade de perspectivas. Junte-se a nós na missão de tornar a produção de conteúdo mais acessível, envolvente e impactante com a magia da inteligência artificial aplicada à síntese de voz! """ css = """.result {display:flex;flex-direction:column}.result_item {padding:15px;margin-bottom:8px;border-radius:15px;width:100%}.result_item_success {background-color:mediumaquamarine;color:white;align-self:start}.result_item_error {background-color:#ff7070;color:white;align-self:start}""" examples = [["Portuguese", "csukuangfj/vits-mms-por", "Computação é arte.", 0, 1.0]] language_choices = ["Portuguese"] def update_model_dropdown(language): return gr.Dropdown(choices=language_to_models.get(language, []), value=language_to_models.get(language, [""])[0], interactive=True) def build_html_output(s, style="result_item_success"): return f"""