hex-rvc / module.py

Update module.py

af2ee36 verified 3 months ago

5.39 kB

	import os
	import re
	import random
	from scipy.io.wavfile import write
	from scipy.io.wavfile import read
	import numpy as np
	import gradio as gr
	import yt_dlp
	import subprocess
	from pydub import AudioSegment
	from audio_separator.separator import Separator
	from lib.infer import infer_audio
	import edge_tts
	import tempfile
	import anyio
	from pathlib import Path
	from lib.language_tts import language_dict
	import shutil
	import time
	from argparse import ArgumentParser
	from download_model import download_online_model

	main_dir = Path().resolve()
	print(main_dir)

	os.chdir(main_dir)
	models_dir = main_dir / "rvc_models"
	audio_separat_dir = main_dir / "audio_input"
	AUDIO_DIR = main_dir / 'audio_input'


	# Function to list all folders in the models directory
	def get_folders():
	if models_dir.exists() and models_dir.is_dir():
	return [folder.name for folder in models_dir.iterdir() if folder.is_dir()]
	return []


	# Function to refresh and return the list of folders
	def refresh_folders():
	return gr.Dropdown.update(choices=get_folders())


	# Function to get the list of audio files in the specified directory
	def get_audio_files():
	if not os.path.exists(AUDIO_DIR):
	os.makedirs(AUDIO_DIR)
	return [f for f in os.listdir(AUDIO_DIR) if f.lower().endswith(('.mp3', '.wav', '.flac', '.ogg', '.aac'))]


	# Function to return the full path of audio files for playback
	def load_audio_files():
	audio_files = get_audio_files()
	return [os.path.join(AUDIO_DIR, f) for f in audio_files]


	def refresh_audio_list():
	audio_files = load_audio_files()
	return gr.Dropdown.update(choices=audio_files)


	def download_audio(url):
	ydl_opts = {
	'format': 'bestaudio/best',
	'outtmpl': 'ytdl/%(title)s.%(ext)s',
	'postprocessors': [{
	'key': 'FFmpegExtractAudio',
	'preferredcodec': 'wav',
	'preferredquality': '192',
	}],
	}

	with yt_dlp.YoutubeDL(ydl_opts) as ydl:
	info_dict = ydl.extract_info(url, download=True)
	file_path = ydl.prepare_filename(info_dict).rsplit('.', 1)[0] + '.wav'
	return file_path


	async def text_to_speech_edge(text, language_code):
	voice = language_dict.get(language_code, "default_voice")
	communicate = edge_tts.Communicate(text, voice)
	with tempfile.NamedTemporaryFile(delete=False, suffix=".wav") as tmp_file:
	tmp_path = tmp_file.name
	await communicate.save(tmp_path)
	return tmp_path


	if __name__ == '__main__':
	parser = ArgumentParser()
	parser.add_argument("--share", action="store_true", dest="share_enabled", default=False)
	parser.add_argument("--listen", action="store_true", default=False)
	parser.add_argument('--listen-host', type=str)
	parser.add_argument('--listen-port', type=int)
	args = parser.parse_args()

	# Gradio Interface
	with gr.Blocks(title="Hex RVC", theme=gr.themes.Base(primary_hue="red", secondary_hue="pink")) as app:
	gr.Markdown("# Hex RVC")
	gr.Markdown("Join [AIHub](https://discord.gg/aihub) to get the RVC model!")

	with gr.Tab("Inference"):
	with gr.Row():
	MODEL_NAME = gr.Dropdown(
	label="Select a Model",
	choices=get_folders(),
	interactive=True
	)
	SOUND_PATH = gr.Dropdown(
	choices=load_audio_files(),
	label="Select an audio file",
	interactive=True
	)
	upload_audio = gr.Audio(label="Upload Audio", type='filepath')

	with gr.Accordion("Hex TTS"):
	input_text = gr.Textbox(lines=5, label="Input Text")
	language = gr.Dropdown(choices=list(language_dict.keys()), label="Choose the Voice Model")
	tts_convert = gr.Button("Convert")
	tts_output = gr.Audio(label="Generated TTS Audio", type='filepath')

	tts_convert.click(
	fn=text_to_speech_edge,
	inputs=[input_text, language],
	outputs=tts_output
	)

	output_audio = gr.Audio(label="Generated Audio", type='filepath')
	with gr.Row():
	refresh_btn = gr.Button("Refresh")
	run_button = gr.Button("Convert")

	refresh_btn.click(
	lambda: (refresh_audio_list(), refresh_folders()),
	outputs=[SOUND_PATH, MODEL_NAME]
	)

	with gr.Tab("Download RVC Model"):
	url = gr.Textbox(label="Your Model URL")
	dirname = gr.Textbox(label="Your Model Name")
	download_button = gr.Button("Download Model")
	download_output = gr.Textbox(label="Download Status")

	download_button.click(
	download_online_model,
	inputs=[url, dirname],
	outputs=download_output
	)

	with gr.Tab("UVR5 (Demo)"):
	input_audio = gr.Audio(type="filepath", label="Upload Audio")
	roformer_link = gr.Textbox(label="Audio Link")
	roformer_download_button = gr.Button("Download")

	separate_button = gr.Button("Separate Audio")
	separation_output = gr.Textbox(label="Separation Output Path")

	roformer_download_button.click(download_audio, inputs=[roformer_link], outputs=[input_audio])

	app.launch(
	share=args.share_enabled,
	server_name=None if not args.listen else (args.listen_host or '0.0.0.0'),
	server_port=args.listen_port,
	)