Audio Spaces

hysts 's Collections

Diffusion model Spaces

LLM Spaces

Audio Spaces

updated 3 days ago

Upvote

Runtime error

Featured

71

Whisper vs Distil-Whisper

📈

71
Runtime error

Featured

949

Seamless M4T

📞

949
Runtime error

Featured

5.07k

MusicGen

🎵

5.07k

Generate music from text descriptions and optional melodies
Runtime error

Featured

815

Audioldm Text To Audio Generation

🔊

815

Generate audio from text descriptions
Runtime error

Featured

307

AudioLDM2 Text2Audio Text2Music Generation

🔊

307

Generate audio and waveform video from text
Runtime error

Featured

222

AudioSep

🐠

222
Running

Featured

170

Lp Music Caps

🎵

170

Generate captions for music audio
Runtime error

315

Tortoise Tts

🐢

315

ExpressivText-to-Speech
Runtime error

22

All In One

📊

22
Runtime error

Featured

2.77k

XTTS

🐸

2.77k

Generate speech from text using a reference voice
Paused

189

Coqui Bark Voice Cloning

🐸

189
Runtime error

365

VALL E X

🎙

365

Generate audio from text using voice prompts
Sleeping

Featured

193

WavJourney

🔥

193
Paused

Featured

264

Music To Image

🎶

264
Paused

Featured

277

MMS

🌍

277

Transform and identify speech with MMS
Running

Featured

621

ElevenLabs TTS

🗣

621

Generate spoken audio from text using selectable voices
Build error

289

AudioGPT

🚀

289
Build error

Featured

2.37k

Bark

🐶

2.37k

Generate realistic audio from text
Runtime error

36

SpeechT5 Speech Recognition Demo

👩

36
Runtime error

173

CoquiTTS (Official)

🐸

173
Running on Zero

Featured

2.72k

Whisper

📉

2.72k

Transcribe audio files and YouTube videos into text
Running on CPU Upgrade

663

Moe TTS

😊

663

Generate and convert voice using text and audio inputs
Build error

17

YourTTS

🔥

17
Running

Featured

560

Talking Face Generation with Multilingual TTS

👄

560

Generate multilingual talking-face videos from your text
Runtime error

560

OpenAI TTS New

📊

560
Build error

Featured

166

Mustango

🐢

166
Runtime error

Featured

55

OWSM Demo

🔊

55
Running on L4

Featured

723

StyleTTS 2

🗣

723

Efficient, fast, and natural text to speech with StyleTTS 2!
Runtime error

396

HierSpeech++ (Zero-shot TTS)

⚡

396

Generate high-quality speech from text using a prompt audio
Runtime error

21

Video2music

📚

21

Generate music for a video based on its content and key
Runtime error

187

Whisper Large V2

🤫

187
Paused

64

Musicgen Prompt Upsampling

🌖

64

Generate music from text prompts 🎶
Runtime error

Featured

516

Seamless M4T v2

📞

516

Translate speech and text between languages
Paused

324

Seamless Streaming

📞

324

Translate text between languages
Runtime error

53

Matcha TTS

🍵

53

Generate speech from text with speaker selection
Running on Zero

MCP

Featured

290

MusicGen Streaming

🔥

290

Generate music from text descriptions in real-time
Running on T4

451

Resemble Enhance

🚀

451

Enhance and denoise your audio files
Runtime error

262

Singing Voice Conversion

🎼

262

Transform your voice into a singer's
Sleeping

52

NaturalSpeech2

🎧

52

Generate speech with cloned timbre
Paused

22

Create Your Own TTS Dataset

🔥

22
Runtime error

Podcast Transcription

🐢
Running

Featured

1.13k

OpenVoice

🤗

1.13k

Clone a voice and generate speech from your text
Runtime error

Featured

94

M2UGen Demo

💻

94
Runtime error

Featured

68

Pheme

📊

68
Build error

6

ESPnet2 TTS

📈

6

Convert text to speech in English, Chinese, or Japanese
Running

39

Whisper-WebUI

🚀

39

Generate subtitles and translate audio files
Running

MCP

Featured

176

Image2SFX Comparison

👂

176

Generates audio environment from an image
Runtime error

Featured

379

WhisperSpeech

🌬

379
Paused

Featured

144

MetaVoice 1B

🗣

144

A demo of MetaVoice 1B, a new TTS model by MetaVoice.
Running on CPU Upgrade

Featured

938

TTS Arena V2

🏆

938

Vote on the latest TTS models!
Running

Featured

179

Whisper Speech X DreamTalk

😽

179

Combine voice cloning and portrait lipsync animation
Runtime error

Featured

197

Canary 1b

🐤

197

Transcribe and translate audio into text
Running on Zero

MCP

Featured

83

SALMONN Audio Questioning

⚡

83

Deeply interrogate audio file content
Running on Zero

Featured

471

MeloTTS

🗣

471

Fast, efficient, & multilingual text-to-speech
Running on Zero

Featured

322

Audio Editing

🎧

322

Edit audios with text prompts
Runtime error

18

ChatMusician

💻

18
Running on CPU Upgrade

MCP

73

xVASynth TTS

🧝

73

CPU powered, low RTF, emotional, multilingual TTS
Configuration error

Featured

178

NaturalSpeech3 FACodec

🏃

178

Convert and reconstruct speech files
Runtime error

25

Hey Gemma

☎

25
Running

70

Ratchet + Whisper

🗣

70

Convert audio to text
Paused

3

AutoSubs

📜

3

Automatically add on-screen subs to your videos
Build error

161

VoiceCraft

📈

161
Running on Zero

326

TangoFlux

🚀

326

Text to Audio (Sound SFX) Generator
Running on Zero

Featured

844

Parler-TTS

🥖

844

High-fidelity Text-To-Speech
Runtime error

Featured

184

Sing an idea ➡️ Music

🔥

184

Bring song ideas to life
Runtime error

75

Musicgen Songstarter Demo

👁

75

Generate music using descriptions and optional melody audio
Runtime error

145

Whisper JAX

👀

145

Transcribe or translate audio from microphone, file, or YouTube
Runtime error

23

AudioLCM

🏢

23

Generate audio from text
Running on Zero

Featured

161

Stable Audio Live Multiplayer

💻

161

Generate realistic soundscapes from text prompts
Running on Zero

463

Stable Audio Open Zero

🔥

463

Generate custom audio tracks from text prompts
Running on Zero

14

Make An Audio 3

🐠

14

Generate audio from text prompts
Paused

60

Mars5 Space

📉

60
Configuration error

5

Tango Music AF

🎵

5

Text to Music Generator
Runtime error

16

Jam

🐠

16

Generate a song from lyrics and style reference
Running

Featured

113

BigVGAN

🔊

113

Generate high‑quality audio and spectrogram from your recording
Runtime error

89

SenseVoice

🐠

89

Transcribe audio with emotions and events
Runtime error

27

PicoAudio

📈

27

Generate audio from text descriptions with timestamps
Build error

7

Audio Flamingo Demo

📚

7
Runtime error

29

MusiConGen

🪩

29
Running

20

Mms Zeroshot

🌍

20

Transcribe audio in any language using text data
Running on Zero

226

GPT SoVITS V2 Pro Plus

🤗

226

Generate speech from text using a reference voice
Running on Zero

275

EzAudio

🟣

275

Generate or edit realistic audio from text prompts
Build error

214

OpenMusic

🎶

214

Generate music from text descriptions
Running on Zero

Featured

567

Midi Music Generator

🎼

567

Generate AI‑composed MIDI music
Running on Zero

1k

Whisper Turbo

🤯

1k

Transcribe or translate audio and YouTube videos to text
Running on Zero

Featured

347

Realtime Whisper Turbo

🤯

347

Realtime implementation of Whisper large turbo
Running

170

Whisper Large V3 Turbo WebGPU

🚀

170

ML-powered speech recognition directly in your browser
Runtime error

Featured

698

Fish Audio S1

🏆

698

Convert text to natural-sounding speech audio
Running

471

TTS Spaces Arena

🤗

471

Blind vote on HF TTS models!
Paused

19

Diva Realtime Chat

🗣

19

Generate text responses from audio input
Running on Zero

Featured

2.82k

F5-TTS

🗣

2.82k

F5-TTS & E2-TTS: Zero-Shot Voice Cloning (Unofficial Demo)
Configuration error

259

MaskGCT TTS Demo

😻

259

MaskGCT TTS Demo
Running on Zero

156

MelodyFlow

🎵

156

Generate or edit music from text and optional audio
Running on L40S

Featured

147

Fish Agent

💬

147

An end-to-end (e2e) Voice Language Model by Fish Audio.
Running

66

Nexa Omni Demo

🎧

66

Generate text from uploaded or recorded audio
Running on Zero

Featured

3.21k

Kokoro TTS

❤

3.21k

Upgraded to v1.0!
Running

131

Make Custom Voices With KokoroTTS

⚡

131

Make Custom Voices With KokoroTTS
Running on Zero

313

Llasa 3b Tts

🔥

313

Zero Shot voice cloning with llasa 3b (Unofficial Demo)
Runtime error

12

Llasa 1b Multilingual TTS

🌍

12

Generate speech from text with or without cloning a voice
Running

Featured

353

Kokoro Text-to-Speech (WebGPU)

🗣

353

High-quality speech synthesis powered by Kokoro TTS
Running on Zero

MCP

Featured

42

Hibiki Simple

👄

42

High-Fidelity Simultaneous Speech-To-Speech Translation
Running on Zero

Featured

411

Zonos

🌍

411

Generate speech audio from text with voice and emotion tweaks
Running

80

Kokoro Web

🗣

80

ML-powered speech synthesis directly in your browser
Running on Zero

Featured

678

Di♪♪Rhythm

🎶

678

Blazingly Fast and Embarrassingly Simple Song Generation
Running

23

Audiobox Aesthetics

📚

23

Demo for audiobox-aesthetics
Paused

Featured

230

Spark TTS

🌖

230

A text-to-speech model powered by SparkAudio and Mobvoi.
Running on Zero

Featured

861

Sesame CSM

🌱

861

Conversational speech generation
Running on Zero

Featured

245

Orpheus TTS

🚀

245

Try Orpheus TTS here
Running on Zero

43

Canary 1B Flash

🐤

43

Canary 1B Flash demo
Runtime error

216

IndexTTS: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

🎙

216

Generate speech from text using a reference audio
Paused

6

AudioMorphix

🌊

6

Prepare environment and run Gradio app
Runtime error

93

MegaTTS3 Demo

👋

93
Running on Zero

Featured

167

AudioX

👀

167

Generate audio from text, video, or audio prompts
Runtime error

Featured

100

Vevo for Zero-shot VC, TTS, and More

🐠

100

Controllable Zero-Shot Voice Imitation
Running on Zero

Featured

1.75k

Dia 1.6B

👯

1.75k

Generate realistic dialogue from a script, using Dia!
Runtime error

43

Aero 1 Audio Demo

💬

43

Demo for Aero-1-Audio
Runtime error

43

Voila Demo

💻

43

Chat with a voice-clone AI
Running on Zero

Featured

649

ACE Step

😻

649

A Step Towards Music Generation Foundation Model
Sleeping

2

Audio Difficulty Estimator

🎹

2

Estimate piano difficulty from audio
Running on Zero

MCP

Featured

111

TIGER Audio Extractor

✂

111

Extraction & Reconstruction for Efficient Speech Separation
Running on Zero

17

Music2emo

📊

17

Towards Unified Music Emotion Recognition across Dimensional
Runtime error

13

SonicVerse

🖼

13

Generate detailed music descriptions from audio clips
Running on Zero

MCP

Featured

43

Auffusion

😻

43

Audio Gen, Audio Style Transfer and Audio InPainting
Running on Zero

MCP

Featured

1.71k

Chatterbox TTS

🍿

1.71k

Expressive Zeroshot TTS
Paused

120

PlayDiffusion

🎨

120

Generate modified audio from text and voice
Paused

2

Voice Clone Arena

🏆

2

Vote on the latest Voice Clone TTS models!
Running

Featured

233

Conversational WebGPU

🚀

233
Running on L40S

Featured

656

Song Generation

🎵

656

Generate a song from custom lyrics and prompts
Running on Zero

70

NotaGen

📊

70

Generate classical sheet music in ABC notation
Running on Zero

Featured

99

Audio Flamingo 3 Demo

🚀

99

Audio Flamingo 3 Demo
Runtime error

Featured

33

Audio Flamingo 3 Chat

🐠

33

Audio Flamingo 3 demo for multi-turn multi-audio chat
Running on Zero

6

MSR UTMOS

🐢

6

Multiple sampling rate MOS prediction with SFI conv
Running on Zero

MCP

Featured

398

Higgs Audio Demo

🎤

398

Higgs Audio Demo
Running on Zero

25

sidon_demo_beta

🐋

25

Speech restoration demo of Sidon.
Running on Zero

Featured

69

Canary 1b V2

🐤

69

Transcribe and Translate in 25 European Languages
Running on Zero

28

SonicMaster – Text-Guided Music Restoration & Mastering

🎧

28

Enhance audio quality using text prompts
Runtime error

6

OLMoASR

🌍

6

Open Models and Data for Training Robust Speech Recognition
Runtime error

Featured

85

VibeVoice-Large

🏃

85

Generate a podcast audio from a script and voice samples
Sleeping

10

TaDiCodec TTS AR Qwen2.5 0.5B

📚

10

Generate speech from text with voice cloning
Running on Zero

8

EchoX

🔥

8

An end-to-end speech large language model.
Running on Zero

43

VoxCPM 0.5B

🐢

43

Generate expressive speech from text with optional voice cloning
Runtime error

34

FireRedTTS2

🔥

34

Long-form multi-speaker dialogue generation
Running on Zero

10

FireRedASR

🚀

10

FireRedASR Demo
Running on Zero

764

IndexTTS 2 Demo

🏢

764

Generate expressive speech from text and voice reference
Running on Zero

17

SongFormer

🎵

17

State-of-the-art music analysis with multi-scale datasets
Running on Zero

26

Voice Acting TTS

🎭

26

TTS for any emotion, now with non-verbal sounds!
Running on A100

235

Omnilingual ASR Media Transcription

🌍

235

Transcribe audio/video to text in many languages
Running on Zero

147

Music Flamingo

🎵

147

Answer music questions from uploaded audio or YouTube tracks
Paused

MCP

Featured

118

Maya1

📉

118

Demo of our new open source model maya1
Running

Featured

217

Supertonic (TTS)

⚡

217

Lightning-Fast, On-Device TTS
Running on Zero

Featured

72

Dia2 2B

💨

72

Streaming conversational audio in realtime
Running on Zero

Featured

171

VibeVoice-Realtime-0.5B

🐨

171

Generate natural speech from text with selectable voices
Sleeping

1

Count The Notes

🎵

1

Convert audio to MIDI
Runtime error

1

SpeechJudge GRM

📈

1

Evaluate naturalness of two audio files
Running on Zero

MCP

Featured

481

Chatterbox Turbo Demo

⚡

481

Chatterbox Turbo Demo
Running on Zero

MCP

Featured

147

Soprano TTS

🗣

147

Now with upgraded v1.1 model!
Running on Zero

Featured

1.62k

Qwen3-TTS Demo

🎙

1.62k

Generate custom speech from text, voice descriptions, or samples
Running on Zero

Featured

107

Qwen3-ASR Demo

🎙

107

Transcribe audio to text with multi-language timestamps
Running

Featured

144

Voxtral Mini Realtime

🎤

144

Transcribe speech to text instantly in real time
Running on Zero

Featured

435

ACE-Step v1.5

🎵

435

Music Generation Foundation Model v1.5
Running

Featured

86

Parakeet STT Progressive Transcription

🎤

86

Transcribe speech to text instantly with WebGPU acceleration
Running on A10G

Featured

104

faster-qwen3-tts

🎙

104

Generate spoken audio from text with custom or cloned voices

Upvote

Collection guide
Browse collections

Whisper vs Distil-Whisper

Seamless M4T

MusicGen

Audioldm Text To Audio Generation

AudioLDM2 Text2Audio Text2Music Generation

AudioSep

Lp Music Caps

Tortoise Tts

All In One

XTTS

Coqui Bark Voice Cloning

VALL E X

WavJourney

Music To Image

MMS

ElevenLabs TTS

AudioGPT

Bark

SpeechT5 Speech Recognition Demo

CoquiTTS (Official)

Whisper

Moe TTS

YourTTS

Talking Face Generation with Multilingual TTS

OpenAI TTS New

Mustango

OWSM Demo

StyleTTS 2

HierSpeech++ (Zero-shot TTS)

Video2music

Whisper Large V2

Musicgen Prompt Upsampling

Seamless M4T v2

Seamless Streaming

Matcha TTS

MusicGen Streaming

Resemble Enhance

Singing Voice Conversion

NaturalSpeech2

Create Your Own TTS Dataset

Podcast Transcription

OpenVoice

M2UGen Demo

Pheme

ESPnet2 TTS

Whisper-WebUI

Image2SFX Comparison

WhisperSpeech

MetaVoice 1B

TTS Arena V2

Whisper Speech X DreamTalk

Canary 1b

SALMONN Audio Questioning

MeloTTS

Audio Editing

ChatMusician

xVASynth TTS

NaturalSpeech3 FACodec

Hey Gemma

Ratchet + Whisper

AutoSubs

VoiceCraft

TangoFlux

Parler-TTS

Sing an idea ➡️ Music

Musicgen Songstarter Demo

Whisper JAX

AudioLCM

Stable Audio Live Multiplayer

Stable Audio Open Zero

Make An Audio 3

Mars5 Space

Tango Music AF

Jam

BigVGAN

SenseVoice

PicoAudio

Audio Flamingo Demo

MusiConGen