Cara Import ke F5-TTS

by Syams - opened 8 days ago

8 days ago

•

Selamat pagi Eempostor. Mohon izin bertanya, bagaimana cara memasukkan model ini ke dalam F5-TTS? Setahu saya perlu vocab.txt

Eempostor

Owner 6 days ago

Halo Syams, di gradio inferencenya pilih opsi model "Custom". Setelah itu tulislah path ke model checkpoint yang sudah di download. Untuk vocab.txt, seharusnya bisa pakai yang ada di repo originalnya ("F5-TTS/src/f5_tts/infer/examples/vocab.txt").

Syams

6 days ago

Oh, bisa ya pake vocab.txt dari model lain? Bukannya vocab harus sama bahasa dan muatannya? Tadinya, saya kira harus punya hubungan.

Eempostor

Owner 6 days ago

Karena bahasa indonesia menggunakan huruf latin, saat training tidak ada huruf baru yang di tambahkan pada vocab.txt. Kalau ada bahasa yang menggunakan penulisan lain seperti Jepang, Korea, Hindi, dll, perlu vocab.txt yang baru.

Syams

6 days ago

Apakah model agan bisa dipakai di AI tts lain selama pakai ekstensi .pt?

Eempostor

Owner 6 days ago

Modelnya hanya akan bekerja dengan menggunakan kode inference dari F5 TTS. Jika modelnya digunakan di interface TTS lain yang tidak menggunakan kode inference dari F5 TTS, maka akan error.

Syams

6 days ago

Mohon pendapatnya gan. Ini hasil dari model yang agan buat. Tolong pencerahan supaya lebih bagus.

Eempostor

Owner 6 days ago

Teks referensinya diisi otomatis atau di isi oleh whisper? Saya sarankan buka advanced settingnya kemudian tulis referensi teks yang akurat dan pastikan menggunakan audio referensinya menggunakan bahasa indonesia tanpa campuran bahasa lain. Jika ngomongnya terlalu cepat, turunkan settingan speednya.

Syams

6 days ago

Teks referensi pada Advanced Setting terisi sendiri gan, gak saya ketik. Bukannya sama aja ya? Apakah kita harus ngetik sendiri lagi, teks referensi? Audio referensi udah bahasa Indonesia.
Speed di Syntesized Audio sudah saya turunkan jadi 0.5x pun masih belepotan bicaranya.

Eempostor

Owner 6 days ago

Terisi sendiri itu artinya audio referensinya otomatis di transkrip sama whisper AI. Hasilnya mungkin lebih bagus kalau kamu mendengarkan referensi audionya dan menuliskan apa yang ada di referensi audionya ke teks referensi.

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment