Cara Import ke F5-TTS

#1
by Syams - opened

Selamat pagi Eempostor. Mohon izin bertanya, bagaimana cara memasukkan model ini ke dalam F5-TTS? Setahu saya perlu vocab.txt

image.png

image.png

Halo Syams, di gradio inferencenya pilih opsi model "Custom". Setelah itu tulislah path ke model checkpoint yang sudah di download. Untuk vocab.txt, seharusnya bisa pakai yang ada di repo originalnya ("F5-TTS/src/f5_tts/infer/examples/vocab.txt").

Oh, bisa ya pake vocab.txt dari model lain? Bukannya vocab harus sama bahasa dan muatannya? Tadinya, saya kira harus punya hubungan.

Karena bahasa indonesia menggunakan huruf latin, saat training tidak ada huruf baru yang di tambahkan pada vocab.txt. Kalau ada bahasa yang menggunakan penulisan lain seperti Jepang, Korea, Hindi, dll, perlu vocab.txt yang baru.

Apakah model agan bisa dipakai di AI tts lain selama pakai ekstensi .pt?

Modelnya hanya akan bekerja dengan menggunakan kode inference dari F5 TTS. Jika modelnya digunakan di interface TTS lain yang tidak menggunakan kode inference dari F5 TTS, maka akan error.

Mohon pendapatnya gan. Ini hasil dari model yang agan buat. Tolong pencerahan supaya lebih bagus.

Teks referensinya diisi otomatis atau di isi oleh whisper? Saya sarankan buka advanced settingnya kemudian tulis referensi teks yang akurat dan pastikan menggunakan audio referensinya menggunakan bahasa indonesia tanpa campuran bahasa lain. Jika ngomongnya terlalu cepat, turunkan settingan speednya.

  1. Teks referensi pada Advanced Setting terisi sendiri gan, gak saya ketik. Bukannya sama aja ya? Apakah kita harus ngetik sendiri lagi, teks referensi? Audio referensi udah bahasa Indonesia.
  2. Speed di Syntesized Audio sudah saya turunkan jadi 0.5x pun masih belepotan bicaranya.

Terisi sendiri itu artinya audio referensinya otomatis di transkrip sama whisper AI. Hasilnya mungkin lebih bagus kalau kamu mendengarkan referensi audionya dan menuliskan apa yang ada di referensi audionya ke teks referensi.

Sign up or log in to comment