Update app_tsuka.py
Browse files- app_tsuka.py +4 -17
app_tsuka.py
CHANGED
@@ -1,5 +1,5 @@
|
|
1 |
INTROTXT = """#
|
2 |
-
Repo -> [Hugging Face - 🤗](https://huggingface.co/Respair/
|
3 |
This space uses Tsukasa (24khz).
|
4 |
**Check the Read me tabs down below.** <br>
|
5 |
Enjoy!
|
@@ -414,15 +414,8 @@ over the generation process, which means it's easy to inadvertently produce unim
|
|
414 |
|
415 |
<p>
|
416 |
<b>Kotodama</b> and the <b>Diffusion sampler</b> can significantly help guide the generation towards<br>
|
417 |
-
something that aligns with your input, but they aren't foolproof.
|
418 |
-
|
419 |
-
|
420 |
-
<p>
|
421 |
-
The model's peak performance is achieved when the Diffusion sampler and Kotodama work seamlessly together.<br>
|
422 |
-
However, we won't see that level of performance here because this checkpoint is somewhat undertrained<br>
|
423 |
-
due to my time and resource constraints. (Tsumugi should be better in this regard, <br>
|
424 |
-
albeit if the diffusion works at all on your hardware.) <br>
|
425 |
-
Hopefully, you can further fine-tune this model (or train from scratch) to achieve even better results!
|
426 |
</p>
|
427 |
|
428 |
<p>
|
@@ -526,15 +519,9 @@ notes_jp = """
|
|
526 |
|
527 |
<p>
|
528 |
<b>Kotodama</b>と<b>Diffusionサンプラー</b>は、入力に沿ったものを生成するための大きな助けとなりますが、<br>
|
529 |
-
|
530 |
</p>
|
531 |
|
532 |
-
<p>
|
533 |
-
モデルの最高性能は、DiffusionサンプラーとKotodamaがシームレスに連携することで達成されます。しかし、<br>
|
534 |
-
このチェックポイントは時間とリソースの制約からややTrain不足であるため、そのレベルの性能はここでは見られません。<br>
|
535 |
-
(この件について、「紬」のチェックポイントの方がいいかもしれません。でもまぁ、みなさんのハードに互換性があればね。)<br>
|
536 |
-
おそらく、このモデルをさらにFinetuningする(または最初からTrainする)ことで、より良い結果が得られるでしょう。
|
537 |
-
</p>
|
538 |
|
539 |
_____________________________________________<br>\n
|
540 |
<strong>音声デザインとプロンプトに関する有用なメモ:</strong><br>
|
|
|
1 |
INTROTXT = """#
|
2 |
+
Repo -> [Hugging Face - 🤗](https://huggingface.co/Respair/Tsukasa_Speech/edit/main/app_tsuka.py)
|
3 |
This space uses Tsukasa (24khz).
|
4 |
**Check the Read me tabs down below.** <br>
|
5 |
Enjoy!
|
|
|
414 |
|
415 |
<p>
|
416 |
<b>Kotodama</b> and the <b>Diffusion sampler</b> can significantly help guide the generation towards<br>
|
417 |
+
something that aligns with your input, but they aren't foolproof. turn off the diffusion sampler or <br>
|
418 |
+
set it to very low values if it doesn't sound good to you. <br>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
419 |
</p>
|
420 |
|
421 |
<p>
|
|
|
519 |
|
520 |
<p>
|
521 |
<b>Kotodama</b>と<b>Diffusionサンプラー</b>は、入力に沿ったものを生成するための大きな助けとなりますが、<br>
|
522 |
+
万全というわけではありません。良いアウトプットが出ない場合は、ディフュージョンサンプラーをオフにするか、非常に低い値に設定してください。
|
523 |
</p>
|
524 |
|
|
|
|
|
|
|
|
|
|
|
|
|
525 |
|
526 |
_____________________________________________<br>\n
|
527 |
<strong>音声デザインとプロンプトに関する有用なメモ:</strong><br>
|