Respair commited on
Commit
d9acc03
1 Parent(s): 96d0e4b

Update app_tsuka.py

Browse files
Files changed (1) hide show
  1. app_tsuka.py +4 -17
app_tsuka.py CHANGED
@@ -1,5 +1,5 @@
1
  INTROTXT = """#
2
- Repo -> [Hugging Face - 🤗](https://huggingface.co/Respair/Project_Kanade_SpeechModel)
3
  This space uses Tsukasa (24khz).
4
  **Check the Read me tabs down below.** <br>
5
  Enjoy!
@@ -414,15 +414,8 @@ over the generation process, which means it's easy to inadvertently produce unim
414
 
415
  <p>
416
  <b>Kotodama</b> and the <b>Diffusion sampler</b> can significantly help guide the generation towards<br>
417
- something that aligns with your input, but they aren't foolproof.
418
- </p>
419
-
420
- <p>
421
- The model's peak performance is achieved when the Diffusion sampler and Kotodama work seamlessly together.<br>
422
- However, we won't see that level of performance here because this checkpoint is somewhat undertrained<br>
423
- due to my time and resource constraints. (Tsumugi should be better in this regard, <br>
424
- albeit if the diffusion works at all on your hardware.) <br>
425
- Hopefully, you can further fine-tune this model (or train from scratch) to achieve even better results!
426
  </p>
427
 
428
  <p>
@@ -526,15 +519,9 @@ notes_jp = """
526
 
527
  <p>
528
  <b>Kotodama</b>と<b>Diffusionサンプラー</b>は、入力に沿ったものを生成するための大きな助けとなりますが、<br>
529
- 万全というわけではありません。
530
  </p>
531
 
532
- <p>
533
- モデルの最高性能は、DiffusionサンプラーとKotodamaがシームレスに連携することで達成されます。しかし、<br>
534
- このチェックポイントは時間とリソースの制約からややTrain不足であるため、そのレベルの性能はここでは見られません。<br>
535
- (この件について、「紬」のチェックポイントの方がいいかもしれません。でもまぁ、みなさんのハードに互換性があればね。)<br>
536
- おそらく、このモデルをさらにFinetuningする(または最初からTrainする)ことで、より良い結果が得られるでしょう。
537
- </p>
538
 
539
  _____________________________________________<br>\n
540
  <strong>音声デザインとプロンプトに関する有用なメモ:</strong><br>
 
1
  INTROTXT = """#
2
+ Repo -> [Hugging Face - 🤗](https://huggingface.co/Respair/Tsukasa_Speech/edit/main/app_tsuka.py)
3
  This space uses Tsukasa (24khz).
4
  **Check the Read me tabs down below.** <br>
5
  Enjoy!
 
414
 
415
  <p>
416
  <b>Kotodama</b> and the <b>Diffusion sampler</b> can significantly help guide the generation towards<br>
417
+ something that aligns with your input, but they aren't foolproof. turn off the diffusion sampler or <br>
418
+ set it to very low values if it doesn't sound good to you. <br>
 
 
 
 
 
 
 
419
  </p>
420
 
421
  <p>
 
519
 
520
  <p>
521
  <b>Kotodama</b>と<b>Diffusionサンプラー</b>は、入力に沿ったものを生成するための大きな助けとなりますが、<br>
522
+ 万全というわけではありません。良いアウトプットが出ない場合は、ディフュージョンサンプラーをオフにするか、非常に低い値に設定してください。
523
  </p>
524
 
 
 
 
 
 
 
525
 
526
  _____________________________________________<br>\n
527
  <strong>音声デザインとプロンプトに関する有用なメモ:</strong><br>