File size: 1,393 Bytes
516d4ee 08c3a7a 516d4ee 9f27578 516d4ee 3299e00 516d4ee 2bcde9b |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 |
---
language:
- jp
tags:
- つくよみちゃん
- StyleBertVITS2
license: "other"
---
# Style-Bert-VITS2向けの事前学習モデル
[Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります
## 学習データセット
* [つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/)
* [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001~BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) (夢前黎担当部分を許可を得て使用)
## 学習パラメータ
* 最終ステップ数 : 375k step
* 学習時間 100 ~ 200時間程度
* bfloat16 : false
## 学習済みモデル
学習済みモデルには、pthとsafetensorsの二つをアップロードしています。
pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました
## SpeechMOSによる自然性評価
![](mos_pretraing.png)
## loss
![](image.png)
# ライセンス
* ライセンスは、[つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/)に準じます |