File size: 1,393 Bytes
516d4ee
 
 
 
 
 
 
 
 
08c3a7a
516d4ee
9f27578
516d4ee
 
 
 
 
 
 
 
 
 
3299e00
 
 
 
 
 
516d4ee
 
 
 
 
 
 
 
 
 
2bcde9b
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
---
language: 
  - jp
tags:
- つくよみちゃん
- StyleBertVITS2
license: "other"
---

# Style-Bert-VITS2向けの事前学習モデル

[Style-Bert-VITS2](https://github.com/litagin02/Style-Bert-VITS2)で使用できる事前学習データになります

## 学習データセット
* [つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/) 
* [みんなで作るJSUTコーパスbasic5000 BASIC5000_0001~BASIC5000_0600](https://tyc.rei-yumesaki.net/material/minnade-jsut/) (夢前黎担当部分を許可を得て使用)

## 学習パラメータ
* 最終ステップ数 : 375k step
* 学習時間 100 ~ 200時間程度
* bfloat16 : false

## 学習済みモデル

学習済みモデルには、pthとsafetensorsの二つをアップロードしています。

pthからsafetensorsへの変換には、[学習したpthファイルから事前学習モデルsafetensorsを作るやつ](https://gist.github.com/litagin02/c6ab8a35c2b2b779c632ca820b805267)を参考にこちらで改変したものを使用しました

## SpeechMOSによる自然性評価

![](mos_pretraing.png)

## loss

![](image.png)


# ライセンス
* ライセンスは、[つくよみちゃんコーパス│声優統計コーパス(JVSコーパス準拠)](https://tyc.rei-yumesaki.net/material/corpus/)に準じます