Update README.md
Browse files
README.md
CHANGED
@@ -17,10 +17,13 @@ license: apache-2.0
|
|
17 |
|
18 |
本次发布版本和下载链接见下表
|
19 |
|
20 |
-
| 模型版本 | 参数量 | 下载链接 |
|
21 |
-
|
22 |
-
| pretrain_base | 0.09 B | [TeleSpeech-ASR1.0-base](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/base.pt) |
|
23 |
-
| pretrain_large | 0.3 B | [TeleSpeech-ASR1.0-large](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/large.pt) |
|
|
|
|
|
|
|
24 |
|
25 |
|
26 |
# 环境配置
|
@@ -143,6 +146,11 @@ utt:X0000000001_100849618_S00006 feat:/data/raw_nnaudio.test.1.ark:2984296665 fe
|
|
143 |
|
144 |
*WenetSpeech中的结果为分别使用 `train_s/train_m`训练后,在Test_Meeting上的CER
|
145 |
|
|
|
|
|
|
|
|
|
|
|
146 |
# 声明与协议
|
147 |
## 声明
|
148 |
我们在此声明,不要使用TeleSpeech模型及其衍生模型进行任何危害国家社会安全或违法的活动。同时,我们也要求使用者不要将TeleSpeech模型用于没有安全审查和备案的互联网服务。我们希望所有使用者遵守上述原则,确保科技发展在合法合规的环境下进行。
|
|
|
17 |
|
18 |
本次发布版本和下载链接见下表
|
19 |
|
20 |
+
| 模型版本 | 参数量 | 下载链接 | 字典 |
|
21 |
+
|---------------------|-------|---------------------|-------|
|
22 |
+
| pretrain_base | 0.09 B | [TeleSpeech-ASR1.0-base](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/base.pt) | ✗ |
|
23 |
+
| pretrain_large | 0.3 B | [TeleSpeech-ASR1.0-large](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/large.pt) | ✗ |
|
24 |
+
| finetune_large_kespeech | 0.3 B | [TeleSpeech-ASR1.0-large-kespeech](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/finetune_large_kespeech.pt) | [dict.char7531.txt](https://huggingface.co/Tele-AI/TeleSpeech-ASR1.0/blob/main/dict.chr7531.txt) |
|
25 |
+
|
26 |
+
finetune模型为已经微调过的模型,可直接使用;pretrain模型为无监督预训练模型,我们提供了两种有监督训练框架,用于下游ASR任务:基于fairseq的微调、基于wenet的表征提取训练ASR模型(特征提取器)
|
27 |
|
28 |
|
29 |
# 环境配置
|
|
|
146 |
|
147 |
*WenetSpeech中的结果为分别使用 `train_s/train_m`训练后,在Test_Meeting上的CER
|
148 |
|
149 |
+
KeSpeech各方言上结果
|
150 |
+
| 模型版本 | 普通话 | 北京 | 西南 | 中原 | 东北 | 兰银 | 江淮 | 冀鲁 | 胶辽 |
|
151 |
+
| ---------| ------ | ---- | ---- | ---- |---- | ---- | ---- | ---- | ---- |
|
152 |
+
| pretrain_large | 4.61 | 8.23 | 8.74 | 7.62 | 7.89 | 9.72 | 12.89 | 8.91 | 9.30 |
|
153 |
+
|
154 |
# 声明与协议
|
155 |
## 声明
|
156 |
我们在此声明,不要使用TeleSpeech模型及其衍生模型进行任何危害国家社会安全或违法的活动。同时,我们也要求使用者不要将TeleSpeech模型用于没有安全审查和备案的互联网服务。我们希望所有使用者遵守上述原则,确保科技发展在合法合规的环境下进行。
|