TTTdas commited on
Commit
31e0429
1 Parent(s): 643e4fc

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +6 -13
README.md CHANGED
@@ -9,7 +9,7 @@ license: apache-2.0
9
  </div>
10
 
11
  <p align="center">
12
- 🦉 <a href="https://github.com/Tele-AI/TeleSpeech-ASR" target="_blank">github</a>️ • 🐾 <a href="https://gitee.com/Tele-AI/TeleSpeech-ASR" target="_blank">gitee</a>️
13
  </p>
14
 
15
  星辰超多方言语音识别大模型v1.0,由30万小时无标注多方言语音数据进行预训练,并利用内部30种有标注数据进行微调,打破单一模型只能识别特定单一方言的困境,可支持理解粤语、上海话、四川话、温州话等30种方言
@@ -28,14 +28,12 @@ license: apache-2.0
28
 
29
 
30
  # 环境配置
31
- 环境依赖
32
  * PyTorch version >= 1.13.0
33
  * Python version >= 3.8
34
  * 数据准备、程序训练需要使用kaldi,请确保已正确安装:https://github.com/kaldi-asr/kaldi
35
  * 若已有提好的特征,程序运行时可以使用wenet开源框架中kaldi_io.py实现的方法替换kaldiio.load_mat,从而无需安装kaldi
36
 
37
- ## 微调
38
-
39
  <a id="fairseq安装"></a>
40
  * 安装fairseq及其依赖
41
  ```shell script
@@ -44,19 +42,14 @@ $ cd fairseq
44
  $ pip install --editable ./
45
  ```
46
 
47
- * 安装kaldiio
48
  ```shell script
49
- $ pip install kaldiio
50
  ```
51
 
52
- ## 表征训练下游任务
53
-
54
- * 确保fairseq已正确[安装](#fairseq安装)
55
-
56
- * 安装表征训练任务运行所需依赖
57
  ```shell script
58
- $ cd wenet_representation
59
- $ pip install -r requirements.txt
60
  ```
61
 
62
  # 数据准备
 
9
  </div>
10
 
11
  <p align="center">
12
+ 🦉 <a href="https://github.com/Tele-AI/TeleSpeech-ASR" target="_blank">github</a>️ • 🐾 <a href="https://gitee.com/Tele-AI/TeleSpeech-ASR" target="_blank">gitee</a>️ • 🤖 <a href="https://www.modelscope.cn/models/TeleAI/TeleSpeech-ASR1.0/summary" target="_blank">ModelScope</a>
13
  </p>
14
 
15
  星辰超多方言语音识别大模型v1.0,由30万小时无标注多方言语音数据进行预训练,并利用内部30种有标注数据进行微调,打破单一模型只能识别特定单一方言的困境,可支持理解粤语、上海话、四川话、温州话等30种方言
 
28
 
29
 
30
  # 环境配置
31
+
32
  * PyTorch version >= 1.13.0
33
  * Python version >= 3.8
34
  * 数据准备、程序训练需要使用kaldi,请确保已正确安装:https://github.com/kaldi-asr/kaldi
35
  * 若已有提好的特征,程序运行时可以使用wenet开源框架中kaldi_io.py实现的方法替换kaldiio.load_mat,从而无需安装kaldi
36
 
 
 
37
  <a id="fairseq安装"></a>
38
  * 安装fairseq及其依赖
39
  ```shell script
 
42
  $ pip install --editable ./
43
  ```
44
 
45
+ * 安装fairseq额外依赖以及wenet表征训练任务运行所需依赖
46
  ```shell script
47
+ $ pip install -r requirements.txt
48
  ```
49
 
50
+ * 若只需要fairseq进行微调、解码,可以不安装完整的requirements.txt,只需保证kaldiio, timm, editdistance, soundfile已正确安装
 
 
 
 
51
  ```shell script
52
+ $ pip install kaldiio timm editdistance soundfile
 
53
  ```
54
 
55
  # 数据准备