qgyd2021 commited on
Commit
f5cd69e
1 Parent(s): 5be1256

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +24 -0
README.md CHANGED
@@ -1,3 +1,27 @@
1
  ---
2
  license: apache-2.0
 
 
 
 
 
 
 
 
 
3
  ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
  ---
2
  license: apache-2.0
3
+ language:
4
+ - zh
5
+ - en
6
+ - id
7
+ - hi
8
+ metrics:
9
+ - accuracy
10
+ tags:
11
+ - early_media
12
  ---
13
+ ## EarlyMedia早媒体声音分类
14
+
15
+ 给对方打电话时, 对方电话还没有接通时, 有响铃, 音乐, 用户忙, 不在服务区, 无人接听, 已停机, 等状态.
16
+
17
+ 号码拨打测试时, 会把电话接通前的录音保存, 给到算法. 我们的算法:
18
+
19
+ (1) 录音中的声音分为四种: 响铃, 音乐, 静音, 人声.
20
+
21
+ (2) 假如完整的录音有 20 秒, 首先按每秒一个分类标签对音频分类, 得到 20 个标签.
22
+
23
+ (3) 根据 20 个标签, 找到 "人声" 对应的音频段, 从 20 秒完整音频中截取出来.
24
+
25
+ (4) 在 "人声" 的音频上做模板匹配, 如果匹配到 "用户忙" 的模板, 则这通电话就是 "用户忙".
26
+
27
+ 此模型就是用于**四种**声音分类的模型, 它原本是用 [AllenNLP](guide.allennlp.org) 训练的, 现在训练代码已经找不到了, 但是此模型比较简单.