Update README.md
Browse files
README.md
CHANGED
@@ -3,6 +3,9 @@ license: apache-2.0
|
|
3 |
---
|
4 |
## few_shot_intent_gpt2
|
5 |
|
6 |
-
这个模型是基于 []() 模型在 [qgyd2021/few_shot_intent_sft](https://huggingface.co/datasets/qgyd2021/few_shot_intent_sft) 数据集上微调的结果.
|
7 |
-
|
|
|
|
|
|
|
8 |
|
|
|
3 |
---
|
4 |
## few_shot_intent_gpt2
|
5 |
|
6 |
+
这个模型是基于 [uer/gpt2-chinese-cluecorpussmall](https://huggingface.co/uer/gpt2-chinese-cluecorpussmall) 模型在 [qgyd2021/few_shot_intent_sft](https://huggingface.co/datasets/qgyd2021/few_shot_intent_sft) 数据集上微调的结果.
|
7 |
+
|
8 |
+
原本准备了 3 个 epoch 的数据,但模型在大约 1 个 epoch 时就 Early Stop 了。
|
9 |
+
|
10 |
+
最终的模型大约是在训练了 0.6 个 epoch 时保存的结果。
|
11 |
|