unakar commited on
Commit
eea091d
·
verified ·
1 Parent(s): 3572513

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -0
README.md CHANGED
@@ -10,7 +10,9 @@ base_model: unakar/Unakar1.5B-base
10
  pipeline_tag: text-generation
11
  ---
12
  此为base model,未经SFT与DPO对齐,不具备指令跟随能力
 
13
  Instruct版本与榜单测评结果9月中旬前后放出。作者正忙着大四开学,等我一会~
 
14
  争取10月前放出完整的教程/技术报告/pretrain数据/全流程logbook
15
 
16
  Pretrain数据主要来自huggingface上一些开源数据,经过合成过滤得到,比如fineweb-edu,dclm, llama3-syne。考虑到phi的textbook is all your need,大部分主题都是wiki和textbook。其余是代码/数学/问答/推理/通用等等。
 
10
  pipeline_tag: text-generation
11
  ---
12
  此为base model,未经SFT与DPO对齐,不具备指令跟随能力
13
+
14
  Instruct版本与榜单测评结果9月中旬前后放出。作者正忙着大四开学,等我一会~
15
+
16
  争取10月前放出完整的教程/技术报告/pretrain数据/全流程logbook
17
 
18
  Pretrain数据主要来自huggingface上一些开源数据,经过合成过滤得到,比如fineweb-edu,dclm, llama3-syne。考虑到phi的textbook is all your need,大部分主题都是wiki和textbook。其余是代码/数学/问答/推理/通用等等。