TurboPascal commited on
Commit
424d5f1
·
1 Parent(s): 7d92ff5

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +1 -1
README.md CHANGED
@@ -34,7 +34,7 @@ Notes:
34
 
35
  ## 数据
36
 
37
- 预训练阶段使用开源数据与本项目爬取的部分数据。共使用约33G中文预训练数据
38
 
39
  ### 中文预训练数据
40
 
 
34
 
35
  ## 数据
36
 
37
+ 预训练阶段使用开源数据与本项目爬取的部分数据。共使用约33G中文预训练数据、MC4-zh、Code数据集。清洗后筛选共120G左右数据训练1epoch。未经过指令微调。
38
 
39
  ### 中文预训练数据
40