Update README.md
Browse files
README.md
CHANGED
@@ -37,7 +37,9 @@ Tokenizer 选用了 [Yi-1.5-9B-Chat](https://huggingface.co/01-ai/Yi-1.5-9B-Chat
|
|
37 |
|
38 |
不同于 SmolLM 在最后 20% 的步骤开始衰减学习率,这里梯形调度的衰减步骤占比达到了 30%,采用和 MiniCPM 一致的指数衰减,最低衰减至最大学习率的 1%。
|
39 |
|
40 |
-
|
|
|
|
|
41 |
|
42 |
**尚未进行任何基准测试。**
|
43 |
|
|
|
37 |
|
38 |
不同于 SmolLM 在最后 20% 的步骤开始衰减学习率,这里梯形调度的衰减步骤占比达到了 30%,采用和 MiniCPM 一致的指数衰减,最低衰减至最大学习率的 1%。
|
39 |
|
40 |
+
在非常多的开源数据集上进行了训练,并做了进一步筛选和过滤,因此仅列举了部分主要数据集。
|
41 |
+
|
42 |
+
训练数据整体比例大约为中文:英文:代码 = 4:4:2,同时中英文中均混合了一定的指令数据。
|
43 |
|
44 |
**尚未进行任何基准测试。**
|
45 |
|