Update README.md
Browse files
README.md
CHANGED
@@ -21,7 +21,7 @@ datasets:
|
|
21 |
# 三、 训练细节
|
22 |
- 数据集 openwebtext
|
23 |
- 训练batch_size 256
|
24 |
-
- 学习率lr
|
25 |
- 最大句子长度max_seqlen 128
|
26 |
- 训练total step 625000
|
27 |
- GPU RTX3090
|
|
|
21 |
# 三、 训练细节
|
22 |
- 数据集 openwebtext
|
23 |
- 训练batch_size 256
|
24 |
+
- 学习率lr 5e-4
|
25 |
- 最大句子长度max_seqlen 128
|
26 |
- 训练total step 625000
|
27 |
- GPU RTX3090
|