ChiyuSONG's picture
Update README.md
48fa13d
|
raw
history blame
No virus
1.2 kB
---
license: mit
datasets:
- ChiyuSONG/dynamics-of-instruction-tuning
language:
- zh
---
<p align="center">
💻 <a href="https://github.com/ChiyuSONG/data-efficient-training-of-LLMs" target="_blank">[Github Repo]</a> • 📃 <a href="https://arxiv.org/abs/2310.19651" target="_blank">[Paper]</a>
</p>
本[项目](https://github.com/ChiyuSONG/data-efficient-training-of-LLMs)旨在探索大型语言模型的数据高效训练方法,研究如何有效地构建和使用数据集,以便让模型更好地学习语言表达和通用能力。我们将利用前沿的NLP科研成果持续提升模型性能,模型权重将完全开源,并提供简洁明了的训练方法和推理部署方式。
在version 1中,我们关注指令微调的过程。[Dynamics of Instruction Tuning](https://arxiv.org/abs/2310.19651)一文揭示了大型语言模型的各种能力在指令微调过程中会受到多种因素的影响,从而产生不同的发展速率。我们利用文中开源的包含了创意写作、代码生成、逻辑推理等十项能力类别的人工清洗指令集,来验证基于[Baichuan2-13B-Base](https://arxiv.org/abs/2309.10305)训练通用智能模型的效果。