💻 [Github Repo] • 📃 [Paper]
本项目旨在探索大型语言模型的数据高效训练方法,研究如何有效地构建和使用数据集,以便让模型更好地学习语言表达和通用能力。我们将利用前沿的NLP科研成果持续提升模型性能,模型权重将完全开源,并提供简洁明了的训练方法和推理部署方式。
在version 1中,我们关注指令微调的过程。Dynamics of Instruction Tuning一文揭示了大型语言模型的各种能力在指令微调过程中会受到多种因素的影响,从而产生不同的发展速率。我们利用文中开源的包含了创意写作、代码生成、逻辑推理等十项能力类别的人工清洗指令集DoIT,来验证基于Baichuan2-13B-Base训练通用智能模型的效果。
引用:
@article{song2023dynamics,
title={Dynamics of Instruction Tuning: Each Ability of Large Language Models Has Its Own Growth Pace},
author={Song, Chiyu and Zhou, Zhanchao and Yan, Jianhao and Fei, Yuejiao and Lan, Zhenzhong and Zhang, Yue},
journal={arXiv preprint arXiv:2310.19651},
year={2023}
}
- Downloads last month
- 6
Inference API (serverless) does not yet support model repos that contain custom code.