ChiyuSONG
/

data-efficient-training-of-LLMs-v1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

data-efficient-training-of-LLMs-v1 / README.md

ChiyuSONG's picture

Update README.md

48fa13d 11 months ago

|

No virus

1.2 kB

	---
	license: mit
	datasets:
	- ChiyuSONG/dynamics-of-instruction-tuning
	language:
	- zh
	---

	<p align="center">
	💻 <a href="https://github.com/ChiyuSONG/data-efficient-training-of-LLMs" target="_blank">[Github Repo]</a> • 📃 <a href="https://arxiv.org/abs/2310.19651" target="_blank">[Paper]</a>
	</p>


	本[项目](https://github.com/ChiyuSONG/data-efficient-training-of-LLMs)旨在探索大型语言模型的数据高效训练方法，研究如何有效地构建和使用数据集，以便让模型更好地学习语言表达和通用能力。我们将利用前沿的NLP科研成果持续提升模型性能，模型权重将完全开源，并提供简洁明了的训练方法和推理部署方式。

	在version 1中，我们关注指令微调的过程。[Dynamics of Instruction Tuning](https://arxiv.org/abs/2310.19651)一文揭示了大型语言模型的各种能力在指令微调过程中会受到多种因素的影响，从而产生不同的发展速率。我们利用文中开源的包含了创意写作、代码生成、逻辑推理等十项能力类别的人工清洗指令集，来验证基于[Baichuan2-13B-Base](https://arxiv.org/abs/2309.10305)训练通用智能模型的效果。