yuyijiong
/

LongAlpaca-7b-32k-chinese

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

yuyijiong commited on Oct 25, 2023

Commit

a6153be

•

1 Parent(s): 1cbbde0

Update README.md

Files changed (1) hide show

README.md +2 -1

README.md CHANGED Viewed

@@ -7,11 +7,12 @@ language:
 - en
 pipeline_tag: text-generation
 ---
 * [LongAlpaca](https://huggingface.co/Yukang/LongAlpaca-7B)通过对 llama2-chat 进行少量长文本数据的微调，展现出了优秀的长文本对话能力。
 * LongAlpaca-7b-chinese 和 LongAlpaca 使用类似的训练方法：先使用线性位置插值，然后通过少量长文本数据的微调，使其获得优秀的长文本对话能力。
 * 使用的数据集与LongAlpaca较为类似，但增加了多文档问答的数据。
 * 此模型由atom-7b-chat经过lora微调得到，通过线性位置插值，将文本长度从4k扩展到32k，可以完成上万字的多文档检索、论文总结等任务，已经能满足绝大部分需要，而短对话能力几乎没有下降。
-* 由于指令微调数据的任务类型并不是很多，在面对比较负责的任务时，输出结果的质量仍不能保证。如果使用中遇到问题，欢迎在后台提出issue。
 * 使用方法：
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer

 - en
 pipeline_tag: text-generation
 ---
+# 中文长文本Llama模型
 * [LongAlpaca](https://huggingface.co/Yukang/LongAlpaca-7B)通过对 llama2-chat 进行少量长文本数据的微调，展现出了优秀的长文本对话能力。
 * LongAlpaca-7b-chinese 和 LongAlpaca 使用类似的训练方法：先使用线性位置插值，然后通过少量长文本数据的微调，使其获得优秀的长文本对话能力。
 * 使用的数据集与LongAlpaca较为类似，但增加了多文档问答的数据。
 * 此模型由atom-7b-chat经过lora微调得到，通过线性位置插值，将文本长度从4k扩展到32k，可以完成上万字的多文档检索、论文总结等任务，已经能满足绝大部分需要，而短对话能力几乎没有下降。
+* 由于指令微调数据的任务类型并不是很多，在面对比较负责的任务时，输出结果的质量仍不能保证。如果使用中遇到问题，欢迎在后台提出discussion。
 * 使用方法：
 ```python
 from transformers import AutoModelForCausalLM, AutoTokenizer