yuyijiong
/

Qwen-14b-chat-yarn-32k

Text Generation

Model card Files Files and versions Community

yuyijiong commited on Dec 15, 2023

Commit

b7c96cd

•

1 Parent(s): 04ae6e6

Upload 2 files

Files changed (2) hide show

README.md +2 -6
README_en.md +1 -0

README.md CHANGED Viewed

@@ -19,6 +19,7 @@ pipeline_tag: text-generation
 | 模型                           | 得分 (acc) |
 |------------------------------|----------|
 | **Qwen-14b-chat-yarn-32k**   |**0.94**|
 | chatglm3-32k                 | 0.725    |
 | Qwen-14b-chat (use_dynamic_ntk=True) | 0.525    |
 | Qwen-14b-chat-32k-lora       | 0.34     |
@@ -69,17 +70,12 @@ print(response)
 <br>
-# 未来研究计划
-* 训练Qwen-7b版本的32k模型，以及Llama版本的32k模型。
-* 指令微调数据进一步改进，增强模型agent能力。
 # 问答例子
 * 模型支持中文和英文，支持长文本总结、多文档问答、长文本问答、多轮对话等任务。
 * 经过指令微调，模型在面对多文档问答问题时，会先给出原文，再回答，内部幻觉问题显著降低。
 <details>
-    <summary
->多文档QA</summary>
   多文档QA示例问题（24941字）
   <pre><code>

 | 模型                           | 得分 (acc) |
 |------------------------------|----------|
 | **Qwen-14b-chat-yarn-32k**   |**0.94**|
+|gpt-3.5-turbo-16k | 0.81 |
 | chatglm3-32k                 | 0.725    |
 | Qwen-14b-chat (use_dynamic_ntk=True) | 0.525    |
 | Qwen-14b-chat-32k-lora       | 0.34     |
 <br>
 # 问答例子
 * 模型支持中文和英文，支持长文本总结、多文档问答、长文本问答、多轮对话等任务。
 * 经过指令微调，模型在面对多文档问答问题时，会先给出原文，再回答，内部幻觉问题显著降低。
 <details>
+    <summary>多文档QA</summary>
   多文档QA示例问题（24941字）
   <pre><code>

README_en.md CHANGED Viewed

@@ -19,6 +19,7 @@ pipeline_tag: text-generation
 | Models                               | Accuracy |
 |--------------------------------------|----------|
 | **Qwen-14b-chat-yarn-32k**           | **0.94** |
 | chatglm3-32k                         | 0.725    |
 | Qwen-14b-chat (use_dynamic_ntk=True) | 0.525    |
 | Qwen-14b-chat-32k-lora               | 0.34     |

 | Models                               | Accuracy |
 |--------------------------------------|----------|
 | **Qwen-14b-chat-yarn-32k**           | **0.94** |
+| gpt-3.5-turbo-16k                    | 0.81     |
 | chatglm3-32k                         | 0.725    |
 | Qwen-14b-chat (use_dynamic_ntk=True) | 0.525    |
 | Qwen-14b-chat-32k-lora               | 0.34     |