Update README.md
Browse files
README.md
CHANGED
@@ -20,7 +20,7 @@ tags:
|
|
20 |
|
21 |
### 数据集
|
22 |
|
23 |
-
以 m-a-p/neo_sft_phase2
|
24 |
|
25 |
1. REILX/neo_sft_phase2_conversations
|
26 |
2. REILX/neo_sft_phase2_multi
|
@@ -30,7 +30,7 @@ tags:
|
|
30 |
|
31 |
**REILX/neo_sft_phase2_conversations**
|
32 |
|
33 |
-
* **方法:**
|
34 |
* **具体步骤:**
|
35 |
1. 针对每个“conversation”,逐一遍历其对话轮次。
|
36 |
2. 将当前“human”轮次的“value”与之前所有轮次的对话内容拼接,构成完整的“instruction”。
|
@@ -39,7 +39,7 @@ tags:
|
|
39 |
|
40 |
**REILX/neo_sft_phase2_multi**
|
41 |
|
42 |
-
* **方法:**
|
43 |
* **具体步骤:**
|
44 |
1. 针对每个“conversation”,逐一遍历其对话轮次。
|
45 |
2. 将每个“conversation”中所有“human”的“value”拼接,构成完整的“instruction”。
|
|
|
20 |
|
21 |
### 数据集
|
22 |
|
23 |
+
以 m-a-p/neo_sft_phase2 数据集为基石,构建了三个子数据集,分别如下:
|
24 |
|
25 |
1. REILX/neo_sft_phase2_conversations
|
26 |
2. REILX/neo_sft_phase2_multi
|
|
|
30 |
|
31 |
**REILX/neo_sft_phase2_conversations**
|
32 |
|
33 |
+
* **方法:** 将每轮对话视作独立的问答对,融入上下文信息构建样本。
|
34 |
* **具体步骤:**
|
35 |
1. 针对每个“conversation”,逐一遍历其对话轮次。
|
36 |
2. 将当前“human”轮次的“value”与之前所有轮次的对话内容拼接,构成完整的“instruction”。
|
|
|
39 |
|
40 |
**REILX/neo_sft_phase2_multi**
|
41 |
|
42 |
+
* **方法:** 将每轮对话视作独立的问答对,利用上下文信息构建样本。
|
43 |
* **具体步骤:**
|
44 |
1. 针对每个“conversation”,逐一遍历其对话轮次。
|
45 |
2. 将每个“conversation”中所有“human”的“value”拼接,构成完整的“instruction”。
|