Update README.md
Browse files
README.md
CHANGED
@@ -16,30 +16,45 @@ zjunlp/knowlm-13b-ie 从中英文信息抽取数据集中采样约 10% 的数据
|
|
16 |
|
17 |
|
18 |
# 📏 2.信息抽取模板
|
19 |
-
模版`template
|
20 |
-
1.
|
21 |
-
2.
|
22 |
-
3.
|
23 |
|
24 |
|
25 |
-
|
26 |
-
```json
|
27 |
-
NER: "你是专门进行实体抽取的专家。已知候选的实体类型列表:{s_schema},请你根据实体类型列表,从以下输入中抽取出可能存在的实体,如果不存在某实体就输出NAN。请按照{s_format}的格式回答。"
|
28 |
-
RE: "你在这里扮演关系三元组识别师的角色。我将给你个输入,请根据关系列表:{s_schema},从输入中抽取出可能包含的关系三元组,,如果不存在某关系就输出NAN,并以{s_format}的形式回答。"
|
29 |
-
EE: "你是专门进行事件提取的专家。已知候选的事件字典:{s_schema},请你根据事件字典,从以下输入中抽取出可能存在的事件,如果不存在某事件就输出NAN。请按照{s_format}的格式回答。"
|
30 |
-
EET: "作为事件分析专员,你需要查看输入并根据事件类型名录:{s_schema},来确定可能发生的事件。所有回答都应该基于{s_format}格式。如果事件类型不匹配,请用NAN标记。"
|
31 |
-
EEA: "你是专门进行事件论元提取的专家。已知事件字典:{s_schema1},事件类型及触发词:{s_schema2},请你从以下输入中抽取出可能存在的论元,如果不存在某事件论元就输出NAN。请按照{s_format}的格式回答。"
|
32 |
```
|
|
|
33 |
|
34 |
-
|
35 |
-
|
36 |
-
|
37 |
-
|
38 |
-
|
39 |
-
|
40 |
-
|
41 |
```
|
42 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
43 |
<details>
|
44 |
<summary><b>候选标签列表{s_schema}</b></summary>
|
45 |
|
@@ -59,12 +74,16 @@ zjunlp/knowlm-13b-ie 从中英文信息抽取数据集中采样约 10% 的数据
|
|
59 |
<summary><b>结构输出格式{s_format}</b></summary>
|
60 |
|
61 |
|
62 |
-
```
|
63 |
-
NER: (实体,实体类型)
|
64 |
-
|
65 |
-
|
66 |
-
|
67 |
-
|
|
|
|
|
|
|
|
|
68 |
```
|
69 |
|
70 |
</details>
|
@@ -200,22 +219,22 @@ python kg2instruction/convert.py \
|
|
200 |
|
201 |
|
202 |
```
|
203 |
-
|
204 |
[] # 空列表
|
205 |
["创始人", "号", "注册资本",...] # 关系类型列表
|
206 |
{} # 空字典
|
207 |
|
208 |
-
|
209 |
["交往-感谢", "组织行为-开幕", "竞赛行为-退赛", ...] # 事件类型列表
|
210 |
["解雇方", "解约方", "举报发起方", "被拘捕者"] # 论元角色列表
|
211 |
{"组织关系-裁员": ["裁员方", "裁员人数", "时间"], "司法行为-起诉": ["原告", "被告", "时间"], ...} # 事件类型字典
|
212 |
|
213 |
-
|
214 |
["交往-感谢", "组织行为-开幕", "竞赛行为-退赛", ...] # 事件类型列表
|
215 |
[] # 空列表
|
216 |
{} # 空字典
|
217 |
|
218 |
-
|
219 |
["交往-感谢", "组织行为-开幕", "竞赛行为-退赛", ...] # 事件类型列表
|
220 |
["解雇方", "解约方", "举报发起方", "被拘捕者"] # 论元角色列表
|
221 |
{"组织关系-裁员": ["裁员方", "裁员人数", "时间"], "司法行为-起诉": ["原告", "被告", "时间"], ...} # 事件类型字典
|
@@ -274,47 +293,47 @@ python kg2instruction/convert_test.py \
|
|
274 |
<summary><b>更多</b></summary>
|
275 |
|
276 |
- 转换前
|
277 |
-
```
|
278 |
-
RE: {
|
279 |
"input": "如何演好自己的角色,请读《演员自我修养》《喜剧之王》周星驰崛起于穷困潦倒之中的独门秘笈",
|
280 |
"relation": [{"head": "喜剧之王", "relation": "主演", "tail": "周星驰"}]
|
281 |
}
|
282 |
-
EE: {
|
283 |
"input": "消失的“外企光环”,5月份在华裁员900余人,香饽饽变“臭”了",
|
284 |
"event": [{"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "900余人", "role": "裁员人数"}, {"argument": "5月份", "role": "时间"}]}]
|
285 |
}
|
286 |
-
EET: {
|
287 |
"input": "前两天,被称为 “ 仅次于苹果的软件服务商 ” 的 Oracle( 甲骨文 )公司突然宣布在中国裁员。。",
|
288 |
"event": [{"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "前两天", "role": "时间"}, {"argument": "被称为 “ 仅次于苹果的软件服务商 ” 的 Oracle( 甲骨文 )公司", "role": "裁员方"}]}]
|
289 |
}
|
290 |
-
EEA: {
|
291 |
"input": "不仅仅是中国IT企业在裁员,为何500强的甲骨文也发生了全球裁员",
|
292 |
"event": [{"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "中国IT企业", "role": "裁员方"}]}, {"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "500强的甲骨文", "role": "裁员方"}]}]
|
293 |
}
|
294 |
```
|
295 |
|
296 |
- 转换后
|
297 |
-
|
298 |
-
RE: {
|
299 |
"id": "5526d8aa9520a0feaa045ae41d347cf7ca48bd84385743ed453ea57dbe743c7c",
|
300 |
"instruction": "你是专门进行关系三元组提取的专家。已知候选的关系列表:['丈夫', '出版社', '导演', '主演', '注册资本', '编剧', '人口数量', '成立日期', '作曲', '嘉宾', '海拔', '作词', '身高', '出品公司', '占地面积', '母亲'],请你根据关系列表,从以下输入中抽取出可能存在的头实体与尾实体,并给出对应的关系三元组,如果不存在某关系就输出NAN。请按照(头实体,关系,尾实体)\n的格式回答。",
|
301 |
"input": "如何演好自己的角色,请读《演员自我修养》《喜剧之王》周星驰崛起于穷困潦倒之中的独门秘笈",
|
302 |
"output": "NAN\nNAN\nNAN\n(喜剧之王,主演,周星驰)\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN"
|
303 |
}
|
304 |
-
EE: {
|
305 |
"id": "f4dcda5576849c77df664c9318d136c36a663f11ad8af98e2794b113884fa69c",
|
306 |
"instruction": "你是专门进行事件提取的专家。已知候选的事件字典:{'人生-婚礼': ['时间', '参礼人员', '地点', '结婚双��'], '组织关系-停职': ['所属组织', '停职人员', '时间'], '交往-会见': ['时间', '会见主体', '地点', '会见对象'], '组织关系-解约': ['时间', '被解约方', '解约方'], '组织行为-开幕': ['时间', '地点', '活动名称'], '人生-求婚': ['时间', '求婚对象', '求婚者'], '人生-失联': ['失联者', '时间', '地点'], '产品行为-发布': ['时间', '发布方', '发布产品'], '灾害/意外-洪灾': ['时间', '受伤人数', '地点', '死亡人数'], '产品行为-上映': ['时间', '上映方', '上映影视'], '组织行为-罢工': ['所属组织', '罢工人数', '时间', '罢工人员'], '人生-怀孕': ['时间', '怀孕者'], '灾害/意外-起火': ['时间', '受伤人数', '地点', '死亡人数'], '灾害/意外-车祸': ['时间', '受伤人数', '地点', '死亡人数'], '司法行为-开庭': ['时间', '开庭法院', '开庭案件'], '交往-探班': ['探班主体', '时间', '探班对象'], '竞赛行为-退役': ['时间', '退役者'], '组织关系-裁员': ['时间', '裁员人数'], '财经/交易-出售/收购': ['时间', '收购方', '交易物', '出售价格', '出售方'], '组织关系-退出': ['退出方', '时间', '原所属组织'], '竞赛行为-禁赛': ['时间', '被禁赛人员', '禁赛机构', '禁赛时长']},请你根据事件字典,从以下输入中抽取出可能存在的事件,如果不存在某事件就输出NAN。请按照(事件触发词,事件类型,事件论元1#论元角色1;事件论元2#论元角色2)\n的格式回答。",
|
307 |
"input": "消失的“外企光环”,5月份在华裁员900余人,香饽饽变“臭”了",
|
308 |
"output": "NAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\n(裁员,组织关系-裁员,时间#5月份;裁员人数#900余人)\nNAN\nNAN\nNAN"
|
309 |
}
|
310 |
-
EET: {
|
311 |
"id": "17aae856c45d7c75f1850d358dc81268a2a9604dce3b98865b3896d0f37a49ef",
|
312 |
"instruction": "作为事件分析专员,你需要查看输入并根据事件类型名录:['人生-订婚', '灾害/意外-坍/垮塌', '财经/交易-涨价', '组织行为-游行', '组织关系-辞/离职', '交往-会见', '人生-结婚', '竞赛行为-禁赛', '组织关系-裁员', '灾害/意外-袭击', '司法行为-约谈', '人生-婚礼', '竞赛行为-退役', '人生-离婚', '灾害/意外-地震', '财经/交易-跌停', '产品行为-发布', '人生-求婚', '人生-怀孕', '组织关系-解约', '财经/交易-降价'],来确定可能发生的事件。所有回答都应该基于(事件触发词,事件类型)\n格式。如果事件类型不匹配,请用NAN标记。",
|
313 |
"input": "前两天,被称为 “ 仅次于苹果的软件服务商 ” 的 Oracle( 甲骨文 )公司突然宣布在中国裁员。。",
|
314 |
"output": "NAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\n(裁员,组织关系-裁员)\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN"
|
315 |
}
|
316 |
-
EEA: {
|
317 |
-
"id": "5079d3cb44e94ca9b0749e687b1b19edc94b60fc2c1eb97b2154bbeb93ad3955",
|
|
|
318 |
"input": "不仅仅是中国IT企业在裁员,为何500强的甲骨文也发生了全球裁员",
|
319 |
"output": "(裁员,组织关系-裁员,裁员方#中国IT企业)\n(裁员,组织关系-裁员,裁员方#500强的甲骨文)"
|
320 |
}
|
@@ -335,7 +354,8 @@ CUDA_VISIBLE_DEVICES="0" python src/inference.py \
|
|
335 |
--model_name 'llama' \
|
336 |
--input_file 'data/NER/processed.json' \
|
337 |
--output_file 'results/ner_test.json' \
|
338 |
-
--fp16
|
|
|
339 |
```
|
340 |
|
341 |
如果GPU显存不足够, 可以采用 `--bits 8` 或 `--bits 4`
|
|
|
16 |
|
17 |
|
18 |
# 📏 2.信息抽取模板
|
19 |
+
模版`template`用于构造输入模型的**指令**`instruction`, 由三部分组成:
|
20 |
+
1. **任务描述**:明确模型的职能及其需完成的任务,例如实体识别、关系抽取、事件抽取等。
|
21 |
+
2. **候选标签列表{s_schema}(可选)**:定义模型需要提取的标签类别,如实体类型、关系类型、事件类型等。
|
22 |
+
3. **结构化输出格式{s_format}**:指明模型应如何呈现其抽取的结构化信息。
|
23 |
|
24 |
|
25 |
+
**指定候选标签列表**的模版:
|
|
|
|
|
|
|
|
|
|
|
|
|
26 |
```
|
27 |
+
实体命名识别(NER): 你是专门进行实体抽取的专家。已知候选的实体类型列表:{s_schema},请你根据实体类型列表,从以下输入中抽取出可能存在的实体,如果不存在某实体就输出NAN。请按照{s_format}的格式回答。
|
28 |
|
29 |
+
关系抽取(RE): 你在这里扮演关系三元组识别师的角色。我将给你个输入,请根据关系列表:{s_schema},从输入中抽取出可能包含的关系三元组,,如果不存在某关系就输出NAN,并以{s_format}的形式回答。
|
30 |
+
|
31 |
+
事件抽取(EE): 你是专门进行事件提取的专家。已知候选的事件字典:{s_schema},请你根据事件字典,从以下输入中抽取出可能存在的事件,如果不存在某事件就输出NAN。请按照{s_format}的格式回答。
|
32 |
+
|
33 |
+
事件类型抽取(EET): 作为事件分析专员,你需要查看输入并根据事件类型名录:{s_schema},来确定可能发生的事件。所有回答都应该基于{s_format}格式。如果事件类型不匹配,请用NAN标记。
|
34 |
+
|
35 |
+
事件论元抽取(EEA): 你是专门进行事件论元提取的专家。已知事件字典:{s_schema1},事件类型及触发词:{s_schema2},请你从以下输入中抽取出可能存在的论元,如果不存在某事件论元就输出NAN。请按照{s_format}的格式回答。
|
36 |
```
|
37 |
|
38 |
+
|
39 |
+
<details>
|
40 |
+
<summary><b>不指定候选标签列表的模版</b></summary>
|
41 |
+
|
42 |
+
|
43 |
+
```
|
44 |
+
实体命名识别(NER): 分析文本内容,并提取明显的实体。将您的发现以{s_format}格式提出,跳过任何不明显或不确定的部分。
|
45 |
+
|
46 |
+
关系抽取(RE): 请从文本中抽取出所有关系三元组,并根据{s_format}的格式呈现结果。忽略那些不符合标准关系模板的实体。
|
47 |
+
|
48 |
+
事件抽取(EE): 请分析下文,从中抽取所有可识别的事件,并按照指定的格式{s_format}呈现。如果某些信息不构成事件,请简单跳过。
|
49 |
+
|
50 |
+
事件类型抽取(EET): 审视下列文本内容,并抽取出任何你认为显著的事件。将你的发现整理成{s_format}格式提供。
|
51 |
+
|
52 |
+
事件论元抽取(EEA): 请您根据事件类型及触发词{s_schema2}从以下��入中抽取可能的论元。请按照{s_format}的格式回答。
|
53 |
+
```
|
54 |
+
|
55 |
+
</details>
|
56 |
+
|
57 |
+
|
58 |
<details>
|
59 |
<summary><b>候选标签列表{s_schema}</b></summary>
|
60 |
|
|
|
74 |
<summary><b>结构输出格式{s_format}</b></summary>
|
75 |
|
76 |
|
77 |
+
```
|
78 |
+
实体命名识别(NER): (实体,实体类型)
|
79 |
+
|
80 |
+
关系抽取(RE): (头实体,关系,尾实体)
|
81 |
+
|
82 |
+
事件抽取(EE): (事件触发词,事件类型,事件论元1#论元角色1;事件论元2#论元角色2)
|
83 |
+
|
84 |
+
事件类型抽取(EET): (事件触发词,事件类型)
|
85 |
+
|
86 |
+
事件论元抽取(EEA): (Event Trigger,Event Type,Argument1#Argument Role1;Argument2#Argument Role2)
|
87 |
```
|
88 |
|
89 |
</details>
|
|
|
219 |
|
220 |
|
221 |
```
|
222 |
+
对于关系抽取(RE)任务
|
223 |
[] # 空列表
|
224 |
["创始人", "号", "注册资本",...] # 关系类型列表
|
225 |
{} # 空字典
|
226 |
|
227 |
+
对于事件抽取(EE)任务
|
228 |
["交往-感谢", "组织行为-开幕", "竞赛行为-退赛", ...] # 事件类型列表
|
229 |
["解雇方", "解约方", "举报发起方", "被拘捕者"] # 论元角色列表
|
230 |
{"组织关系-裁员": ["裁员方", "裁员人数", "时间"], "司法行为-起诉": ["原告", "被告", "时间"], ...} # 事件类型字典
|
231 |
|
232 |
+
对于事件类型抽取(EET)任务
|
233 |
["交往-感谢", "组织行为-开幕", "竞赛行为-退赛", ...] # 事件类型列表
|
234 |
[] # 空列表
|
235 |
{} # 空字典
|
236 |
|
237 |
+
对于事件论元抽取(EEA)任务
|
238 |
["交往-感谢", "组织行为-开幕", "竞赛行为-退赛", ...] # 事件类型列表
|
239 |
["解雇方", "解约方", "举报发起方", "被拘捕者"] # 论元角色列表
|
240 |
{"组织关系-裁员": ["裁员方", "裁员人数", "时间"], "司法行为-起诉": ["原告", "被告", "时间"], ...} # 事件类型字典
|
|
|
293 |
<summary><b>更多</b></summary>
|
294 |
|
295 |
- 转换前
|
296 |
+
```
|
297 |
+
关系抽取(RE): {
|
298 |
"input": "如何演好自己的角色,请读《演员自我修养》《喜剧之王》周星驰崛起于穷困潦倒之中的独门秘笈",
|
299 |
"relation": [{"head": "喜剧之王", "relation": "主演", "tail": "周星驰"}]
|
300 |
}
|
301 |
+
事件抽取(EE): {
|
302 |
"input": "消失的“外企光环”,5月份在华裁员900余人,香饽饽变“臭”了",
|
303 |
"event": [{"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "900余人", "role": "裁员人数"}, {"argument": "5月份", "role": "时间"}]}]
|
304 |
}
|
305 |
+
事件类型抽取(EET): {
|
306 |
"input": "前两天,被称为 “ 仅次于苹果的软件服务商 ” 的 Oracle( 甲骨文 )公司突然宣布在中国裁员。。",
|
307 |
"event": [{"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "前两天", "role": "时间"}, {"argument": "被称为 “ 仅次于苹果的软件服务商 ” 的 Oracle( 甲骨文 )公司", "role": "裁员方"}]}]
|
308 |
}
|
309 |
+
事件论元抽取(EEA): {
|
310 |
"input": "不仅仅是中国IT企业在裁员,为何500强的甲骨文也发生了全球裁员",
|
311 |
"event": [{"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "中国IT企业", "role": "裁员方"}]}, {"event_trigger": "裁员", "event_type": "组织关系-裁员", "arguments": [{"argument": "500强的甲骨文", "role": "裁员方"}]}]
|
312 |
}
|
313 |
```
|
314 |
|
315 |
- 转换后
|
316 |
+
关系抽取(RE): {
|
|
|
317 |
"id": "5526d8aa9520a0feaa045ae41d347cf7ca48bd84385743ed453ea57dbe743c7c",
|
318 |
"instruction": "你是专门进行关系三元组提取的专家。已知候选的关系列表:['丈夫', '出版社', '导演', '主演', '注册资本', '编剧', '人口数量', '成立日期', '作曲', '嘉宾', '海拔', '作词', '身高', '出品公司', '占地面积', '母亲'],请你根据关系列表,从以下输入中抽取出可能存在的头实体与尾实体,并给出对应的关系三元组,如果不存在某关系就输出NAN。请按照(头实体,关系,尾实体)\n的格式回答。",
|
319 |
"input": "如何演好自己的角色,请读《演员自我修养》《喜剧之王》周星驰崛起于穷困潦倒之中的独门秘笈",
|
320 |
"output": "NAN\nNAN\nNAN\n(喜剧之王,主演,周星驰)\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN"
|
321 |
}
|
322 |
+
事件抽取(EE): {
|
323 |
"id": "f4dcda5576849c77df664c9318d136c36a663f11ad8af98e2794b113884fa69c",
|
324 |
"instruction": "你是专门进行事件提取的专家。已知候选的事件字典:{'人生-婚礼': ['时间', '参礼人员', '地点', '结婚双��'], '组织关系-停职': ['所属组织', '停职人员', '时间'], '交往-会见': ['时间', '会见主体', '地点', '会见对象'], '组织关系-解约': ['时间', '被解约方', '解约方'], '组织行为-开幕': ['时间', '地点', '活动名称'], '人生-求婚': ['时间', '求婚对象', '求婚者'], '人生-失联': ['失联者', '时间', '地点'], '产品行为-发布': ['时间', '发布方', '发布产品'], '灾害/意外-洪灾': ['时间', '受伤人数', '地点', '死亡人数'], '产品行为-上映': ['时间', '上映方', '上映影视'], '组织行为-罢工': ['所属组织', '罢工人数', '时间', '罢工人员'], '人生-怀孕': ['时间', '怀孕者'], '灾害/意外-起火': ['时间', '受伤人数', '地点', '死亡人数'], '灾害/意外-车祸': ['时间', '受伤人数', '地点', '死亡人数'], '司法行为-开庭': ['时间', '开庭法院', '开庭案件'], '交往-探班': ['探班主体', '时间', '探班对象'], '竞赛行为-退役': ['时间', '退役者'], '组织关系-裁员': ['时间', '裁员人数'], '财经/交易-出售/收购': ['时间', '收购方', '交易物', '出售价格', '出售方'], '组织关系-退出': ['退出方', '时间', '原所属组织'], '竞赛行为-禁赛': ['时间', '被禁赛人员', '禁赛机构', '禁赛时长']},请你根据事件字典,从以下输入中抽取出可能存在的事件,如果不存在某事件就输出NAN。请按照(事件触发词,事件类型,事件论元1#论元角色1;事件论元2#论元角色2)\n的格式回答。",
|
325 |
"input": "消失的“外企光环”,5月份在华裁员900余人,香饽饽变“臭”了",
|
326 |
"output": "NAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\n(裁员,组织关系-裁员,时间#5月份;裁员人数#900余人)\nNAN\nNAN\nNAN"
|
327 |
}
|
328 |
+
事件类型抽取(EET): {
|
329 |
"id": "17aae856c45d7c75f1850d358dc81268a2a9604dce3b98865b3896d0f37a49ef",
|
330 |
"instruction": "作为事件分析专员,你需要查看输入并根据事件类型名录:['人生-订婚', '灾害/意外-坍/垮塌', '财经/交易-涨价', '组织行为-游行', '组织关系-辞/离职', '交往-会见', '人生-结婚', '竞赛行为-禁赛', '组织关系-裁员', '灾害/意外-袭击', '司法行为-约谈', '人生-婚礼', '竞赛行为-退役', '人生-离婚', '灾害/意外-地震', '财经/交易-跌停', '产品行为-发布', '人生-求婚', '人生-怀孕', '组织关系-解约', '财经/交易-降价'],来确定可能发生的事件。所有回答都应该基于(事件触发词,事件类型)\n格式。如果事件类型不匹配,请用NAN标记。",
|
331 |
"input": "前两天,被称为 “ 仅次于苹果的软件服务商 ” 的 Oracle( 甲骨文 )公司突然宣布在中国裁员。。",
|
332 |
"output": "NAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\n(裁员,组织关系-裁员)\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN\nNAN"
|
333 |
}
|
334 |
+
事件论元抽取(EEA): {
|
335 |
+
"id": "5079d3cb44e94ca9b0749e687b1b19edc94b60fc2c1eb97b2154bbeb93ad3955",
|
336 |
+
"instruction": "你是专门进行事件论元提取的专家。已知事件字典:{'组织关系-裁员': ['裁员方']},事件类型及触发词:[{'event_type': '组织关系-裁员', 'event_trigger': '裁员'}],请你从以下输入中抽取出可能存在的论元,如果不存在某事件论元就输出NAN。请按照(事件触发词,事件类型,事件论元1#论元角色1;事件论元2#论元角色2)\n的格式回答。",
|
337 |
"input": "不仅仅是中国IT企业在裁员,为何500强的甲骨文也发生了全球裁员",
|
338 |
"output": "(裁员,组织关系-裁员,裁员方#中国IT企业)\n(裁员,组织关系-裁员,裁员方#500强的甲骨文)"
|
339 |
}
|
|
|
354 |
--model_name 'llama' \
|
355 |
--input_file 'data/NER/processed.json' \
|
356 |
--output_file 'results/ner_test.json' \
|
357 |
+
--fp16 \
|
358 |
+
--bits 4
|
359 |
```
|
360 |
|
361 |
如果GPU显存不足够, 可以采用 `--bits 8` 或 `--bits 4`
|