SunnyAxe commited on
Commit
36873bd
1 Parent(s): a1ec554

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +14 -0
README.md ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ # Introduction
2
+ 本模型是在SRTP项目中,为中文文学领域文献摘要的命名实体识别(人名、国名与书名)任务而训练的基于RoBERT的模型。
3
+ # Format of input and output
4
+ input: 文本;output: 与文本长度对应、位置对应的标记,标记有如下七种:
5
+ {'O': 无标记, 'B-PER': 人名开始标记, 'I-PER': 人名中间标记, 'B-CNT': 国名开始标记, 'I-CNT': 国名中间标记, 'B-BK': 书名开始标记, 'I-BK': 书名中间标记}
6
+
7
+
8
+ 例如:
9
+ input: 谢默斯・希尼是当代爱尔兰著名诗人
10
+ output: B-PER I-PER I-PER I-PER I-PER I-PER O O O B-CNT I-CNT I-CNT O O O O O
11
+
12
+
13
+ 另外,由于模型能力有限,在推理过程中可能遇到识别出来的实体标记直接从"I-"开始,建议将第一个标记向前一个文字作为对应的"B-"标记。
14
+ 如:爱尔兰 --推理--> O I-CNT I-CNT --后续处理--> B-CNT I-CNT I-CNT