SunnyAxe
/

bert_NER_task

Token Classification

Inference Endpoints

Model card Files Files and versions Community

bert_NER_task / README.md

SunnyAxe's picture

Update README.md

7a73d9b verified 2 months ago

|

history blame contribute delete

No virus

927 Bytes

	# Introduction
	本模型是在SRTP项目中，为中文文学领域文献摘要的命名实体识别（人名、国名与书名）任务而训练的基于RoBERT的模型。
	# Format of input and output
	input最大长度128。

	input: 文本；output: 与文本长度对应、位置对应的标记，标记有如下七种：

	{'O': 无标记, 'B-PER': 人名开始标记, 'I-PER': 人名中间标记, 'B-CNT': 国名开始标记, 'I-CNT': 国名中间标记, 'B-BK': 书名开始标记, 'I-BK': 书名中间标记}


	例如：

	input: 谢默斯・希尼是当代爱尔兰著名诗人

	output: B-PER I-PER I-PER I-PER I-PER I-PER O O O B-CNT I-CNT I-CNT O O O O O


	另外，由于模型能力有限，在推理过程中可能遇到识别出来的实体标记直接从"I-"开始，建议将第一个标记向前一个文字作为对应的"B-"标记。
	如：爱尔兰 --推理--> O I-CNT I-CNT --后续处理--> B-CNT I-CNT I-CNT