--- license: cc-by-nc-sa-4.0 language: - zh --- 在中文xfund上微调的layoutlmv3-chinese-base模型,可以对表格数据进行序列标注 \ 模型的功能是:根据图片信息,对所有文字进行序列标注 \ 模型需要输入以下信息:1.文档全部的文字(由其他ocr软件扫描得到) 2.体现文档结构的图片 \ 模型输出标签有7个,对应关系如下 ``` "id2label": { "0": "OTHERS", "1": "B-HEADER", "2": "I-HEADER", "3": "B-QUESTION", "4": "I-QUESTION", "5": "B-ANSWER", "6": "I-ANSWER" } ``` * others: 其他文字 * header:标题文字 * question:表头文字 * answer:表内容文字