File size: 675 Bytes
82b0730
 
c0e5c16
 
82b0730
c0e5c16
6ae72e8
2e0eb59
 
e36766e
 
 
 
 
 
 
 
 
 
 
bc165be
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
---
license: cc-by-nc-sa-4.0
language:
- zh
---

在中文xfund上微调的layoutlmv3-chinese-base模型,可以对表格数据进行序列标注 \
模型的功能是:根据图片信息,对所有文字进行序列标注 \
模型需要输入以下信息:1.文档全部的文字(由其他ocr软件扫描得到) 2.体现文档结构的图片  \
模型输出标签有7个,对应关系如下
```
  "id2label": {
    "0": "OTHERS",
    "1": "B-HEADER",
    "2": "I-HEADER",
    "3": "B-QUESTION",
    "4": "I-QUESTION",
    "5": "B-ANSWER",
    "6": "I-ANSWER"
  }
```
* others: 其他文字
* header:标题文字
* question:表头文字
* answer:表内容文字