freedomking
commited on
Commit
•
6d266c1
1
Parent(s):
c44fced
Update README.md
Browse files
README.md
CHANGED
@@ -1,19 +1,8 @@
|
|
1 |
## Introduction
|
2 |
|
3 |
-
###
|
4 |
|
5 |
-
ERNIE-CTM
|
6 |
-
|
7 |
-
### ERNIE-CTM特点
|
8 |
-
|
9 |
-
* 全面的中文汉字字表扩充
|
10 |
-
ERNIE-CTM的字符集包含2万+汉字,以及中文常用符号(常用标点、汉语拼音、编号)、部分外语符号(假名、单位)等,大幅减少中文解析挖掘任务中UNK(未识别字符)引发的标注问题。同时,ERNIE-CTM使用了embedding分解,可以更加灵活地扩充应用字表。
|
11 |
-
|
12 |
-
* 更加适配中文文本挖掘任务
|
13 |
-
ERNIE-CTM中在每个表示后面添加了全局信息,在序列特征上叠加了全局的信息,使得在文本挖掘任务上有更加强力的表现。
|
14 |
-
|
15 |
-
* 支持多种特征训练的模型结构
|
16 |
-
ERNIE-CTM的模型结构中,支持多种特征训练,用户可按照自己的需求任意添加任务及对应特征训练模型,而无需考虑任务之间的冲突所造成的灾难性遗忘。
|
17 |
|
18 |
More detail:
|
19 |
-
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/text_to_knowledge/
|
|
|
1 |
## Introduction
|
2 |
|
3 |
+
### Ernie-CTM-NPTag
|
4 |
|
5 |
+
Ernie-CTM-NPTag使用ERNIE-CTM+prompt训练而成,使用启发式搜索解码,保证分类结果都在标签体系之内。在微调任务中提供了一个中文名词短语标注的任务,旨在对中文名词短语进行细粒度分类。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
7 |
More detail:
|
8 |
+
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/text_to_knowledge/nptag
|