freedomking commited on
Commit
6d266c1
1 Parent(s): c44fced

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -14
README.md CHANGED
@@ -1,19 +1,8 @@
1
  ## Introduction
2
 
3
- ### ERNIE-CTM(ERNIE for Chinese Text Mining)
4
 
5
- ERNIE-CTM由百度Paddle团队开源的预训练语言模型,是适用于中文文本挖掘任务的预训练语言模型,拥有更全面的汉字字表集合,更优的中文文本挖掘任务表现,与PaddleNLP深度结合,提供更加便捷的应用实践。
6
-
7
- ### ERNIE-CTM特点
8
-
9
- * 全面的中文汉字字表扩充
10
- ERNIE-CTM的字符集包含2万+汉字,以及中文常用符号(常用标点、汉语拼音、编号)、部分外语符号(假名、单位)等,大幅减少中文解析挖掘任务中UNK(未识别字符)引发的标注问题。同时,ERNIE-CTM使用了embedding分解,可以更加灵活地扩充应用字表。
11
-
12
- * 更加适配中文文本挖掘任务
13
- ERNIE-CTM中在每个表示后面添加了全局信息,在序列特征上叠加了全局的信息,使得在文本挖掘任务上有更加强力的表现。
14
-
15
- * 支持多种特征训练的模型结构
16
- ERNIE-CTM的模型结构中,支持多种特征训练,用户可按照自己的需求任意添加任务及对应特征训练模型,而无需考虑任务之间的冲突所造成的灾难性遗忘。
17
 
18
  More detail:
19
- https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/text_to_knowledge/ernie-ctm
 
1
  ## Introduction
2
 
3
+ ### Ernie-CTM-NPTag
4
 
5
+ Ernie-CTM-NPTag使用ERNIE-CTM+prompt训练而成,使用启发式搜索解码,保证分类结果都在标签体系之内。在微调任务中提供了一个中文名词短语标注的任务,旨在对中文名词短语进行细粒度分类。
 
 
 
 
 
 
 
 
 
 
 
6
 
7
  More detail:
8
+ https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/text_to_knowledge/nptag