wangyuxin commited on
Commit
fb4a130
1 Parent(s): eab5c9e

添加 openai 评测

Browse files
Files changed (1) hide show
  1. README.md +23 -2
README.md CHANGED
@@ -55,10 +55,31 @@ M3E 使用 in-batch 负采样的对比学习的方式在句对数据集进行训
55
  - 指令数据集,M3E 使用了 300W + 的指令微调数据集,这使得 M3E 对文本编码的时候可以遵从指令,这部分的工作主要被启发于 [instructor-embedding](https://github.com/HKUNLP/instructor-embedding)
56
  - 基础模型,M3E 使用 hfl 实验室的 [Roberta](https://huggingface.co/hfl/chinese-roberta-wwm-ext) 系列模型进行训练,目前提供 small 和 base 两个版本,大家则需选用
57
  - ALL IN ONE,M3E 旨在提供一个 ALL IN ONE 的文本嵌入模型,不仅支持同质句子相似度判断,还支持异质文本检索,你只需要一个模型就可以覆盖全部的应用场景,未来还会支持代码检索
58
-
59
  ## 评测
60
 
61
- coming soon,我们正在准备中文文本嵌入模型评测 BenchMark MTEB-zh,敬请期待
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
62
 
63
  ## M3E数据集
64
 
 
55
  - 指令数据集,M3E 使用了 300W + 的指令微调数据集,这使得 M3E 对文本编码的时候可以遵从指令,这部分的工作主要被启发于 [instructor-embedding](https://github.com/HKUNLP/instructor-embedding)
56
  - 基础模型,M3E 使用 hfl 实验室的 [Roberta](https://huggingface.co/hfl/chinese-roberta-wwm-ext) 系列模型进行训练,目前提供 small 和 base 两个版本,大家则需选用
57
  - ALL IN ONE,M3E 旨在提供一个 ALL IN ONE 的文本嵌入模型,不仅支持同质句子相似度判断,还支持异质文本检索,你只需要一个模型就可以覆盖全部的应用场景,未来还会支持代码检索
 
58
  ## 评测
59
 
60
+ ### 文本分类
61
+
62
+ - 数据集选择,选择开源在 HuggingFace 上的 6 种文本分类数据集,包括新闻、电商评论、股票评论、长文本等
63
+ - 评测方式,使用 MTEB 的方式进行评测,报告 Accuracy。
64
+ - 评测模型,[text2vec](https://github.com/shibing624/text2vec), m3e-base, m3e-small, openai-ada-002
65
+ - 评测脚本,具体参考此 [评测脚本](https://github.com/wangyuxinwhy/uniem/blob/main/mteb-zh/tasks.py)
66
+
67
+ | | text2vec | m3e-small | m3e-base | openai |
68
+ | ----------------- | -------- | --------- | -------- | ------ |
69
+ | TNews | 0.43 | 0.4443 | 0.4827 | 0.4594 |
70
+ | JDIphone | 0.8214 | 0.8293 | 0.8533 | 0.746 |
71
+ | GubaEastmony | 0.7472 | 0.712 | 0.7621 | 0.7574 |
72
+ | TYQSentiment | 0.6099 | 0.6596 | 0.7188 | 0.68 |
73
+ | StockComSentiment | 0.4307 | 0.4291 | 0.4363 | 0.4819 |
74
+ | IFlyTek | 0.414 | 0.4263 | 0.4409 | 0.4486 |
75
+ | Average | 0.5755 | 0.5834 | 0.6157 | 0.5956 |
76
+
77
+ openai-ada-002 模型待评测
78
+
79
+ ### 检索排序
80
+
81
+ 更多任务,敬请期待
82
+
83
 
84
  ## M3E数据集
85