wangyuxin
commited on
Commit
•
fb4a130
1
Parent(s):
eab5c9e
添加 openai 评测
Browse files
README.md
CHANGED
@@ -55,10 +55,31 @@ M3E 使用 in-batch 负采样的对比学习的方式在句对数据集进行训
|
|
55 |
- 指令数据集,M3E 使用了 300W + 的指令微调数据集,这使得 M3E 对文本编码的时候可以遵从指令,这部分的工作主要被启发于 [instructor-embedding](https://github.com/HKUNLP/instructor-embedding)
|
56 |
- 基础模型,M3E 使用 hfl 实验室的 [Roberta](https://huggingface.co/hfl/chinese-roberta-wwm-ext) 系列模型进行训练,目前提供 small 和 base 两个版本,大家则需选用
|
57 |
- ALL IN ONE,M3E 旨在提供一个 ALL IN ONE 的文本嵌入模型,不仅支持同质句子相似度判断,还支持异质文本检索,你只需要一个模型就可以覆盖全部的应用场景,未来还会支持代码检索
|
58 |
-
|
59 |
## 评测
|
60 |
|
61 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
62 |
|
63 |
## M3E数据集
|
64 |
|
|
|
55 |
- 指令数据集,M3E 使用了 300W + 的指令微调数据集,这使得 M3E 对文本编码的时候可以遵从指令,这部分的工作主要被启发于 [instructor-embedding](https://github.com/HKUNLP/instructor-embedding)
|
56 |
- 基础模型,M3E 使用 hfl 实验室的 [Roberta](https://huggingface.co/hfl/chinese-roberta-wwm-ext) 系列模型进行训练,目前提供 small 和 base 两个版本,大家则需选用
|
57 |
- ALL IN ONE,M3E 旨在提供一个 ALL IN ONE 的文本嵌入模型,不仅支持同质句子相似度判断,还支持异质文本检索,你只需要一个模型就可以覆盖全部的应用场景,未来还会支持代码检索
|
|
|
58 |
## 评测
|
59 |
|
60 |
+
### 文本分类
|
61 |
+
|
62 |
+
- 数据集选择,选择开源在 HuggingFace 上的 6 种文本分类数据集,包括新闻、电商评论、股票评论、长文本等
|
63 |
+
- 评测方式,使用 MTEB 的方式进行评测,报告 Accuracy。
|
64 |
+
- 评测模型,[text2vec](https://github.com/shibing624/text2vec), m3e-base, m3e-small, openai-ada-002
|
65 |
+
- 评测脚本,具体参考此 [评测脚本](https://github.com/wangyuxinwhy/uniem/blob/main/mteb-zh/tasks.py)
|
66 |
+
|
67 |
+
| | text2vec | m3e-small | m3e-base | openai |
|
68 |
+
| ----------------- | -------- | --------- | -------- | ------ |
|
69 |
+
| TNews | 0.43 | 0.4443 | 0.4827 | 0.4594 |
|
70 |
+
| JDIphone | 0.8214 | 0.8293 | 0.8533 | 0.746 |
|
71 |
+
| GubaEastmony | 0.7472 | 0.712 | 0.7621 | 0.7574 |
|
72 |
+
| TYQSentiment | 0.6099 | 0.6596 | 0.7188 | 0.68 |
|
73 |
+
| StockComSentiment | 0.4307 | 0.4291 | 0.4363 | 0.4819 |
|
74 |
+
| IFlyTek | 0.414 | 0.4263 | 0.4409 | 0.4486 |
|
75 |
+
| Average | 0.5755 | 0.5834 | 0.6157 | 0.5956 |
|
76 |
+
|
77 |
+
openai-ada-002 模型待评测
|
78 |
+
|
79 |
+
### 检索排序
|
80 |
+
|
81 |
+
更多任务,敬请期待
|
82 |
+
|
83 |
|
84 |
## M3E数据集
|
85 |
|