IEIT-Yuan commited on
Commit
7cb0bd1
·
verified ·
1 Parent(s): 5b8c129

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +3 -3
README.md CHANGED
@@ -1262,12 +1262,12 @@ tags:
1262
  ## Yuan-embedding-1.0
1263
 
1264
  Yuan-embedding-1.0 是专门为中文文本检索任务设计的嵌入模型。
1265
- 在xiaobu模型结构(bert-large结构)基础上, 采用全新的数据集构建、生成与清洗方法, 结合二阶段微调实现Retrieval任务的精度领先(Hugging Face C-MTEB榜单 [1])。
1266
- 其中, 正负例样本采用源2.0-M32Yuan2.0-M32 [2]大模型进行生成。主要工作如下:
1267
 
1268
  - 在Hard negative sampling中,使用Rerank模型(bge-reranker-large [3])进行数据排序筛选
1269
 
1270
- - 通过(Yuan2.0-M32大模型)迭代生成新query、corpus
1271
 
1272
  - 采用MRL方法进行模型微调训练
1273
 
 
1262
  ## Yuan-embedding-1.0
1263
 
1264
  Yuan-embedding-1.0 是专门为中文文本检索任务设计的嵌入模型。
1265
+ 在xiaobu模型结构(bert-large结构)基础上, 采用全新的数据集构建、生成与清洗方法, 结合二阶段微调实现Retrieval任务的精度领先(Hugging Face C-MTEB榜单 [1])。
1266
+ 其中, 正负例样本采用源2.0-M32(Yuan2.0-M32 [2])大模型进行生成。主要工作如下:
1267
 
1268
  - 在Hard negative sampling中,使用Rerank模型(bge-reranker-large [3])进行数据排序筛选
1269
 
1270
+ - 通过(Yuan2.0-M32大模型)迭代生成新query、corpus
1271
 
1272
  - 采用MRL方法进行模型微调训练
1273