Update README.md
Browse files
README.md
CHANGED
@@ -1,3 +1,6 @@
|
|
|
|
|
|
|
|
1 |
# 1 开源清单
|
2 |
|
3 |
本次开源2个通用向量编码模型和一个针对dialogue进行编码的向量模型,同时开源全量160万对话重写数据集和20万的难负例的检索数据集。
|
@@ -147,4 +150,4 @@ Q: 长度为什么只有512,能否更长?\
|
|
147 |
A: 可以但没必要,长了效果普遍不好,这是当前训练方法和数据导致的,几乎无解,建议长文本还是走分块。
|
148 |
|
149 |
Q: 训练资源和算力?\
|
150 |
-
A: 亿级别的数据,单卡A100要一个月起步
|
|
|
1 |
+
---
|
2 |
+
license: mit
|
3 |
+
---
|
4 |
# 1 开源清单
|
5 |
|
6 |
本次开源2个通用向量编码模型和一个针对dialogue进行编码的向量模型,同时开源全量160万对话重写数据集和20万的难负例的检索数据集。
|
|
|
150 |
A: 可以但没必要,长了效果普遍不好,这是当前训练方法和数据导致的,几乎无解,建议长文本还是走分块。
|
151 |
|
152 |
Q: 训练资源和算力?\
|
153 |
+
A: 亿级别的数据,单卡A100要一个月起步
|