iryneko571
commited on
Update README.md
Browse files
README.md
CHANGED
@@ -26,7 +26,7 @@ reason for making this model<br>
|
|
26 |
暂时只制作了mt5-large模型,需要大概8g以上的显存,过剩比较多<br>
|
27 |
为了方便使用,设置成大batch一波推的做法,充分利用gpu资源,但它不会看上下文,因此认为是很大的弊端<br>
|
28 |
数据集中固定翻译的词汇量不足,因此很多翻译会给你它知道的其他语言(一般是英文)<br>
|
29 |
-
经过一些努力矫正后,它现在会zero-shot
|
30 |
|
31 |
# A more precise example using it
|
32 |
# 使用指南
|
|
|
26 |
暂时只制作了mt5-large模型,需要大概8g以上的显存,过剩比较多<br>
|
27 |
为了方便使用,设置成大batch一波推的做法,充分利用gpu资源,但它不会看上下文,因此认为是很大的弊端<br>
|
28 |
数据集中固定翻译的词汇量不足,因此很多翻译会给你它知道的其他语言(一般是英文)<br>
|
29 |
+
经过一些努力矫正后,它现在会zero-shot的给你一句空耳(出现这个zero-shot特性的时候我们翻译组都绷不住了)<br>
|
30 |
|
31 |
# A more precise example using it
|
32 |
# 使用指南
|