讨论
#1
by
twhongyujiang
- opened
请问该如何解决「是」和「不是」得出的高相关性?
['是', '不是'] Similarity: 91.37
['是', '否'] Similarity: 89.87
单字、单词看语义相似度没意义,本项目解决sentence、text级别的语义。
请问输入的文本token数超过多少效果就会明显下降,我看大佬你的说明里面建议长度为256
但是原始的编码模型的位置编码长度有2048
意思是你在再训练阶段 所用的训练集的输入文本均是小于等于256的长度吗
是
是
好的,感谢
shibing624
changed discussion status to
closed