怎么感觉large 没有明显的优势

#1
by tiandatong - opened

有的效果还差了,而且不支持英文了 :)

Moka HR SaSS org
edited Jun 25, 2023

哈哈,是的,根据指标上面来看 large 还不如 base .....

我们在中英混合训练 m3e-large 的时候,发现 large 用的基础模型 hfl-large 表现不佳,所以停止了训练。

后来就改成了纯中文的模型,结果也不是很好.... 我们正在测试训练新的基础模型 :)

哈哈,是的,根据指标上面来看 large 还不如 base .....

我们在中英混合训练 m3e-large 的时候,发现 large 用的基础模型 hfl-large 表现不佳,所以停止了训练。

后来就改成了纯中文的模型,结果也不是很好.... 我们正在测试训练新的基础模型 :)

感谢分享,加油啊

哈哈,是的,根据指标上面来看 large 还不如 base .....

我们在中英混合训练 m3e-large 的时候,发现 large 用的基础模型 hfl-large 表现不佳,所以停止了训练。

后来就改成了纯中文的模型,结果也不是很好.... 我们正在测试训练新的基础模型 :)

之前看过好几次,说语料质量的重要性高于数量,也许是这个原因 :)

ps: 我实测过 base,效果也挺不错了,沾光了~

MokaHR changed discussion status to closed

Sign up or log in to comment