训练数据是否考虑了需要拒答的场景

#7
by davidlu - opened

你好,请教下ziya reader的训练数据集中是否有考虑拒答的样本?对于rag来说如果召回的内容不相关的话,需要有拒答的能力,否则会出现幻觉。

Fengshenbang-LM org

你好,请教下ziya reader的训练数据集中是否有考虑拒答的样本?对于rag来说如果召回的内容不相关的话,需要有拒答的能力,否则会出现幻觉。

你好,可以参考我们的技术报告,我们加入了约5%的拒答样本,让模型有了一定的拒答能力。
然而,幻觉虽然缓解了,但是还是不可避免的存在的,我们将会在下一版中重点解决这个问题,提升幻觉效果。

你好,请教下ziya reader的训练数据集中是否有考虑拒答的样本?对于rag来说如果召回的内容不相关的话,需要有拒答的能力,否则会出现幻觉。

你好,可以参考我们的技术报告,我们加入了约5%的拒答样本,让模型有了一定的拒答能力。
然而,幻觉虽然缓解了,但是还是不可避免的存在的,我们将会在下一版中重点解决这个问题,提升幻觉效果。

好的,我去看下技术报告,另外下一版有预计放出的时间吗,谢谢。

Sign up or log in to comment