chat format confirmation
#5
by
ikala-ray
- opened
不好意思想確定一下聊天格式是 user 和 assistant 回覆 token 都是只有 <s>
而已嗎?
就是說一個多輪對話的 prompt 長這樣嗎?
<s>你好</s>我是Bailong,是由Innolux訓練的大型語言模型。我能夠使用多種語言來回答問題和提供幫助。今天有什麼可以幫忙的嗎?<s>1+1 是多少?</s><s>
嗨 @ikala-ray ,
只有開頭有<s>
,後續不論是user的指令或是assistant回覆都是以EOS token </s>
隔開。所以在您舉的例子中,正確的prompt應該如下:
<s>你好</s>我是Bailong,是由Innolux訓練的大型語言模型。我能夠使用多種語言來回答問題和提供幫助。今天有什麼可以幫忙的嗎?</s>1+1 是多少?</s>
好奇詢問有試過加入 HUMAN:, ASSISTANT: 或類似的角色 token 嗎?我還是第一次看過不同角色都用同一個分割 token 切分的
Blaze7451
changed discussion status to
closed