建议把ChatGLMForConditionalGeneration.forward的输入参数中中增加full_attention_mask参数,然后传递给transformer,这样就可以更灵活的去进行多轮对话的训练了
· Sign up or log in to comment