可以处理更长的上下文,那么max_length应该设置更长?
#15
by
chaochaoli
- opened
看config里还是seq_length=2048
更长的上下文:基于 FlashAttention 技术,我们将基座模型的上下文长度(Context Length)由 ChatGLM-6B 的 2K 扩展到了 32K,并在对话阶段使用 8K 的上下文长度训练,允许更多轮次的对话。但当前版本的 ChatGLM2-6B 对单轮超长文档的理解能力有限,我们会在后续迭代升级中着重进行优化。
===》怎么支持到32k?
可以手动解除限制不过没啥用太长了逻辑理解不了
已经修改了
zxdu20
changed discussion status to
closed