长上下文版本计划

#34
by rzzhangtao - opened

请问有长上下文版本相关的计划吗?

有的,不过目前事情比较多,可能得等一两个星期左右才能开始训。敬请谅解。

shenzhi-wang changed discussion status to closed

修改 config.json

"rope_scaling": null,

改为:

"rope_scaling": {
"type": "dynamic",
"factor": 4.0
},

即获得32k context。

太赞了!这个项目是目前实际使用的效果最好的中文大模型了!!

Sign up or log in to comment