在此基础上能训练100k吗?

#6
by 520jefferson - opened

如题,训练100k,超过32k,很容易出现重复的情况,rope base不改,max position embedding 和max len改为100k。

Sign up or log in to comment