metadata
license: mit
基于xiaol的7B role模型进行的nsfw和roleplay特训微调
微调使用了1GB NSFW小说数据集,以及300M的小说续写数据集,并混入了450M的User Assistant标准问答指令数据集以保证降低微调带来的影响
最后混入了大约5M的roleplay和TRPG数据集进行Lora
使用以下参数进行Lora得到的模型
Lora_R=256
Lora_Alpha=512
Steps=50
Epoch=84
StartLoss=1.9
EndLoss=1.84
或许你应该试试这个最新的模型,使用更新更优质的数据集进行Lora的RWKV v5.2 3B roleplay模型(依然带有一定的NSFW能力)