fb700/chatglm-fitness-RLHF · 关于两种加载模型文件方式的区别

关于两种加载模型文件方式的区别

#17

by rk686 - opened Sep 21, 2023

rk686

Sep 21, 2023

感谢作者能够分享这么好的一个项目。
我想请问一下：
对于第一种加载模型文件的方式，这个就相对于是在原chatglm-6b的基础上把训练好的lora权重装载上来。
对于第二种加载模型文件的方式，我看所有的加载目录都是该项目目录，这个是加载了什么呢？
还有就是RLHF体现在哪里？
感谢回答

fb700

Owner Sep 22, 2023

第一是做lora原来模型权重的merge，可以方便的进行再量化
第二种，未merge，使用peft加载
rlhf 主要有两个方面更好地理解输入，更好的推理表达，具体作用需自己对比测。

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment