PKU-Alignment
/

beaver-7b-v1.0-reward

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v1.0-reward / pytorch_model-00002-of-00004.bin

Commit History

hello beaver reward model

bcc4f5e

RuiyangSun commited on Jul 10, 2023