PKU-Alignment
/

beaver-7b-v2.0-cost

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v2.0-cost / .gitattributes

Commit History

initial commit

a0a307f
verified

XuehaiPan commited on Apr 19