PKU-Alignment
/

beaver-7b-v1.0-cost

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v1.0-cost / README.md

RuiyangSun's picture

initial commit

0615288 over 1 year ago

|

28 Bytes

metadata

license: apache-2.0