PKU-Alignment
/

beaver-7b-v3.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

1 contributor

History: 4 commits

XuehaiPan's picture

Update README.md

3fcf176 verified 8 months ago