PKU-Alignment
/

beaver-7b-v3.0-reward

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v3.0-reward / tokenizer.json

XuehaiPan's picture

Add beaver-7b-v3.0-reward

76eee93 7 months ago

history contribute delete

1.84 MB

File too large to display, you can check the raw version instead.