PKU-Alignment
/

beaver-7b-v1.0-reward

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions Community

beaver-7b-v1.0-reward / added_tokens.json

RuiyangSun's picture

hello beaver reward model

9695135 about 1 year ago

No virus

21 Bytes

	{
	"<pad>": 32000
	}