Baidicoot
/

reward_modeling

Generated from Trainer

Model card Files Files and versions Community

reward_modeling / adapter_model.safetensors

Commit History

End of training

35b85a5
verified

Baidicoot commited on Jul 2