XueyingJia
/

pythia-1b-online-dpo-HH-merge-rewardmodel

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

pythia-1b-online-dpo-HH-merge-rewardmodel / .gitattributes

Commit History

initial commit

7ee2b92
verified

XueyingJia commited on 19 days ago