ashercn97
/

reward_modeling_anthropic_hh_workkkk

Generated from Trainer

Model card Files Files and versions Community

reward_modeling_anthropic_hh_workkkk

1 contributor

History: 3 commits

ashercn97's picture

End of training

8cb6e0d verified 4 months ago