RyanYr
/

reward-judge_iter-dpo-genRM_pilot-exp_iter1

Generated from Trainer

Model card Files Files and versions Community

reward-judge_iter-dpo-genRM_pilot-exp_iter1

1 contributor

History: 1 commit

RyanYr's picture

initial commit

7dc9959 verified 2 months ago

.gitattributes

1.52 kB

initial commit 2 months ago