Holarissun
/

dpo_helpfulhelpful_human_subset20000_modelgpt2_maxsteps5000_bz8_lr5e-06

Generated from Trainer

Model card Files Files and versions Community

dpo_helpfulhelpful_human_subset20000_modelgpt2_maxsteps5000_bz8_lr5e-06 / .gitattributes

Commit History

initial commit

5444d71
verified

Holarissun commited on May 1