aisuko
/

ft-orpo-smollm-135M-instruct-on-hf-ultrafeedback

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

ft-orpo-smollm-135M-instruct-on-hf-ultrafeedback

Commit History

initial commit

b77fcea
verified

aisuko commited on Aug 19