NicholasCorrado
/

tulu-2-7b-hh-dpo

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

tulu-2-7b-hh-dpo / README.md

Commit History

End of training

aca5db3
verified

NicholasCorrado commited on Sep 1

Model save

4aeefdb
verified

NicholasCorrado commited on Sep 1