NicholasCorrado
/

tulu-2-7b-hh-dpo

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

tulu-2-7b-hh-dpo

Commit History

End of training

aca5db3
verified

NicholasCorrado commited on Sep 1, 2024

Model save

4aeefdb
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 628

86f57bd
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 600

4ac9d93
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 500

9b66ead
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 400

0f823e8
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 300

27276c4
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 200

12caaf1
verified

NicholasCorrado commited on Sep 1, 2024

Training in progress, step 100

0207dc4
verified

NicholasCorrado commited on Sep 1, 2024

initial commit

f7ab284
verified

NicholasCorrado commited on Sep 1, 2024