Minbyul
/

llama2-7b-dpo-full-wo-kqa_silver_wogold-ep3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama2-7b-dpo-full-wo-kqa_silver_wogold-ep3

Commit History

End of training

86bce7f
verified

Minbyul commited on Apr 10

Model save

7c4459d
verified

Minbyul commited on Apr 10

Training in progress, step 100

37f2bd2
verified

Minbyul commited on Apr 10

initial commit

76dc4c3
verified

Minbyul commited on Apr 10