Minbyul
/

llama2-7b-dpo-full-sft-wo-kqa_golden

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama2-7b-dpo-full-sft-wo-kqa_golden

Commit History

End of training

1872924
verified

Minbyul commited on Apr 30

Model save

606d6fe
verified

Minbyul commited on Apr 30

Training in progress, step 100

fe2a726
verified

Minbyul commited on Apr 30

initial commit

793349a
verified

Minbyul commited on Apr 30