Minbyul
/

llama2-7b-dpo-full-sft-wo-live_qa

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

text-generation-inference

Model card Files Files and versions Community

llama2-7b-dpo-full-sft-wo-live_qa

Commit History

Model save

d5d7ad8
verified

Minbyul commited on Apr 29

Training in progress, step 100

f90cf05
verified

Minbyul commited on Apr 29

initial commit

2b9fcfe
verified

Minbyul commited on Apr 29