Minbyul
/

mistral-7b-dpo-full-sft-wo-kqa_golden

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mistral-7b-dpo-full-sft-wo-kqa_golden

Commit History

Training in progress, step 300

14bb569
verified

Minbyul commited on Apr 30

Training in progress, step 200

5bf9889
verified

Minbyul commited on Apr 30

Training in progress, step 100

d4e92fc
verified

Minbyul commited on Apr 30

initial commit

5dd53f5
verified

Minbyul commited on Apr 30