Minbyul
/

mistral-7b-dpo-full-sft-wo-live_qa

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mistral-7b-dpo-full-sft-wo-live_qa

Commit History

End of training

d21438b
verified

Minbyul commited on Apr 29, 2024

Model save

e5fcad5
verified

Minbyul commited on Apr 29, 2024

Training in progress, step 300

289e088
verified

Minbyul commited on Apr 29, 2024

Training in progress, step 200

9cb53b3
verified

Minbyul commited on Apr 29, 2024

Training in progress, step 100

ac86756
verified

Minbyul commited on Apr 29, 2024

initial commit

50a1bc6
verified

Minbyul commited on Apr 29, 2024