Minbyul
/

mistral-7b-dpo-full-sft-wo-medication_qa

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

text-generation-inference

Model card Files Files and versions Community

mistral-7b-dpo-full-sft-wo-medication_qa

Commit History

End of training

37b7d2f
verified

Minbyul commited on Apr 29

Model save

94bb268
verified

Minbyul commited on Apr 29

Training in progress, step 300

7046ad6
verified

Minbyul commited on Apr 29

Training in progress, step 200

c10f74f
verified

Minbyul commited on Apr 29

Training in progress, step 100

4e254ff
verified

Minbyul commited on Apr 29

initial commit

b5e4c0b
verified

Minbyul commited on Apr 29