AmberYifan
/

Mistral-7B-Instruct-v0.2-DPO

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Mistral-7B-Instruct-v0.2-DPO / runs /Apr29_16-59-51_gilbreth-j001.rcac.purdue.edu /events.out.tfevents.1714465224.gilbreth-j001.rcac.purdue.edu.209964.1

Commit History

End of training

672fe6a
verified

AmberYifan commited on Apr 30