AmberYifan
/

llama-7b-sft-DPO

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llama-7b-sft-DPO / train_results.json

Commit History

Model save

5c51859
verified

AmberYifan commited on May 1