lewtun
/

gemma-7b-dpo-full-mix1-beta-0.1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

gemma-7b-dpo-full-mix1-beta-0.1

Commit History

End of training

f9e1bdc
verified

lewtun HF staff commited on Feb 29

Model save

957ba3d
verified

lewtun HF staff commited on Feb 29

initial commit

637fc16
verified

lewtun HF staff commited on Feb 29