dctanner
/

sablo-pebble-mistral-dpo-lora-oasst2_dpo_pairs_en

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-oasst2_dpo_pairs_en / README.md

Commit History

End of training

5536547
verified

dctanner commited on Feb 8

Model save

82029ca
verified

dctanner commited on Feb 8