dctanner
/

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

sablo-pebble-mistral-dpo-lora-HelpSteer_binarized / README.md

Commit History

End of training

fc9d379
verified

dctanner commited on Jan 24

Model save

609f4da
verified

dctanner commited on Jan 24

End of training

95d3ec2
verified

dctanner commited on Jan 18

Model save

e291de3
verified

dctanner commited on Jan 18