CharlesLi
/

OpenELM-1_1B-DPO-full-max-14-reward

Text Generation

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

OpenELM-1_1B-DPO-full-max-14-reward / README.md

Commit History

Model save

c9c9d19
verified

CharlesLi commited on Oct 7, 2024

Model save

80c4adf
verified

CharlesLi commited on Oct 7, 2024

Model save

f021d10
verified

CharlesLi commited on Oct 5, 2024

Model save

b33a043
verified

CharlesLi commited on Sep 16, 2024