CharlesLi
/

OpenELM-1_1B-DPO-full-max-4-reward

Text Generation

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

OpenELM-1_1B-DPO-full-max-4-reward / runs

Commit History

Model save

aeb82f8
verified

CharlesLi commited on Oct 7, 2024

Model save

7d13ca1
verified

CharlesLi commited on Oct 6, 2024

Model save

1643ab1
verified

CharlesLi commited on Oct 5, 2024

Model save

65b0291
verified

CharlesLi commited on Sep 16, 2024