taicheng
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora

1 contributor

History: 9 commits

taicheng's picture

Training in progress, step 800

6fc398d verified 6 months ago