lewtun
/

zephyr-7b-dpo-qlora-fix

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora-fix / adapter_model.safetensors

Commit History

Model save

10b512a
verified

lewtun HF staff commited on Feb 2

Training in progress, step 400

17e3ec2
verified

lewtun HF staff commited on Feb 2

Training in progress, step 300

d793c08
verified

lewtun HF staff commited on Feb 2

Training in progress, step 200

3804feb
verified

lewtun HF staff commited on Feb 2

Training in progress, step 100

d1239c7
verified

lewtun HF staff commited on Feb 2

Training in progress, step 100

cab1b14
verified

lewtun HF staff commited on Feb 2