lole25
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / adapter_model.safetensors

Commit History

Training in progress, step 400

1513555
verified

lole25 commited on Mar 11

Training in progress, step 300

a782dc1
verified

lole25 commited on Mar 11

Model save

f872924
verified

lole25 commited on Feb 26

Training in progress, step 300

3ef9491
verified

lole25 commited on Feb 26

Training in progress, step 200

2f5f9d0
verified

lole25 commited on Feb 26

Training in progress, step 100

9da75ae
verified

lole25 commited on Feb 26