EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-old

Commit History

Model save

8c89d20
verified

EllieS commited on Feb 23

Training in progress, step 7000

3d5b529
verified

EllieS commited on Feb 23

Training in progress, step 6000

c197fc9
verified

EllieS commited on Feb 23

Training in progress, step 5000

7495c59
verified

EllieS commited on Feb 23

Training in progress, step 4000

47bd01f
verified

EllieS commited on Feb 23

Training in progress, step 3000

ec920f6
verified

EllieS commited on Feb 23

Training in progress, step 2000

08be08f
verified

EllieS commited on Feb 23

Training in progress, step 1000

2b84994
verified

EllieS commited on Feb 23

initial commit

aa04d83
verified

EllieS commited on Feb 23