EllieS
/

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-ultrafeedback / adapter_model.safetensors

Commit History

Model save

9428d29
verified

EllieS commited on Jan 18

Training in progress, step 7000

e7d2302
verified

EllieS commited on Jan 17

Training in progress, step 5000

69322f6
verified

EllieS commited on Jan 17

Training in progress, step 1000

fd7773a
verified

EllieS commited on Jan 17