EllieS
/

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-com

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-lora-pubmedqa-selfgen-ultrafeedback-com / tokenizer.json

EllieS's picture

Training in progress, step 1000

e4d54ca verified 9 months ago

1.8 MB

File too large to display, you can check the raw version instead.