sanchit-gandhi
/

distil-zephyr-1.5b-dpo-ultrafeedback-200k

Text Generation

Inference Endpoints

text-generation-inference

Model card Files Files and versions Metrics Training metrics Community

distil-zephyr-1.5b-dpo-ultrafeedback-200k / wandb

1 contributor

History: 2 commits

sanchit-gandhi's picture

sanchit-gandhi HF staff

Training in progress, step 200

b555414 verified about 2 months ago