qgallouedec
/

Qwen2-0.5B-OnlineDPO-PairRM

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2-0.5B-OnlineDPO-PairRM

Commit History

End of training

9273394
verified

qgallouedec HF staff commited on Oct 25

Model save

f3b447e
verified

qgallouedec HF staff commited on Oct 25

Training in progress, step 885

a217b68
verified

qgallouedec HF staff commited on Oct 25

Training in progress, step 500

f6bd601
verified

qgallouedec HF staff commited on Oct 25

initial commit

091020c
verified

qgallouedec HF staff commited on Oct 25