trl-lib
/

Qwen2-0.5B-DPO

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Commit History

End of training

623e295
verified

qgallouedec HF staff commited on Sep 27, 2024

End of training

4981722
verified

qgallouedec HF staff commited on Sep 27, 2024

End of training

9a5e8f8
verified

qgallouedec HF staff commited on Sep 27, 2024

Training in progress, epoch 1

55cb2ff
verified

qgallouedec HF staff commited on Sep 27, 2024

End of training

9109dc2
verified

qgallouedec HF staff commited on Sep 26, 2024

Training in progress, epoch 1

48f96ab
verified

qgallouedec HF staff commited on Sep 26, 2024

Training in progress, epoch 1

d112596
verified

qgallouedec HF staff commited on Sep 26, 2024

End of training

2506e7c
verified

qgallouedec HF staff commited on Sep 26, 2024

Training in progress, epoch 1

ecca24c
verified

qgallouedec HF staff commited on Sep 26, 2024

initial commit

e1ce3cb
verified

qgallouedec HF staff commited on Sep 26, 2024