ShenaoZ
/

0.0001_idpo_same_3itersn_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0001_idpo_same_3itersn_iter_1

Commit History

End of training

760ccd7
verified

ShenaoZ commited on Apr 14, 2024

Model save

129d5b7
verified

ShenaoZ commited on Apr 14, 2024

Training in progress, step 100

4df8cbe
verified

ShenaoZ commited on Apr 14, 2024

initial commit

ac62c2e
verified

ShenaoZ commited on Apr 14, 2024