ShenaoZ
/

0.0001_idpo_same_3iters_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0001_idpo_same_3iters_iter_1

Commit History

End of training

542cc2a
verified

ShenaoZ commited on Apr 12

Model save

47420b0
verified

ShenaoZ commited on Apr 12

Training in progress, step 100

aac54f5
verified

ShenaoZ commited on Apr 12

initial commit

6108e9b
verified

ShenaoZ commited on Apr 12