ShenaoZhang
/

0.001_idpo_4iters_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.001_idpo_4iters_iter_1

Commit History

End of training

37819c5
verified

ShenaoZhang commited on Apr 6, 2024

Model save

f6d6776
verified

ShenaoZhang commited on Apr 6, 2024

initial commit

ce7b04c
verified

ShenaoZhang commited on Apr 6, 2024