ShenaoZhang
/

0.01_3iters_bs256_nodpo_full6w_iter_1

Text Generation

alignment-handbook

Generated from Trainer

Inference Endpoints

text-generation-inference

Model card Files Files and versions Community

0.01_3iters_bs256_nodpo_full6w_iter_1

Commit History

End of training

1d0b13f
verified

ShenaoZhang commited on Apr 29

Model save

654d5c9
verified

ShenaoZhang commited on Apr 29

initial commit

23837c5
verified

ShenaoZhang commited on Apr 29