ShenaoZ
/

0.01_withdpo_4iters_bs256_531lr_iter_4

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.01_withdpo_4iters_bs256_531lr_iter_4

Commit History

End of training

99bb066
verified

ShenaoZ commited on May 7, 2024

Model save

0849e09
verified

ShenaoZ commited on May 7, 2024

initial commit

f509be2
verified

ShenaoZ commited on May 7, 2024