yakazimir
/

qwen_cpo_entropy_0_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_cpo_entropy_0_1

Commit History

End of training

b37f9ad
verified

yakazimir commited on Nov 21

Model save

72c8015
verified

yakazimir commited on Nov 21

Training in progress, step 5604

b1ccc59
verified

yakazimir commited on Nov 21

Model save

ced244c
verified

yakazimir commited on Nov 21

Training in progress, step 5604

034cdb1
verified

yakazimir commited on Nov 21

initial commit

0ea32e0
verified

yakazimir commited on Nov 20