glorgao
/

Qwen-2.5-Math-7B-GRPO-KL0003

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen-2.5-Math-7B-GRPO-KL0003

Commit History

End of training

ccfb52c
verified

glorgao commited on Feb 21

Model save

53cde97
verified

glorgao commited on Feb 21

initial commit

ef4bbc1
verified

glorgao commited on Feb 20