weltonwang88
/

Qwen2.5-1.5B-Open-R1-GRPO-cot

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-GRPO-cot

Commit History

End of training

941d5ca
verified

weltonwang88 commited on 17 days ago

Model save

07522fb
verified

weltonwang88 commited on 17 days ago

Training in progress, step 12

fa66a4d
verified

weltonwang88 commited on 17 days ago

initial commit

9ac27fb
verified

weltonwang88 commited on 17 days ago