Dongwei
/

DeepSeek-R1-Distill-Qwen-1.5B-GRPO_Math_smalllr

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

DeepSeek-R1-Distill-Qwen-1.5B-GRPO_Math_smalllr / .gitattributes

Commit History

Model save

4a42ca3
verified

Dongwei commited on 14 days ago

initial commit

b779ba7
verified

Dongwei commited on 14 days ago