hyunseoki
/

Qwen2.5-1.5B-Instruct-Open-R1-GRPO-test4

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Qwen2.5-1.5B-Instruct-Open-R1-GRPO-test4

Commit History

Model save

4a8a065
verified

hyunseoki commited on Feb 6

Training in progress, step 267

2f40942
verified

hyunseoki commited on Feb 6

Training in progress, step 216

e71f91e
verified

hyunseoki commited on Feb 6

Training in progress, step 162

9bcc6fc
verified

hyunseoki commited on Feb 6

Training in progress, step 108

d815396
verified

hyunseoki commited on Feb 6

Training in progress, step 54

de4733e
verified

hyunseoki commited on Feb 6

initial commit

123954b
verified

hyunseoki commited on Feb 6