longlian
/

Qwen2-0.5B-GRPO-peft-demo

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Qwen2-0.5B-GRPO-peft-demo

Commit History

Training in progress, step 10

f91f181
verified

longlian commited on 20 days ago

initial commit

e20c78f
verified

longlian commited on 20 days ago