alan918727
/

qwen2.5_3B_grpo_v1

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen2.5_3B_grpo_v1

Commit History

Trained with Unsloth

22f7dfd
verified

alan918727 commited on Feb 10

Upload tokenizer

84aa9a5
verified

alan918727 commited on Feb 10

Upload README.md with huggingface_hub

9f6282d
verified

alan918727 commited on Feb 10

initial commit

d9f7a8d
verified

alan918727 commited on Feb 10