amaydle
/

grpo-coder-qwen-2-5-7b-instruct-old

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions

grpo-coder-qwen-2-5-7b-instruct-old / grpo_saved_lora

162 MB

1 contributor

History: 3 commits

amaydle's picture

Training in progress, step 253

c42cd63 verified 6 months ago