blakenp
/

Qwen2-0.5B-Reward

Text Classification

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-Reward

Commit History

rlhf_qwen2.5 0.5B

500a6c7
verified

blakenp commited on 6 days ago

initial commit

3812a2b
verified

blakenp commited on 6 days ago