blakenp
/

Qwen2-0.5B-Reward

Text Classification

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

Qwen2-0.5B-Reward / runs

1 contributor

History: 1 commit

blakenp's picture

rlhf_qwen2.5 0.5B

500a6c7 verified about 2 months ago

Dec12_23-47-50_c02f485ab7a8
rlhf_qwen2.5 0.5B about 2 months ago