Edit Models filters

Tasks

Parameters

Libraries

PyTorch

sentence-transformers

Apps

Inference Providers

Models

Base only

rayonlabs/Qwen2_5-7B-Instruct-multilingual-reward-bench-cb8829bf-0e4c-4904-995a-3e14b40486a4

Updated Feb 19, 2025

WPRM/qwenvl_reward_multimodal_llamafactory

4B • Updated Apr 22, 2025

WPRM/qwen2_5vl-3b_ar_reward_cot_multimodal

4B • Updated Apr 30, 2025

WPRM/qwen2_5vl-3b_ar_reward_cot_wo_checklist_multimodal

4B • Updated Apr 30, 2025

WPRM/qwen2_5vl-3b_ar_reward_cot_multimodal_final_new

4B • Updated May 7, 2025 • 2

WPRM/qwen2_5vl-3b_ar_reward_cot_multimodal_mtl

4B • Updated May 10, 2025 • 2

nvidia/Llama-3.3-Nemotron-70B-Reward-Multilingual

Text Generation • 71B • Updated Jun 26, 2025 • 47 • • 11

ysc0034/grpo_pure_code_spatial457_wo_multireward_90

8B • Updated Aug 1, 2025

rayonlabs/Qwen1_5-0_5B-Chat-multilingual-reward-bench-4fd2a9c8-ee0a-493d-ae0f-a110381f0506

0.5B • Updated Aug 7, 2025 • 8

hoooooooooori/multi_reward

Updated Aug 15, 2025

Yuhan123/multipref-reward-model-qwen-single

Updated Aug 26, 2025

Yuhan123/multipref-reward-model-qwen

Text Classification • 2B • Updated Aug 27, 2025

Yuhan123/olmo-multipref-reward-model

1B • Updated Aug 29, 2025 • 1

worstcoder/SD3.5M-DiffusionNFT-MultiReward

Text-to-Image • Updated Oct 9, 2025 • 245 • 7

AmirMohseni/skywork-reward-v2-llama-3.1-8b-rank512-eduarena-multiturn-lmarena-all-data

Updated Nov 8, 2025

AmirMohseni/skywork-reward-v2-llama-3.1-8b-rank128-eduarena-multiturn-lmarena-all-data

Updated Nov 9, 2025

AmirMohseni/skywork-reward-v2-llama-3.1-8b-rank128-eduarena-multiturn-lmarena-multiturn

Updated Nov 9, 2025

AmirMohseni/skywork-reward-v2-llama-3.1-8b-rank128-eduarena-multiturn-lmarena-multiturn-v2

Updated Nov 10, 2025

AmirMohseni/skywork-reward-v2-llama-3.1-8b-rank128-test-full-multiturn

Updated Nov 10, 2025

Brtwm/reward_model_multilingual

Text Classification • 0.1B • Updated Nov 29, 2025 • 1

phuongntc/vit5_large_ppo_rewardverify_multievalsumviet2_lorapenalty300

Updated Dec 13, 2025

phuongntc/vit5_large_ppo_rewardverify_multievalsumviet2_lorapenalty7000

Updated Dec 14, 2025

phuongntc/vit5_large_grpo_rewardverify_multievalsumviet2_lora

Updated Dec 23, 2025

phuongntc/vit5_large_grpo_rewardverify_multievalsumviet2

Updated Dec 23, 2025

phuongntc/vit5-large-grpo_rewardverify_multievalsumviet2_nopenalty

Updated Dec 25, 2025

GazeEzio/mol_optim_property_grpo_multi_turn_sum_intermediate_h20_reward_v0

Updated Jan 13