LMArena

community

https://lmarena.ai

lmarena_ai

lmarena

AI & ML interests

None defined yet.

Recent Activity

weichiang updated a Space about 10 hours ago

lmarena-ai/chatbot-arena-leaderboard

Timmli updated a dataset 5 days ago

lmarena-ai/arena-hard-auto

lisabdunlap published a Space 6 days ago

lmarena-ai/Prompt-Freshness

View all activity

Organization Card

Community About org cards

LMArena is an open platform for crowdsourced AI benchmarking, originally created by researchers from UC Berkeley SkyLab. We have officially graduated from LMSYS.org!
Free chat with the best AI models at lmarena.ai, and see rankings at lmarena.ai/leaderboard.

Collections 2

spaces 8

Chatbot Arena Leaderboard

Display chatbot performance leaderboard

Arena Hard Viewer

Browse and evaluate model judgments from benchmarks

Llama-4-Maverick-03-26-Experimental Battles

Browse and compare model conversation outcomes

Prompt Freshness

Select similarity and language to filter prompts

Category Arena Example

Browse chatbot responses to compare models

Preference Proxy Evaluations

Preference Proxy Evaluations

models 20

lmarena-ai/p2l-7b-grk-01112025

Updated Feb 25 • 17 • 3

lmarena-ai/p2l-7b-grk-02222025

Updated Feb 25 • 255 • 6

lmarena-ai/p2l-0.5b-bt-01132025

Updated Feb 25 • 9

lmarena-ai/p2l-1.5b-bt-01132025

Updated Feb 25 • 4

lmarena-ai/p2l-3b-bt-01132025

Updated Feb 25 • 5

lmarena-ai/p2l-7b-bt-01132025

Updated Feb 25 • 131 • 2

lmarena-ai/p2l-135m-bt-01132025

Updated Feb 25 • 6

lmarena-ai/p2l-360m-bt-01132025

Updated Feb 25 • 4

lmarena-ai/p2l-135m-rk-01132025

Updated Feb 25 • 2

lmarena-ai/p2l-360m-rk-01132025

Updated Feb 25 • 2

datasets 20

lmarena-ai/arena-hard-auto

Updated 5 days ago • 245

lmarena-ai/categories-benchmark-eval

Preview • Updated 8 days ago • 31 • 3

lmarena-ai/search-arena-v1-7k

Viewer • Updated 22 days ago • 7k • 1.03k • 14

lmarena-ai/webdev-arena-preference-10k

Viewer • Updated Mar 10 • 10.5k • 212 • 7

lmarena-ai/repochat-arena-preference-4k

Viewer • Updated Feb 12 • 3.84k • 82 • 3

lmarena-ai/arena-human-preference-100k

Viewer • Updated Feb 11 • 106k • 520 • 39

lmarena-ai/VisionArena-Chat

Viewer • Updated Feb 4 • 199k • 3.04k • 3

lmarena-ai/VisionArena-Battle

Viewer • Updated Jan 11 • 29.8k • 181 • 6

lmarena-ai/vision-arena-bench-v0.1

Viewer • Updated Dec 19, 2024 • 500 • 1.2k • 1

lmarena-ai/Llama-3-70b-battles

Viewer • Updated Oct 28, 2024 • 1.6k • 63 • 3