Evaluation datasets

community

AI & ML interests

None defined yet.

Collections 9

View 9 collections

models 1

lighteval/different-chat-templates-per-revision

Updated May 15, 2025

datasets 192

lighteval/agi_eval_en

Viewer • Updated Dec 18, 2025 • 3.37k • 1.38k • 4

lighteval/piqa

Viewer • Updated Nov 21, 2025 • 21k • 11.4k • 1

lighteval/logiqa_harness

Updated Aug 19, 2025 • 159

lighteval/sacrebleu_manual

Viewer • Updated Aug 19, 2025 • 936k • 4.95k

lighteval/lextreme

Viewer • Updated Aug 19, 2025 • 194k • 693 • 1

lighteval/bbh

Viewer • Updated Aug 18, 2025 • 78.3k • 1.33k • 1

lighteval/synthetic_reasoning

Viewer • Updated Aug 18, 2025 • 33k • 148 • 8

lighteval/covid_dialogue

Viewer • Updated Aug 18, 2025 • 614 • 24 • 1

lighteval/numeracy

Viewer • Updated Aug 18, 2025 • 1.6k • 77 • 2

lighteval/synthetic_reasoning_natural

Viewer • Updated Aug 18, 2025 • 22k • 53 • 15

View 192 datasets