Evaluation datasets

community

AI & ML interests

None defined yet.

Collections 9

View 9 collections

models 1

lighteval/different-chat-templates-per-revision

Updated May 15, 2025

datasets 192

lighteval/agi_eval_en

Viewer • Updated Dec 18, 2025 • 3.37k • 509 • 4

lighteval/piqa

Viewer • Updated Nov 21, 2025 • 21k • 5.21k • 1

lighteval/logiqa_harness

Updated Aug 19, 2025 • 80

lighteval/sacrebleu_manual

Viewer • Updated Aug 19, 2025 • 936k • 5.04k

lighteval/lextreme

Viewer • Updated Aug 19, 2025 • 194k • 496 • 1

lighteval/bbh

Viewer • Updated Aug 18, 2025 • 78.3k • 1.2k • 1

lighteval/synthetic_reasoning

Viewer • Updated Aug 18, 2025 • 33k • 136 • 8

lighteval/covid_dialogue

Viewer • Updated Aug 18, 2025 • 614 • 56 • 1

lighteval/numeracy

Viewer • Updated Aug 18, 2025 • 1.6k • 63 • 2

lighteval/synthetic_reasoning_natural

Viewer • Updated Aug 18, 2025 • 22k • 64 • 15

View 192 datasets