LLM evals and benchmark datasets
updated
Viewer
•
Updated
•
8.11k
•
6.98k
•
91
Viewer
•
Updated
•
164
•
92.4k
•
289
Viewer
•
Updated
•
541
•
16.1k
•
64
Viewer
•
Updated
•
7.79k
•
542k
•
179
Updated
•
479k
•
61
Viewer
•
Updated
•
12.1k
•
44.5k
•
337
Viewer
•
Updated
•
231k
•
149k
•
431
Viewer
•
Updated
•
1.63k
•
38.1k
•
228
Viewer
•
Updated
•
17.6k
•
331k
•
660
Viewer
•
Updated
•
60k
•
532k
•
114
Updated
•
23.5k
•
54
HuggingFaceH4/mt_bench_prompts
Viewer
•
Updated
•
80
•
379
•
17
Viewer
•
Updated
•
34.6k
•
2.29k
•
108
Viewer
•
Updated
•
95.4k
•
4.23k
•
39