open_cn_llm_leaderboard

Running on CPU Upgrade

xuanricheng commited on Mar 7, 2024

Commit

60c79d2

1 Parent(s): b6b9254

set default eval reuslt as 0

Files changed (1) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -83,10 +83,10 @@ class EvalResult:
                     continue
             # We average all scores of a given metric (mostly for mmlu)
-            accs = np.array([v.get(task.metric, None) for k, v in data["results"].items() if task.benchmark in k])
-            if accs.size == 0 or any([acc is None for acc in accs]):
-                continue
             mean_acc = np.mean(accs)
             results[task.benchmark] = mean_acc

                     continue
             # We average all scores of a given metric (mostly for mmlu)
+            # accs = np.array([v.get(task.metric, None) for k, v in data["results"].items() if task.benchmark in k])
+            # if accs.size == 0 or any([acc is None for acc in accs]):
+            #     continue
+            accs = [v.get(task.metric, 0) if task.benchmark in k else 0 for k, v in data["results"].items()]
             mean_acc = np.mean(accs)
             results[task.benchmark] = mean_acc