Spaces:

braindao
/

soliditybench-leaderboard

Running

brunneis commited on Oct 10

Commit

308e87c

•

1 Parent(s): e3bcf20

Fix solbench score calc

Files changed (1) hide show

src/leaderboard/read_evals.py CHANGED Viewed

@@ -121,11 +121,23 @@ class EvalResult:
     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         # average = sum([v for v in self.results.values() if v is not None]) / len(Tasks)
-        solbench = (
-            self.results.get('naive_judge', 0) * 0.3 +
-            self.results.get('human_eval_solidity_pass@1', 0) * 0.5 +
-            self.results.get('human_eval_solidity_pass@3', 0) * 0.2
-        )
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,
             AutoEvalColumn.precision.name: self.precision.value.name,

     def to_dict(self):
         """Converts the Eval Result to a dict compatible with our dataframe display"""
         # average = sum([v for v in self.results.values() if v is not None]) / len(Tasks)
+        scores = {
+            'naive_judge': self.results.get('naive_judge', 0),
+            'human_eval_solidity_pass@1': self.results.get('human_eval_solidity_pass@1', 0),
+            'human_eval_solidity_pass@3': self.results.get('human_eval_solidity_pass@3', 0)
+        }
+        solbench = 0
+        non_zero_scores = {k: v for k, v in scores.items() if v != 0}
+        if non_zero_scores:
+            weights = {
+                'naive_judge': 0.3,
+                'human_eval_solidity_pass@1': 0.5,
+                'human_eval_solidity_pass@3': 0.2
+            }
+            total_weight = sum(weights[k] for k in non_zero_scores)
+            solbench = sum(scores[k] * weights[k] / total_weight for k in non_zero_scores)
         data_dict = {
             "eval_name": self.eval_name,  # not a column, just a save name,
             AutoEvalColumn.precision.name: self.precision.value.name,