Spaces:

onekq-ai
/

WebApp1K-models-leaderboard

Running

App Files Files Community

onekq commited on Oct 24

Commit

53aba41

•

1 Parent(s): f930565

Update app.py

Browse files

Files changed (1) hide show

app.py +9 -15

app.py CHANGED Viewed

@@ -62,29 +62,23 @@ scenarios = df['Scenario'].unique().tolist()
 demo = gr.Blocks()
 with demo:
     gr.Markdown("# 🏆 WebApp1K Models Leaderboard")
     gr.Markdown(
         "## [Discord](https://discord.gg/3qpAbWC7) " +
         "[Papers](https://huggingface.co/onekq) " +
-        "[Blog](https://huggingface.co/blog/onekq/all-llms-write-great-code) "
         "[Github](https://github.com/onekq/WebApp1k) " +
-        "[AI Models](https://www.aimodels.fyi/papers/arxiv/webapp1k-practical-code-generation-benchmark-web-app)")
-    # Initialize leaderboard with the complete DataFrame
-    duo_complete_pass_at_k = duo_df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
-        'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean()
-    }, index=['pass@1'])).reset_index()
-    complete_pass_at_k = df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
-        'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean(),
-        'pass@5': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 5).mean(),
-        'pass@10': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 10).mean()
-    }, index=['pass@1', 'pass@5', 'pass@10'])).reset_index()
     gr.Markdown("# WebApp1K-Duo ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-Duo-React))")
-    duo_leaderboard = init_leaderboard(duo_complete_pass_at_k, default_selection = ["Model", "pass@1"], height=400)
     gr.Markdown("# WebApp1K ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-React))")
-    leaderboard = init_leaderboard(complete_pass_at_k, height=800)
 # Launch the Gradio interface
 demo.launch()

 demo = gr.Blocks()
 with demo:
+    # Markdown for the leaderboard header and external links
     gr.Markdown("# 🏆 WebApp1K Models Leaderboard")
     gr.Markdown(
         "## [Discord](https://discord.gg/3qpAbWC7) " +
         "[Papers](https://huggingface.co/onekq) " +
+        "[Blog](https://huggingface.co/blog/onekq/all-llms-write-great-code) " +
         "[Github](https://github.com/onekq/WebApp1k) " +
+        "[AI Models](https://www.aimodels.fyi/papers/arxiv/webapp1k-practical-code-generation-benchmark-web-app)"
+    )
+    # WebApp1K-Duo leaderboard display
     gr.Markdown("# WebApp1K-Duo ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-Duo-React))")
+    duo_leaderboard.render()
+    # WebApp1K main leaderboard display
     gr.Markdown("# WebApp1K ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-React))")
+    leaderboard.render()
 # Launch the Gradio interface
 demo.launch()