Spaces:

onekq-ai
/

WebApp1K-models-leaderboard

Running

App Files Files Community

John6666 commited on Oct 24, 2024

Commit

b2172d7

verified ·

1 Parent(s): 9252bfb

Quick fix.

Browse files

Files changed (3) hide show

README.md +1 -0
app.py +14 -16
requirements.txt +1 -1

README.md CHANGED Viewed

@@ -4,6 +4,7 @@ emoji: 🥇
 colorFrom: green
 colorTo: indigo
 sdk: gradio
 app_file: app.py
 pinned: true
 license: mit

 colorFrom: green
 colorTo: indigo
 sdk: gradio
+sdk_version: 4.41.0
 app_file: app.py
 pinned: true
 license: mit

app.py CHANGED Viewed

@@ -56,12 +56,21 @@ def init_leaderboard(dataframe, default_selection=["Model", "pass@1", "pass@5",
     )
 # Gradio interface
-models = df['Model'].unique().tolist()
-scenarios = df['Scenario'].unique().tolist()
-demo = gr.Blocks()
-with demo:
     gr.Markdown("# 🏆 WebApp1K Models Leaderboard")
     gr.Markdown(
         "## [Discord](https://discord.gg/3qpAbWC7) " +
@@ -70,21 +79,10 @@ with demo:
         "[Github](https://github.com/onekq/WebApp1k) " +
         "[AI Models](https://www.aimodels.fyi/papers/arxiv/webapp1k-practical-code-generation-benchmark-web-app)")
-    # Initialize leaderboard with the complete DataFrame
-    duo_complete_pass_at_k = duo_df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
-        'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean()
-    }, index=['pass@1'])).reset_index()
-    complete_pass_at_k = df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
-        'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean(),
-        'pass@5': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 5).mean(),
-        'pass@10': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 10).mean()
-    }, index=['pass@1', 'pass@5', 'pass@10'])).reset_index()
     gr.Markdown("# WebApp1K-Duo ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-Duo-React))")
     duo_leaderboard = init_leaderboard(duo_complete_pass_at_k, default_selection = ["Model", "pass@1"], height=400)
     gr.Markdown("# WebApp1K ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-React))")
-    #leaderboard = init_leaderboard(complete_pass_at_k, height=800)
 # Launch the Gradio interface
 demo.launch()

     )
 # Gradio interface
+#models = df['Model'].unique().tolist()
+#scenarios = df['Scenario'].unique().tolist()
+# Initialize leaderboard with the complete DataFrame
+duo_complete_pass_at_k = duo_df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
+    'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean()
+}, index=['pass@1'])).reset_index()
+complete_pass_at_k = df.groupby('Model')[['Runs', 'Successes']].apply(lambda x: pd.Series({
+    'pass@1': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 1).mean(),
+    'pass@5': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 5).mean(),
+    'pass@10': estimate_pass_at_k(x['Runs'].values, x['Successes'].values, 10).mean()
+}, index=['pass@1', 'pass@5', 'pass@10'])).reset_index()
+with gr.Blocks() as demo:
     gr.Markdown("# 🏆 WebApp1K Models Leaderboard")
     gr.Markdown(
         "## [Discord](https://discord.gg/3qpAbWC7) " +
         "[Github](https://github.com/onekq/WebApp1k) " +
         "[AI Models](https://www.aimodels.fyi/papers/arxiv/webapp1k-practical-code-generation-benchmark-web-app)")
     gr.Markdown("# WebApp1K-Duo ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-Duo-React))")
     duo_leaderboard = init_leaderboard(duo_complete_pass_at_k, default_selection = ["Model", "pass@1"], height=400)
     gr.Markdown("# WebApp1K ([Benchmark](https://huggingface.co/datasets/onekq-ai/WebApp1K-React))")
+    leaderboard = init_leaderboard(complete_pass_at_k, default_selection = [], height=800)
 # Launch the Gradio interface
 demo.launch()

requirements.txt CHANGED Viewed

@@ -3,7 +3,7 @@ black
 datasets
 gradio
 gradio[oauth]
-gradio_leaderboard==0.0.9
 gradio_client
 huggingface-hub>=0.18.0
 matplotlib

 datasets
 gradio
 gradio[oauth]
+gradio_leaderboard>=0.0.9
 gradio_client
 huggingface-hub>=0.18.0
 matplotlib