Spaces:

microsoft
/

MageBench-Leaderboard

Running

daiqi commited on Nov 29, 2024

Commit

9afe185

verified ·

1 Parent(s): fe96d5f

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -51,10 +51,20 @@ except Exception:
     restart_space()
-LEADERBOARD_DF = get_leaderboard_df(EVAL_RESULTS_PATH, EVAL_REQUESTS_PATH, COLS, BENCHMARK_COLS)
-_test_data = pd.DataFrame({"Score": [54,46,53], "Name": ["MageBench", "MageBench", "MageBench"], "BaseModel": ["GPT-4o", "GPT-4o", "LLaMA"], "Env.": ["Sokoban", "Sokoban", "Football"],
-                          "Target-research": ["Model-Eval-Global", "Model-Eval-Online", "Agent-Eval-Prompt"], "Subset": ["mini", "all", "mini"],  "Link": ["xxx", "xxx", "xxx"]})
 (
     finished_eval_queue_df,
@@ -104,7 +114,7 @@ with demo:
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
-            leaderboard = init_leaderboard(_test_data)  # LEADERBOARD_DF
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")

     restart_space()
+# LEADERBOARD_DF = get_leaderboard_df(EVAL_RESULTS_PATH, EVAL_REQUESTS_PATH, COLS, BENCHMARK_COLS)
+import jsonlines
+# Initialize an empty list to store the JSON objects
+json_list = []
+# Open the JSONL file
+with jsonlines.open('commit_results.jsonl') as reader:
+    for obj in reader:
+        # Append each JSON object to the list
+        json_list.append(obj)
+# _test_data = pd.DataFrame({"Score": [54,46,53], "Name": ["MageBench", "MageBench", "MageBench"], "BaseModel": ["GPT-4o", "GPT-4o", "LLaMA"], "Env.": ["Sokoban", "Sokoban", "Football"],
+                          # "Target-research": ["Model-Eval-Global", "Model-Eval-Online", "Agent-Eval-Prompt"], "Subset": ["mini", "all", "mini"],  "Link": ["xxx", "xxx", "xxx"]})
+committed = pd.DataFrame(json_list)
 (
     finished_eval_queue_df,
     with gr.Tabs(elem_classes="tab-buttons") as tabs:
         with gr.TabItem("🏅 LLM Benchmark", elem_id="llm-benchmark-tab-table", id=0):
+            leaderboard = init_leaderboard(committed)  # LEADERBOARD_DF
         with gr.TabItem("📝 About", elem_id="llm-benchmark-tab-table", id=2):
             gr.Markdown(LLM_BENCHMARKS_TEXT, elem_classes="markdown-text")