Spaces:

launch
/

ExpertLongBench

Running

App Files Files Community

JieRuan commited on Sep 28

Commit

e4cd1e0

verified ·

1 Parent(s): 55f3406

Update src/streamlit_app.py

Browse files

Files changed (1) hide show

src/streamlit_app.py +6 -6

src/streamlit_app.py CHANGED Viewed

@@ -39,7 +39,7 @@ st.markdown(
         </p>
         <p style="font-size:20px;">
               📑 <a href="https://arxiv.org/abs/2506.01241">Paper</a> | 💻 <a href="https://github.com/launchnlp/ExpertLongBench">GitHub</a> | 🤗 <a href="https://huggingface.co/datasets/launch/ExpertLongBench">Public Dataset</a> |
-               ⚙️ <strong>Version</strong>: <strong>V1</strong> | <strong># Models</strong>: 12 | Updated: <strong>June 2025</strong>
         </p>
     </div>
     ''',
@@ -50,7 +50,7 @@ st.markdown(
 @st.cache_data
 def load_data(path):
     df = pd.read_json(path, lines=True)
-    score_cols = [f"T{i}" for i in range(1, 12)]
     df["Avg"] = df[score_cols].mean(axis=1).round(1)
     # df["Avg"] = np.ceil(df[score_cols].mean(axis=1) * 10) / 10
     # Compute rank per column (1 = best)
@@ -69,11 +69,11 @@ if selected_tier == 'F1':
     df = load_data("src/models.json")
     # Precompute max ranks for color scaling
-    score_cols = [f"T{i}" for i in range(1, 12)] + ["Avg"]
     max_ranks = {col: df[f"{col}_rank"].max() for col in score_cols}
     # Build raw HTML table
-    cols = ["Model"] + [f"T{i}" for i in range(1,12)] + ["Avg"]
     html = "<table style='border-collapse:collapse; width:100%; font-size:14px;'>"
     # header
     html += "<tr>" + "".join(f"<th style='padding:6px;'>{col}</th>" for col in cols) + "</tr>"
@@ -104,11 +104,11 @@ else:
     df2 = load_data("src/model_acc.json")
     # Precompute max ranks for color scaling
-    score_cols = [f"T{i}" for i in range(1, 12)] + ["Avg"]
     max_ranks = {col: df2[f"{col}_rank"].max() for col in score_cols}
     # Build raw HTML table
-    cols = ["Model"] + [f"T{i}" for i in range(1,12)] + ["Avg"]
     html = "<table style='border-collapse:collapse; width:100%; font-size:14px;'>"
     # header
     html += "<tr>" + "".join(f"<th style='padding:6px;'>{col}</th>" for col in cols) + "</tr>"

         </p>
         <p style="font-size:20px;">
               📑 <a href="https://arxiv.org/abs/2506.01241">Paper</a> | 💻 <a href="https://github.com/launchnlp/ExpertLongBench">GitHub</a> | 🤗 <a href="https://huggingface.co/datasets/launch/ExpertLongBench">Public Dataset</a> |
+               ⚙️ <strong>Version</strong>: <strong>V1</strong> | <strong># Models</strong>: 13 | Updated: <strong>Sept 2025</strong>
         </p>
     </div>
     ''',
 @st.cache_data
 def load_data(path):
     df = pd.read_json(path, lines=True)
+    score_cols = [f"T{i}" for i in range(1, 13)]
     df["Avg"] = df[score_cols].mean(axis=1).round(1)
     # df["Avg"] = np.ceil(df[score_cols].mean(axis=1) * 10) / 10
     # Compute rank per column (1 = best)
     df = load_data("src/models.json")
     # Precompute max ranks for color scaling
+    score_cols = [f"T{i}" for i in range(1, 13)] + ["Avg"]
     max_ranks = {col: df[f"{col}_rank"].max() for col in score_cols}
     # Build raw HTML table
+    cols = ["Model"] + [f"T{i}" for i in range(1,13)] + ["Avg"]
     html = "<table style='border-collapse:collapse; width:100%; font-size:14px;'>"
     # header
     html += "<tr>" + "".join(f"<th style='padding:6px;'>{col}</th>" for col in cols) + "</tr>"
     df2 = load_data("src/model_acc.json")
     # Precompute max ranks for color scaling
+    score_cols = [f"T{i}" for i in range(1, 13)] + ["Avg"]
     max_ranks = {col: df2[f"{col}_rank"].max() for col in score_cols}
     # Build raw HTML table
+    cols = ["Model"] + [f"T{i}" for i in range(1,13)] + ["Avg"]
     html = "<table style='border-collapse:collapse; width:100%; font-size:14px;'>"
     # header
     html += "<tr>" + "".join(f"<th style='padding:6px;'>{col}</th>" for col in cols) + "</tr>"