Spaces:

ludwigstumpp
/

llm-leaderboard

Running

Ludwig Stumpp commited on Jun 1, 2023

Commit

5a5e2af

•

2 Parent(s): 2fc8d56 af4ecbe

Merge remote-tracking branch 'origin/main' into hf-launch

Files changed (2) hide show

README.md CHANGED Viewed

The diff for this file is too large to render. See raw diff

streamlit_app.py CHANGED Viewed

@@ -214,15 +214,17 @@ def setup_leaderboard(readme: str):
     st.markdown("## Leaderboard")
     modify = st.checkbox("Add filters")
     if modify:
         df_leaderboard = filter_dataframe_by_row_and_columns(df_leaderboard, ignore_columns=NON_BENCHMARK_COLS)
         df_leaderboard = filter_dataframe_by_column_values(df_leaderboard)
-    df_leaderboard = df_leaderboard.dropna(axis=1, how="all")
-    benchmark_columns = [c for c in df_leaderboard.columns if df_leaderboard[c].dtype == float]
-    rows_wo_any_benchmark = df_leaderboard[benchmark_columns].isna().all(axis=1)
-    df_leaderboard = df_leaderboard[~rows_wo_any_benchmark]
     st.dataframe(df_leaderboard)
@@ -273,6 +275,7 @@ def setup_sources():
     - [lmsys.org - Chatbot Arena benchmarks](https://lmsys.org/blog/2023-05-03-arena/)
     - [Papers With Code](https://paperswithcode.com/)
     - [Stanford HELM](https://crfm.stanford.edu/helm/latest/)
     """
     )

     st.markdown("## Leaderboard")
     modify = st.checkbox("Add filters")
+    clear_empty_entries = st.checkbox("Clear empty entries", value=True)
     if modify:
         df_leaderboard = filter_dataframe_by_row_and_columns(df_leaderboard, ignore_columns=NON_BENCHMARK_COLS)
         df_leaderboard = filter_dataframe_by_column_values(df_leaderboard)
+    if clear_empty_entries:
+        df_leaderboard = df_leaderboard.dropna(axis=1, how="all")
+        benchmark_columns = [c for c in df_leaderboard.columns if df_leaderboard[c].dtype == float]
+        rows_wo_any_benchmark = df_leaderboard[benchmark_columns].isna().all(axis=1)
+        df_leaderboard = df_leaderboard[~rows_wo_any_benchmark]
     st.dataframe(df_leaderboard)
     - [lmsys.org - Chatbot Arena benchmarks](https://lmsys.org/blog/2023-05-03-arena/)
     - [Papers With Code](https://paperswithcode.com/)
     - [Stanford HELM](https://crfm.stanford.edu/helm/latest/)
+    - [HF Open LLM Leaderboard](https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard)
     """
     )