leaderboard

Running on CPU Upgrade

App Files Files Community

nan commited on Oct 17, 2024

Commit

254881e

1 Parent(s): d62c98e

refactor: rename the variables

Browse files

Files changed (3) hide show

app.py +16 -16
src/loaders.py +8 -8
src/models.py +2 -2

app.py CHANGED Viewed

@@ -114,7 +114,7 @@ def update_datastore(version):
     selected_domains = get_domain_dropdown(QABenchmarks[datastore.slug])
     selected_langs = get_language_dropdown(QABenchmarks[datastore.slug])
     selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
-    leaderboard_table = get_leaderboard_table(datastore.leaderboard_df_qa, datastore.types_qa)
     hidden_leaderboard_table = \
         get_leaderboard_table(datastore.raw_df_qa, datastore.types_qa, visible=False)
     return selected_domains, selected_langs, selected_rerankings, leaderboard_table, hidden_leaderboard_table
@@ -127,7 +127,7 @@ def update_datastore_long_doc(version):
     selected_domains = get_domain_dropdown(LongDocBenchmarks[datastore.slug])
     selected_langs = get_language_dropdown(LongDocBenchmarks[datastore.slug])
     selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
-    leaderboard_table = get_leaderboard_table(datastore.leaderboard_df_long_doc, datastore.types_long_doc)
     hidden_leaderboard_table = \
         get_leaderboard_table(datastore.raw_df_long_doc, datastore.types_long_doc, visible=False)
     return selected_domains, selected_langs, selected_rerankings, leaderboard_table, hidden_leaderboard_table
@@ -170,7 +170,7 @@ with demo:
                             with gr.Column():
                                 selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
                         #  shown_table
-                        lb_table = get_leaderboard_table(datastore.leaderboard_df_qa, datastore.types_qa)
                         # Dummy leaderboard for handling the case when the user uses backspace key
                         hidden_lb_table = get_leaderboard_table(datastore.raw_df_qa, datastore.types_qa, visible=False)
@@ -218,9 +218,9 @@ with demo:
                             with gr.Column(scale=1):
                                 selected_noreranker = get_noreranking_dropdown()
-                        lb_df_retriever = datastore.leaderboard_df_qa[
-                            datastore.leaderboard_df_qa[COL_NAME_RERANKING_MODEL] == "NoReranker"
-                        ]
                         lb_df_retriever = reset_rank(lb_df_retriever)
                         lb_table_retriever = get_leaderboard_table(lb_df_retriever, datastore.types_qa)
@@ -276,9 +276,9 @@ with demo:
                             queue=True,
                         )
                     with gr.TabItem("Reranking Only", id=12):
-                        lb_df_reranker = datastore.leaderboard_df_qa[
-                            datastore.leaderboard_df_qa[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK
-                        ]
                         lb_df_reranker = reset_rank(lb_df_reranker)
                         reranking_models_reranker = (
                             lb_df_reranker[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()
@@ -365,7 +365,7 @@ with demo:
                                 selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
                         lb_table_long_doc = get_leaderboard_table(
-                            datastore.leaderboard_df_long_doc, datastore.types_long_doc
                         )
                         # Dummy leaderboard for handling the case when the user uses backspace key
@@ -421,9 +421,9 @@ with demo:
                                 search_bar_retriever = get_search_bar()
                             with gr.Column(scale=1):
                                 selected_noreranker = get_noreranking_dropdown()
-                        lb_df_retriever_long_doc = datastore.leaderboard_df_long_doc[
-                            datastore.leaderboard_df_long_doc[COL_NAME_RERANKING_MODEL] == "NoReranker"
-                        ]
                         lb_df_retriever_long_doc = reset_rank(lb_df_retriever_long_doc)
                         lb_table_retriever_long_doc = get_leaderboard_table(
                             lb_df_retriever_long_doc, datastore.types_long_doc
@@ -479,9 +479,9 @@ with demo:
                             queue=True,
                         )
                     with gr.TabItem("Reranking Only", id=22):
-                        lb_df_reranker_ldoc = datastore.leaderboard_df_long_doc[
-                            datastore.leaderboard_df_long_doc[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK
-                        ]
                         lb_df_reranker_ldoc = reset_rank(lb_df_reranker_ldoc)
                         reranking_models_reranker_ldoc = (
                             lb_df_reranker_ldoc[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()

     selected_domains = get_domain_dropdown(QABenchmarks[datastore.slug])
     selected_langs = get_language_dropdown(QABenchmarks[datastore.slug])
     selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
+    leaderboard_table = get_leaderboard_table(datastore.formatted_df_qa, datastore.types_qa)
     hidden_leaderboard_table = \
         get_leaderboard_table(datastore.raw_df_qa, datastore.types_qa, visible=False)
     return selected_domains, selected_langs, selected_rerankings, leaderboard_table, hidden_leaderboard_table
     selected_domains = get_domain_dropdown(LongDocBenchmarks[datastore.slug])
     selected_langs = get_language_dropdown(LongDocBenchmarks[datastore.slug])
     selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
+    leaderboard_table = get_leaderboard_table(datastore.formatted_df_ldoc, datastore.types_long_doc)
     hidden_leaderboard_table = \
         get_leaderboard_table(datastore.raw_df_long_doc, datastore.types_long_doc, visible=False)
     return selected_domains, selected_langs, selected_rerankings, leaderboard_table, hidden_leaderboard_table
                             with gr.Column():
                                 selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
                         #  shown_table
+                        lb_table = get_leaderboard_table(datastore.formatted_df_qa, datastore.types_qa)
                         # Dummy leaderboard for handling the case when the user uses backspace key
                         hidden_lb_table = get_leaderboard_table(datastore.raw_df_qa, datastore.types_qa, visible=False)
                             with gr.Column(scale=1):
                                 selected_noreranker = get_noreranking_dropdown()
+                        lb_df_retriever = datastore.formatted_df_qa[
+                            datastore.formatted_df_qa[COL_NAME_RERANKING_MODEL] == "NoReranker"
+                            ]
                         lb_df_retriever = reset_rank(lb_df_retriever)
                         lb_table_retriever = get_leaderboard_table(lb_df_retriever, datastore.types_qa)
                             queue=True,
                         )
                     with gr.TabItem("Reranking Only", id=12):
+                        lb_df_reranker = datastore.formatted_df_qa[
+                            datastore.formatted_df_qa[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK
+                            ]
                         lb_df_reranker = reset_rank(lb_df_reranker)
                         reranking_models_reranker = (
                             lb_df_reranker[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()
                                 selected_rerankings = get_reranking_dropdown(datastore.reranking_models)
                         lb_table_long_doc = get_leaderboard_table(
+                            datastore.formatted_df_ldoc, datastore.types_long_doc
                         )
                         # Dummy leaderboard for handling the case when the user uses backspace key
                                 search_bar_retriever = get_search_bar()
                             with gr.Column(scale=1):
                                 selected_noreranker = get_noreranking_dropdown()
+                        lb_df_retriever_long_doc = datastore.formatted_df_ldoc[
+                            datastore.formatted_df_ldoc[COL_NAME_RERANKING_MODEL] == "NoReranker"
+                            ]
                         lb_df_retriever_long_doc = reset_rank(lb_df_retriever_long_doc)
                         lb_table_retriever_long_doc = get_leaderboard_table(
                             lb_df_retriever_long_doc, datastore.types_long_doc
                             queue=True,
                         )
                     with gr.TabItem("Reranking Only", id=22):
+                        lb_df_reranker_ldoc = datastore.formatted_df_ldoc[
+                            datastore.formatted_df_ldoc[COL_NAME_RETRIEVAL_MODEL] == BM25_LINK
+                            ]
                         lb_df_reranker_ldoc = reset_rank(lb_df_reranker_ldoc)
                         reranking_models_reranker_ldoc = (
                             lb_df_reranker_ldoc[COL_NAME_RERANKING_MODEL].apply(remove_html).unique().tolist()

src/loaders.py CHANGED Viewed

@@ -70,23 +70,23 @@ def load_leaderboard_datastore(file_path, version) -> LeaderboardDataStore:
     lb_data_store.raw_df_qa = get_leaderboard_df(lb_data_store, task="qa", metric=DEFAULT_METRIC_QA)
     print(f"QA data loaded: {lb_data_store.raw_df_qa.shape}")
-    lb_data_store.leaderboard_df_qa = lb_data_store.raw_df_qa.copy()
     shown_columns_qa, types_qa = get_default_cols("qa", lb_data_store.slug, add_fix_cols=True)
     lb_data_store.types_qa = types_qa
-    lb_data_store.leaderboard_df_qa = lb_data_store.leaderboard_df_qa[
-        ~lb_data_store.leaderboard_df_qa[COL_NAME_IS_ANONYMOUS]
     ][shown_columns_qa]
-    lb_data_store.leaderboard_df_qa.drop([COL_NAME_REVISION, COL_NAME_TIMESTAMP], axis=1, inplace=True)
     lb_data_store.raw_df_long_doc = get_leaderboard_df(lb_data_store, task="long-doc", metric=DEFAULT_METRIC_LONG_DOC)
     print(f"Long-Doc data loaded: {len(lb_data_store.raw_df_long_doc)}")
-    lb_data_store.leaderboard_df_long_doc = lb_data_store.raw_df_long_doc.copy()
     shown_columns_long_doc, types_long_doc = get_default_cols("long-doc", lb_data_store.slug, add_fix_cols=True)
     lb_data_store.types_long_doc = types_long_doc
-    lb_data_store.leaderboard_df_long_doc = lb_data_store.leaderboard_df_long_doc[
-        ~lb_data_store.leaderboard_df_long_doc[COL_NAME_IS_ANONYMOUS]
     ][shown_columns_long_doc]
-    lb_data_store.leaderboard_df_long_doc.drop([COL_NAME_REVISION, COL_NAME_TIMESTAMP], axis=1, inplace=True)
     lb_data_store.reranking_models = sorted(
         list(frozenset([eval_result.reranking_model for eval_result in lb_data_store.raw_data]))

     lb_data_store.raw_df_qa = get_leaderboard_df(lb_data_store, task="qa", metric=DEFAULT_METRIC_QA)
     print(f"QA data loaded: {lb_data_store.raw_df_qa.shape}")
+    lb_data_store.formatted_df_qa = lb_data_store.raw_df_qa.copy()
     shown_columns_qa, types_qa = get_default_cols("qa", lb_data_store.slug, add_fix_cols=True)
     lb_data_store.types_qa = types_qa
+    lb_data_store.formatted_df_qa = lb_data_store.formatted_df_qa[
+        ~lb_data_store.formatted_df_qa[COL_NAME_IS_ANONYMOUS]
     ][shown_columns_qa]
+    lb_data_store.formatted_df_qa.drop([COL_NAME_REVISION, COL_NAME_TIMESTAMP], axis=1, inplace=True)
     lb_data_store.raw_df_long_doc = get_leaderboard_df(lb_data_store, task="long-doc", metric=DEFAULT_METRIC_LONG_DOC)
     print(f"Long-Doc data loaded: {len(lb_data_store.raw_df_long_doc)}")
+    lb_data_store.formatted_df_ldoc = lb_data_store.raw_df_long_doc.copy()
     shown_columns_long_doc, types_long_doc = get_default_cols("long-doc", lb_data_store.slug, add_fix_cols=True)
     lb_data_store.types_long_doc = types_long_doc
+    lb_data_store.formatted_df_ldoc = lb_data_store.formatted_df_ldoc[
+        ~lb_data_store.formatted_df_ldoc[COL_NAME_IS_ANONYMOUS]
     ][shown_columns_long_doc]
+    lb_data_store.formatted_df_ldoc.drop([COL_NAME_REVISION, COL_NAME_TIMESTAMP], axis=1, inplace=True)
     lb_data_store.reranking_models = sorted(
         list(frozenset([eval_result.reranking_model for eval_result in lb_data_store.raw_data]))

src/models.py CHANGED Viewed

@@ -143,8 +143,8 @@ class LeaderboardDataStore:
     raw_data: Optional[list]
     raw_df_qa: Optional[pd.DataFrame]
     raw_df_long_doc: Optional[pd.DataFrame]
-    leaderboard_df_qa: Optional[pd.DataFrame]
-    leaderboard_df_long_doc: Optional[pd.DataFrame]
     reranking_models: Optional[list]
     types_qa: Optional[list]
     types_long_doc: Optional[list]

     raw_data: Optional[list]
     raw_df_qa: Optional[pd.DataFrame]
     raw_df_long_doc: Optional[pd.DataFrame]
+    formatted_df_qa: Optional[pd.DataFrame]
+    formatted_df_ldoc: Optional[pd.DataFrame]
     reranking_models: Optional[list]
     types_qa: Optional[list]
     types_long_doc: Optional[list]