Spaces:

optimum
/

llm-perf-leaderboard

Running

App Files Files Community

BenchmarkBot commited on Jul 27, 2023

Commit

5490c7c

1 Parent(s): a894537

sort by tradeoff but don't show it

Browse files

Files changed (1) hide show

app.py +16 -7

app.py CHANGED Viewed

@@ -59,7 +59,7 @@ ALL_COLUMNS_DATATYPES = [
     "number",
     "number",
 ]
-SORTING_COLUMN = ["Score (%) ⬆️"]
 llm_perf_dataset_repo = load_dataset_repo(LLM_PERF_DATASET_REPO, OPTIMUM_TOKEN)
@@ -73,10 +73,10 @@ def get_benchmark_df(benchmark="1xA100-80GB"):
     scores_df = pd.read_csv(
         f"./llm-perf-dataset/reports/Grouped-Open-LLM-Leaderboard.csv"
     )
-    bench_df = bench_df.merge(scores_df, left_on="model", right_on="best_scored_model")
     # add optimizations
-    bench_df["optimizations"] = bench_df[
         ["backend.bettertransformer", "backend.load_in_8bit", "backend.load_in_4bit"]
     ].apply(
         lambda x: ", ".join(
@@ -94,16 +94,23 @@ def get_benchmark_df(benchmark="1xA100-80GB"):
         axis=1,
     )
-    return bench_df
 def get_benchmark_table(bench_df):
     # filter
     bench_df = bench_df[list(ALL_COLUMNS_MAPPING.keys())]
     # rename
     bench_df.rename(columns=ALL_COLUMNS_MAPPING, inplace=True)
-    # sort
-    bench_df.sort_values(by=SORTING_COLUMN, ascending=True, inplace=True)
     # transform
     bench_df["Model Type 🤗"] = bench_df["Model Type 🤗"].apply(process_model_type)
     bench_df["Weight Class 🏋️"] = bench_df["Weight Class 🏋️"].apply(
@@ -223,7 +230,9 @@ with demo:
     # leaderboard tabs
     with gr.Tabs(elem_classes="A100-tabs") as A100_tabs:
-        with gr.TabItem("🖥️ A100-80GB Leaderboard Table 🏅", id=0):
             gr.HTML(A100_TEXT)
             # Original leaderboard table

     "number",
     "number",
 ]
+SORTING_COLUMN = ["tradeoff"]
 llm_perf_dataset_repo = load_dataset_repo(LLM_PERF_DATASET_REPO, OPTIMUM_TOKEN)
     scores_df = pd.read_csv(
         f"./llm-perf-dataset/reports/Grouped-Open-LLM-Leaderboard.csv"
     )
+    merged_df = bench_df.merge(scores_df, left_on="model", right_on="best_scored_model")
     # add optimizations
+    merged_df["optimizations"] = merged_df[
         ["backend.bettertransformer", "backend.load_in_8bit", "backend.load_in_4bit"]
     ].apply(
         lambda x: ", ".join(
         axis=1,
     )
+    # create composite score
+    score_distance = 100 - merged_df["best_score"]
+    # normalize latency between 0 and 100
+    latency_distance = merged_df["generate.latency(s)"]
+    merged_df["tradeoff"] = (score_distance**2 + latency_distance**2) ** 0.5
+    merged_df["tradeoff"] = merged_df["tradeoff"].round(2)
+    return merged_df
 def get_benchmark_table(bench_df):
+    # sort
+    bench_df.sort_values(by=SORTING_COLUMN, ascending=True, inplace=True)
     # filter
     bench_df = bench_df[list(ALL_COLUMNS_MAPPING.keys())]
     # rename
     bench_df.rename(columns=ALL_COLUMNS_MAPPING, inplace=True)
     # transform
     bench_df["Model Type 🤗"] = bench_df["Model Type 🤗"].apply(process_model_type)
     bench_df["Weight Class 🏋️"] = bench_df["Weight Class 🏋️"].apply(
     # leaderboard tabs
     with gr.Tabs(elem_classes="A100-tabs") as A100_tabs:
+        with gr.TabItem(
+            "🖥️ A100-80GB Leaderboar  Table �🏅🏆 🏅�e🏅e🏅 🏆🏅�🏅🏆 🏅�e🏅e🏅 🏆", id=0
+        ):
             gr.HTML(A100_TEXT)
             # Original leaderboard table