Spaces:

colab-potsdam
/

clem-leaderboard

Running

App Files Files Community

sherzod-hakimov commited on Sep 20

Commit

fa0181f

•

1 Parent(s): 295441e

adapted to the new changes in the benchmark list

Browse files

Files changed (4) hide show

app.py +1 -1
src/leaderboard_utils.py +40 -33
src/plot_utils.py +5 -10
src/version_utils.py +3 -11

app.py CHANGED Viewed

@@ -128,7 +128,7 @@ with hf_app:
             # Show information about the clemscore and last updated date below the table
             gr.HTML(CLEMSCORE_TEXT)
-            gr.HTML(f"Last updated - {github_data['date']}")
             # Add a dummy leaderboard to handle search queries in leaderboard_table
             # This will show a temporary leaderboard based on the searched value

             # Show information about the clemscore and last updated date below the table
             gr.HTML(CLEMSCORE_TEXT)
+            gr.HTML(f"Last updated - {github_data['mm_date']}")
             # Add a dummy leaderboard to handle search queries in leaderboard_table
             # This will show a temporary leaderboard based on the searched value

src/leaderboard_utils.py CHANGED Viewed

@@ -29,20 +29,11 @@ def get_github_data():
     json_data = response.json()
     versions = json_data['versions']
-    # Sort version names - latest first
     version_names = sorted(
         [ver['version'] for ver in versions],
-        key=lambda v: float(v[1:]),
         reverse=True
-    )
-    print(f"Found {len(version_names)} versions from get_github_data(): {version_names}.")
-    # Get Last updated date of the latest version
-    latest_version = version_names[0]
-    latest_date = next(
-        ver['date'] for ver in versions if ver['version'] == latest_version
-    )
-    formatted_date = datetime.strptime(latest_date, "%Y/%m/%d").strftime("%d %b %Y")
     # Get Leaderboard data - for text-only + multimodal
     github_data = {}
@@ -51,34 +42,49 @@ def get_github_data():
     text_dfs = []
     mm_dfs = []
     for version in version_names:
         # Collect CSV data in descending order of clembench-runs versions
         # Collect Text-only data
-        text_url = f"{base_repo}{version}/results.csv"
-        csv_response = requests.get(text_url)
-        if csv_response.status_code == 200:
-            df = pd.read_csv(StringIO(csv_response.text))
-            df = process_df(df)
-            df = df.sort_values(by=df.columns[1], ascending=False)  # Sort by clemscore column
-            text_dfs.append(df)
-        else:
-            print(f"Failed to read Text-only leaderboard CSV file for version: {version}. Status Code: {csv_response.status_code}")
-        # Collect Multimodal data
-        if float(version[1:]) >= 1.6:
-            mm_url = f"{base_repo}{version}_multimodal/results.csv"
-            mm_response = requests.get(mm_url)
-            if mm_response.status_code == 200:
-                df = pd.read_csv(StringIO(mm_response.text))
                 df = process_df(df)
-                df = df.sort_values(by=df.columns[1], ascending=False) # Sort by clemscore column
-                mm_dfs.append(df)
-        else:
-            print(f"Failed to read multimodal leaderboard CSV file for version: {version}: Status Code: {csv_response.status_code}. Please ignore this message if multimodal results are not available for this version")
     github_data["text"] = text_dfs
     github_data["multimodal"] = mm_dfs
-    github_data["date"] = formatted_date
     return github_data
@@ -137,3 +143,4 @@ def query_search(df: pd.DataFrame, query: str) -> pd.DataFrame:
     filtered_df = df[df['Model'].str.lower().str.contains('|'.join(queries))]
     return filtered_df

     json_data = response.json()
     versions = json_data['versions']
     version_names = sorted(
         [ver['version'] for ver in versions],
+        key=lambda v: list(map(int, v[1:].split('_')[0].split('.'))),
         reverse=True
+    )
     # Get Leaderboard data - for text-only + multimodal
     github_data = {}
     text_dfs = []
     mm_dfs = []
+    text_flag = True
+    text_date = ""
+    mm_flag = True
+    mm_date = ""
     for version in version_names:
         # Collect CSV data in descending order of clembench-runs versions
         # Collect Text-only data
+        if len(version.split('_')) == 1:
+            text_url = f"{base_repo}{version}/results.csv"
+            csv_response = requests.get(text_url)
+            if csv_response.status_code == 200:
+                df = pd.read_csv(StringIO(csv_response.text))
                 df = process_df(df)
+                df = df.sort_values(by=df.columns[1], ascending=False)  # Sort by clemscore column
+                text_dfs.append(df)
+                if text_flag:
+                    text_flag = False
+                    text_date = next(ver['date'] for ver in versions if ver['version'] == version)
+                    text_date = datetime.strptime(text_date, "%Y-%m-%d").strftime("%d %b %Y")
+            else:
+                print(f"Failed to read Text-only leaderboard CSV file for version: {version}. Status Code: {csv_response.status_code}")
+        # Check if version ends with 'multimodal' before constructing the URL
+        mm_suffix = "_multimodal" if not version.endswith('multimodal') else ""
+        mm_url = f"{base_repo}{version}{mm_suffix}/results.csv"
+        mm_response = requests.get(mm_url)
+        if mm_response.status_code == 200:
+            df = pd.read_csv(StringIO(mm_response.text))
+            df = process_df(df)
+            df = df.sort_values(by=df.columns[1], ascending=False) # Sort by clemscore column
+            mm_dfs.append(df)
+            if mm_flag:
+                mm_flag = False
+                mm_date = next(ver['date'] for ver in versions if ver['version'] == version)
+                mm_date = datetime.strptime(mm_date, "%Y-%m-%d").strftime("%d %b %Y")
     github_data["text"] = text_dfs
     github_data["multimodal"] = mm_dfs
+    github_data["date"] = text_date
+    github_data["mm_date"] = mm_date
     return github_data
     filtered_df = df[df['Model'].str.lower().str.contains('|'.join(queries))]
     return filtered_df

src/plot_utils.py CHANGED Viewed

@@ -127,27 +127,22 @@ def split_models(model_list: list):
     """
     Split the models into open source and commercial
     """
     open_models = []
     commercial_models = []
-    open_backends = {"huggingface_local", "huggingface_multimodal", "openai_compatible"}  # Define backends considered as open
     # Load model registry data from main repo
     model_registry_url = "https://raw.githubusercontent.com/clp-research/clembench/main/backends/model_registry.json"
     response = requests.get(model_registry_url)
     if response.status_code == 200:
         json_data = json.loads(response.text)
-        # Classify as Open or Commercial based on the defined backend in the model registry
-        backend_mapping = {}
         for model_name in model_list:
-            model_prefix = model_name.split('-')[0]  # Get the prefix part of the model name
             for entry in json_data:
-                if entry["model_name"].startswith(model_prefix):
-                    backend = entry["backend"]
-                    # Classify based on backend
-                    if backend in open_backends:
                         open_models.append(model_name)
                     else:
                         commercial_models.append(model_name)

     """
     Split the models into open source and commercial
     """
     open_models = []
     commercial_models = []
     # Load model registry data from main repo
     model_registry_url = "https://raw.githubusercontent.com/clp-research/clembench/main/backends/model_registry.json"
     response = requests.get(model_registry_url)
     if response.status_code == 200:
         json_data = json.loads(response.text)
         for model_name in model_list:
             for entry in json_data:
+                if entry["model_name"] == model_name:
+                    open_model = entry["open_weight"]
+                    if open_model:
                         open_models.append(model_name)
                     else:
                         commercial_models.append(model_name)

src/version_utils.py CHANGED Viewed

@@ -31,20 +31,18 @@ def get_versions_data():
     json_data = response.json()
     versions = json_data['versions']
-    # Sort version names - latest first
     version_names = sorted(
         [ver['version'] for ver in versions],
-        key=lambda v: float(v[1:]),
         reverse=True
-    )
-    print(f"Found {len(version_names)} versions from get_versions_data(): {version_names}.")
     # Get Last updated date of the latest version
     latest_version = version_names[0]
     latest_date = next(
         ver['date'] for ver in versions if ver['version'] == latest_version
     )
-    formatted_date = datetime.strptime(latest_date, "%Y/%m/%d").strftime("%d %b %Y")
     # Get Versions data
     versions_data = {"latest": latest_version, "date": formatted_date}
@@ -64,8 +62,6 @@ def get_versions_data():
             df = process_df(df)
             df = df.sort_values(by=df.columns[1], ascending=False)  # Sort by clemscore column
             versions_data[version] = df
-        else:
-            print(f"Failed to read Text-only leaderboard CSV file for version: {version}. Status Code: {response.status_code}")
         # Multimodal Data
         mm_response = requests.get(mm_url)
@@ -74,8 +70,6 @@ def get_versions_data():
             mm_df = process_df(mm_df)
             mm_df = mm_df.sort_values(by=mm_df.columns[1], ascending=False)  # Sort by clemscore column
             versions_data[version+"_multimodal"] = mm_df
-        else:
-            print(f"Failed to read multimodal leaderboard CSV file for version: {version}: Status Code: {mm_response.status_code}. Please ignore this message if multimodal results are not available for this version")
         # Multimodal Data
         q_response = requests.get(quant_url)
@@ -84,8 +78,6 @@ def get_versions_data():
             q_df = process_df(q_df)
             q_df = q_df.sort_values(by=q_df.columns[1], ascending=False)  # Sort by clemscore column
             versions_data[version + "_quantized"] = q_df
-        else:
-            print(f"Failed to read quantized leaderboard CSV file for version: {version}: Status Code: {mm_response.status_code}. Please ignore this message if quantized results are not available for this version")
     return versions_data

     json_data = response.json()
     versions = json_data['versions']
     version_names = sorted(
         [ver['version'] for ver in versions],
+        key=lambda v: list(map(int, v[1:].split('_')[0].split('.'))),
         reverse=True
+    )
     # Get Last updated date of the latest version
     latest_version = version_names[0]
     latest_date = next(
         ver['date'] for ver in versions if ver['version'] == latest_version
     )
+    formatted_date = datetime.strptime(latest_date, "%Y-%m-%d").strftime("%d %b %Y")
     # Get Versions data
     versions_data = {"latest": latest_version, "date": formatted_date}
             df = process_df(df)
             df = df.sort_values(by=df.columns[1], ascending=False)  # Sort by clemscore column
             versions_data[version] = df
         # Multimodal Data
         mm_response = requests.get(mm_url)
             mm_df = process_df(mm_df)
             mm_df = mm_df.sort_values(by=mm_df.columns[1], ascending=False)  # Sort by clemscore column
             versions_data[version+"_multimodal"] = mm_df
         # Multimodal Data
         q_response = requests.get(quant_url)
             q_df = process_df(q_df)
             q_df = q_df.sort_values(by=q_df.columns[1], ascending=False)  # Sort by clemscore column
             versions_data[version + "_quantized"] = q_df
     return versions_data