Spaces:

CoreyMorris
/

MMLU-by-task-Leaderboard

Runtime error

Corey Morris commited on Aug 19, 2023

Commit

e79bcf3

1 Parent(s): d506f10

Fixed type error

Files changed (2) hide show

app.py CHANGED Viewed

@@ -105,7 +105,7 @@ def create_line_chart(df, model_names, metrics):
     fig.update_layout(showlegend=True)
     return fig
-def find_top_differences_table(df, target_model, closest_models, num_differences=10, exclude_columns=['Parameters']):
     # Calculate the absolute differences for each task between the target model and the closest models
     new_df = df.drop(columns=exclude_columns)
     differences = new_df.loc[closest_models].sub(new_df.loc[target_model]).abs()

     fig.update_layout(showlegend=True)
     return fig
+def find_top_differences_table(df, target_model, closest_models, num_differences=10, exclude_columns=['Parameters', 'organization']):
     # Calculate the absolute differences for each task between the target model and the closest models
     new_df = df.drop(columns=exclude_columns)
     differences = new_df.loc[closest_models].sub(new_df.loc[target_model]).abs()

result_data_processor.py CHANGED Viewed

@@ -89,6 +89,7 @@ class ResultDataProcessor:
     def process_data(self):
         dataframes = []
         for filename in self._find_files(self.directory, self.pattern):
             raw_data = self._read_and_transform_data(filename)
             split_path = filename.split('/')
@@ -99,13 +100,15 @@ class ResultDataProcessor:
             mc2 = self._extract_mc2(raw_data, model_name)
             cleaned_data = pd.concat([cleaned_data, mc1])
             cleaned_data = pd.concat([cleaned_data, mc2])
-            # add organization name to the dataframe as a new row
-            cleaned_data.loc['organization'] = organization_name
             dataframes.append(cleaned_data)
         data = pd.concat(dataframes, axis=1).transpose()
         # Add Model Name and rearrange columns
         data['Model Name'] = data.index
         cols = data.columns.tolist()
@@ -137,8 +140,6 @@ class ResultDataProcessor:
         # remove extreme outliers from column harness|truthfulqa:mc1
         data = self._remove_mc1_outliers(data)
-        data = data.drop(columns=['organization'])
         return data
     def rank_data(self):

     def process_data(self):
         dataframes = []
+        organization_names = []
         for filename in self._find_files(self.directory, self.pattern):
             raw_data = self._read_and_transform_data(filename)
             split_path = filename.split('/')
             mc2 = self._extract_mc2(raw_data, model_name)
             cleaned_data = pd.concat([cleaned_data, mc1])
             cleaned_data = pd.concat([cleaned_data, mc2])
+            organization_names.append(organization_name)
             dataframes.append(cleaned_data)
         data = pd.concat(dataframes, axis=1).transpose()
+        # Add organization column
+        data['organization'] = organization_names
         # Add Model Name and rearrange columns
         data['Model Name'] = data.index
         cols = data.columns.tolist()
         # remove extreme outliers from column harness|truthfulqa:mc1
         data = self._remove_mc1_outliers(data)
         return data
     def rank_data(self):