Spaces:

evaluate-measurement
/

regard

Running

App Files Files Community

lvwerra HF staff commited on Sep 22, 2022

Commit

6381dc5

1 Parent(s): 51c4792

Update Space (evaluate main: e4a27243)

Browse files

Files changed (2) hide show

regard.py +19 -6
requirements.txt +1 -1

regard.py CHANGED Viewed

@@ -15,8 +15,10 @@
 """ Regard measurement. """
 from collections import defaultdict
 from operator import itemgetter
 from statistics import mean
 import datasets
 from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
@@ -115,9 +117,20 @@ def regard(group, regard_classifier):
     return group_regard, dict(group_scores)
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
 class Regard(evaluate.Measurement):
-    def _info(self):
         if self.config_name not in ["compare", "default"]:
             raise KeyError("You should supply a configuration name selected in " '["config", "default"]')
         return evaluate.MeasurementInfo(
@@ -125,6 +138,7 @@ class Regard(evaluate.Measurement):
             description=_DESCRIPTION,
             citation=_CITATION,
             inputs_description=_KWARGS_DESCRIPTION,
             features=datasets.Features(
                 {
                     "data": datasets.Value("string", id="sequence"),
@@ -150,7 +164,6 @@ class Regard(evaluate.Measurement):
         self,
         data,
         references=None,
-        aggregation=None,
     ):
         if self.config_name == "compare":
             pred_scores, pred_regard = regard(data, self.regard_classifier)
@@ -159,12 +172,12 @@ class Regard(evaluate.Measurement):
             pred_max = {k: max(v) for k, v in pred_regard.items()}
             ref_mean = {k: mean(v) for k, v in ref_regard.items()}
             ref_max = {k: max(v) for k, v in ref_regard.items()}
-            if aggregation == "maximum":
                 return {
                     "max_data_regard": pred_max,
                     "max_references_regard": ref_max,
                 }
-            elif aggregation == "average":
                 return {"average_data_regard": pred_mean, "average_references_regard": ref_mean}
             else:
                 return {"regard_difference": {key: pred_mean[key] - ref_mean.get(key, 0) for key in pred_mean}}
@@ -172,9 +185,9 @@ class Regard(evaluate.Measurement):
             pred_scores, pred_regard = regard(data, self.regard_classifier)
             pred_mean = {k: mean(v) for k, v in pred_regard.items()}
             pred_max = {k: max(v) for k, v in pred_regard.items()}
-            if aggregation == "maximum":
                 return {"max_regard": pred_max}
-            elif aggregation == "average":
                 return {"average_regard": pred_mean}
             else:
                 return {"regard": pred_scores}

 """ Regard measurement. """
 from collections import defaultdict
+from dataclasses import dataclass
 from operator import itemgetter
 from statistics import mean
+from typing import Optional
 import datasets
 from transformers import AutoModelForSequenceClassification, AutoTokenizer, pipeline
     return group_regard, dict(group_scores)
+@dataclass
+class RegardConfig(evaluate.info.Config):
+    name: str = "default"
+    aggregation: Optional[str] = None
 @evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
 class Regard(evaluate.Measurement):
+    CONFIG_CLASS = RegardConfig
+    ALLOWED_CONFIG_NAMES = ["default", "compare"]
+    def _info(self, config):
         if self.config_name not in ["compare", "default"]:
             raise KeyError("You should supply a configuration name selected in " '["config", "default"]')
         return evaluate.MeasurementInfo(
             description=_DESCRIPTION,
             citation=_CITATION,
             inputs_description=_KWARGS_DESCRIPTION,
+            config=config,
             features=datasets.Features(
                 {
                     "data": datasets.Value("string", id="sequence"),
         self,
         data,
         references=None,
     ):
         if self.config_name == "compare":
             pred_scores, pred_regard = regard(data, self.regard_classifier)
             pred_max = {k: max(v) for k, v in pred_regard.items()}
             ref_mean = {k: mean(v) for k, v in ref_regard.items()}
             ref_max = {k: max(v) for k, v in ref_regard.items()}
+            if self.config.aggregation == "maximum":
                 return {
                     "max_data_regard": pred_max,
                     "max_references_regard": ref_max,
                 }
+            elif self.config.aggregation == "average":
                 return {"average_data_regard": pred_mean, "average_references_regard": ref_mean}
             else:
                 return {"regard_difference": {key: pred_mean[key] - ref_mean.get(key, 0) for key in pred_mean}}
             pred_scores, pred_regard = regard(data, self.regard_classifier)
             pred_mean = {k: mean(v) for k, v in pred_regard.items()}
             pred_max = {k: max(v) for k, v in pred_regard.items()}
+            if self.config.aggregation == "maximum":
                 return {"max_regard": pred_max}
+            elif self.config.aggregation == "average":
                 return {"average_regard": pred_mean}
             else:
                 return {"regard": pred_scores}

requirements.txt CHANGED Viewed

	@@ -1,2 +1,2 @@
1	- git+https://github.com/huggingface/evaluate.git@~~80448674f5447a9682afe051db243c4a13bfe4ff~~
2	transformers


1	+ git+https://github.com/huggingface/evaluate.git@e4a2724377909fe2aeb4357e3971e5a569673b39
2	transformers