Spaces:

hitachi-nlp
/

FLD_metrics

Running

App Files Files Community

MorishT commited on Oct 3, 2023

Commit

adb6e72

1 Parent(s): 3587f61

[first commit]

Browse files

Files changed (4) hide show

FLD_metrics.py +58 -0
README.honoka.md +5 -0
README.md +1 -1
requirements.txt +1 -0

FLD_metrics.py ADDED Viewed

	@@ -0,0 +1,58 @@

+from typing import List, Dict, Any
+from collections import defaultdict
+import statistics
+import datasets
+import evaluate
+from FLD_task import build_metrics
+_DESCRIPTION = ""
+_KWARGS_DESCRIPTION = ""
+_CITATION = ""
+@evaluate.utils.file_utils.add_start_docstrings(_DESCRIPTION, _KWARGS_DESCRIPTION)
+class FLDMetrics(evaluate.Metric):
+    def __init__(self, *args, log_samples=False, **kwargs):
+        super().__init__(*args, **kwargs)
+        self._metric_funcs = {
+            'strct': build_metrics('strict'),
+            'extr_stps': build_metrics('allow_extra_steps'),
+        }
+        self.log_samples = log_samples
+    def _info(self):
+        return evaluate.MetricInfo(
+            description=_DESCRIPTION,
+            citation=_CITATION,
+            inputs_description=_KWARGS_DESCRIPTION,
+            features=datasets.Features(
+                {
+                    "predictions": datasets.Value("string"),
+                    "references": datasets.Sequence(datasets.Value("string")),
+                    "contexts": datasets.Value("string"),
+                }
+            ),
+            # reference_urls=["https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html"],
+        )
+    def _compute(self, predictions, references, contexts):
+        if contexts is None:
+            contexts = [None] * len(predictions)
+        metrics: Dict[str, List[Any]] = defaultdict(list)
+        for pred, golds, context in zip(predictions, references, contexts):
+            for metric_type, calc_metrics in self._metric_funcs.items():
+                _metrics = calc_metrics(
+                    golds,
+                    pred,
+                    context=context,
+                )
+                for metric_name, metric_val in _metrics.items():
+                    metrics[f"{metric_type}.{metric_name}"].append(metric_val)
+        results = {}
+        for metric_name, metric_vals in metrics.items():
+            results[f"{metric_name}"] = statistics.mean(metric_vals)
+        return results

README.honoka.md ADDED Viewed

	@@ -0,0 +1,5 @@

+# Develpments
+See the following:
+* [Creating and sharing a new evaluation](https://huggingface.co/docs/evaluate/creating_and_sharing)
+* [evaluate-metric/accuracy at main](https://huggingface.co/spaces/evaluate-metric/accuracy/tree/main)
+* [evaluate-metric/mase at main](https://huggingface.co/spaces/evaluate-metric/mase/blob/main/mase.py)

README.md CHANGED Viewed

@@ -7,4 +7,4 @@ sdk: static
 pinned: false
 ---
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

 pinned: false
 ---
+The metrics used in the [FLD project](https://github.com/hitachi-nlp/FLD).

requirements.txt ADDED Viewed

	@@ -0,0 +1 @@


1	+ FLD_task@git+https://github.com/hitachi-nlp/FLD-task.git@logitorch