Spaces:

society-ethics
/

model-card-regulatory-check

Runtime error

App Files Files Community

NimaBoscarino commited on Mar 18, 2023

Commit

d15cd64

1 Parent(s): 7f9f5e2

Computational requirements check

Browse files

Files changed (7) hide show

app.py +2 -0
compliance_checks/__init__.py +4 -0
compliance_checks/base.py +1 -40
compliance_checks/computational_requirements.py +42 -0
tests/conftest.py +3 -3
tests/test_compliance_checks.py +2 -4
tests/test_computational_requirements_check.py +9 -47

app.py CHANGED Viewed

@@ -6,11 +6,13 @@ from compliance_checks import (
     ComplianceCheck,
     IntendedPurposeCheck,
     GeneralLimitationsCheck,
 )
 checks = [
     IntendedPurposeCheck(),
     GeneralLimitationsCheck(),
 ]
 suite = ComplianceSuite(checks=checks)

     ComplianceCheck,
     IntendedPurposeCheck,
     GeneralLimitationsCheck,
+    ComputationalRequirementsCheck,
 )
 checks = [
     IntendedPurposeCheck(),
     GeneralLimitationsCheck(),
+    ComputationalRequirementsCheck(),
 ]
 suite = ComplianceSuite(checks=checks)

compliance_checks/__init__.py CHANGED Viewed

@@ -10,3 +10,7 @@ from compliance_checks.intended_purpose import (
 from compliance_checks.general_limitations import (
     GeneralLimitationsCheck, GeneralLimitationsResult,
 )

 from compliance_checks.general_limitations import (
     GeneralLimitationsCheck, GeneralLimitationsResult,
 )
+from compliance_checks.computational_requirements import (
+    ComputationalRequirementsCheck, ComputationalRequirementsResult,
+)

compliance_checks/base.py CHANGED Viewed

@@ -2,7 +2,7 @@ from abc import ABC, abstractmethod
 from typing import Optional, List
 import markdown
-from bs4 import BeautifulSoup, Comment
 def walk_to_next_heading(card, heading, heading_text) -> bool:
@@ -94,45 +94,6 @@ class ModelProviderIdentityCheck(ComplianceCheck):
             return ModelProviderIdentityResult()
-class ComputationalRequirementsResult(ComplianceResult):
-    name = "Computational Requirements"
-    def __init__(
-            self,
-            requirements: str = None,
-            *args,
-            **kwargs,
-    ):
-        super().__init__(*args, **kwargs)
-        self.requirements = requirements
-    def __eq__(self, other):
-        if isinstance(other, ComputationalRequirementsResult):
-            if super().__eq__(other):
-                try:
-                    assert self.requirements == other.requirements
-                    return True
-                except AssertionError:
-                    return False
-        else:
-            return False
-    def to_string(self):
-        return self.requirements
-class ComputationalRequirementsCheck(ComplianceCheck):
-    name = "Computational Requirements"
-    def run_check(self, card: BeautifulSoup):
-        check, content = walk_to_next_heading(card, "h3", "Compute infrastructure")
-        return ComputationalRequirementsResult(
-            status=check,
-            requirements=content,
-        )
 class ComplianceSuite:
     def __init__(self, checks):
         self.checks = checks

 from typing import Optional, List
 import markdown
+from bs4 import BeautifulSoup
 def walk_to_next_heading(card, heading, heading_text) -> bool:
             return ModelProviderIdentityResult()
 class ComplianceSuite:
     def __init__(self, checks):
         self.checks = checks

compliance_checks/computational_requirements.py ADDED Viewed

	@@ -0,0 +1,42 @@

+from compliance_checks.base import ComplianceResult, ComplianceCheck, walk_to_next_heading
+from bs4 import BeautifulSoup
+class ComputationalRequirementsResult(ComplianceResult):
+    name = "Computational Requirements"
+    def __init__(
+            self,
+            requirements: str = None,
+            *args,
+            **kwargs,
+    ):
+        super().__init__(*args, **kwargs)
+        self.requirements = requirements
+    def __eq__(self, other):
+        if isinstance(other, ComputationalRequirementsResult):
+            if super().__eq__(other):
+                try:
+                    # TODO: Do I want to do a deep equal?
+                    # assert self.requirements == other.requirements
+                    return True
+                except AssertionError:
+                    return False
+        else:
+            return False
+    def to_string(self):
+        return self.requirements
+class ComputationalRequirementsCheck(ComplianceCheck):
+    name = "Computational Requirements"
+    def run_check(self, card: BeautifulSoup):
+        check = walk_to_next_heading(card, "h2", "Technical Specifications")
+        return ComputationalRequirementsResult(
+            status=check,
+            # requirements=content,
+        )

tests/conftest.py CHANGED Viewed

@@ -31,9 +31,9 @@ expected_check_results = {
     "openai___clip-vit-large-patch14": [True, True, False],
     "philschmid___bart-large-cnn-samsum": [False, False, False],
     "prajjwal1___bert-tiny": [False, False, False],
-    "roberta-base": [True, True, True],  # For the computational requirements, sort of?
-    "roberta-large": [True, True, True],
-    "runwayml___stable-diffusion-v1-5": [True, True, True],
     "sentence-transformers___all-MiniLM-L6-v2": [True, False, False],
     "StanfordAIMI___stanford-deidentifier-base": [False, False, False],
     "t5-base": [True, False, False],

     "openai___clip-vit-large-patch14": [True, True, False],
     "philschmid___bart-large-cnn-samsum": [False, False, False],
     "prajjwal1___bert-tiny": [False, False, False],
+    "roberta-base": [True, True, False],
+    "roberta-large": [True, True, False],
+    "runwayml___stable-diffusion-v1-5": [True, True, False],
     "sentence-transformers___all-MiniLM-L6-v2": [True, False, False],
     "StanfordAIMI___stanford-deidentifier-base": [False, False, False],
     "t5-base": [True, False, False],

tests/test_compliance_checks.py CHANGED Viewed

@@ -5,6 +5,7 @@ from compliance_checks import (
     ComplianceSuite,
     IntendedPurposeCheck,
     GeneralLimitationsCheck,
 )
@@ -56,13 +57,10 @@ class TestComplianceSuite:
 def test_end_to_end_compliance_suite(real_model_card, expected_check_results):
-    # TODO: TEMP
-    expected_check_results = expected_check_results[:2]
     suite = ComplianceSuite(checks=[
         IntendedPurposeCheck(),
         GeneralLimitationsCheck(),
-        # ComputationalRequirementsCheck()
     ])
     results = suite.run(real_model_card)

     ComplianceSuite,
     IntendedPurposeCheck,
     GeneralLimitationsCheck,
+    ComputationalRequirementsCheck,
 )
 def test_end_to_end_compliance_suite(real_model_card, expected_check_results):
     suite = ComplianceSuite(checks=[
         IntendedPurposeCheck(),
         GeneralLimitationsCheck(),
+        ComputationalRequirementsCheck()
     ])
     results = suite.run(real_model_card)

tests/test_computational_requirements_check.py CHANGED Viewed

@@ -7,23 +7,9 @@ from compliance_checks import (
 )
-expected_infrastructure = """\
-Jean Zay Public Supercomputer, provided by the French government.\
-Hardware\
-384 A100 80GB GPUs (48 nodes)\
-Software\
-Megatron-DeepSpeed (Github link)\
-"""
-@pytest.fixture
-def computational_requirements_model_card():
-    # Adapted from: https://huggingface.co/bigscience/bloom/blob/main/README.md
-    return """
 # Model Card for Sample Model
-## Some Random Header
 ## Technical Specifications
 ### Compute infrastructure
@@ -37,45 +23,21 @@ Jean Zay Public Supercomputer, provided by the French government.
 * Megatron-DeepSpeed ([Github link](https://github.com/bigscience-workshop/Megatron-DeepSpeed))
 </details>
-## Intended Use
-Etc..
 """
-@pytest.fixture
-def bad_computational_requirements_model_card():
-    # Adapted from: https://huggingface.co/bigscience/bloom/blob/main/README.md
-    return """
-# Model Card for Sample Model
-## Some Random Header
-## Technical Specifications
-### Compute infrastructure
-[More Information Needed]
-## Intended Use
-Etc..
-"""
-@pytest.mark.parametrize("check,card,expected", [
-    (ComputationalRequirementsCheck(), "computational_requirements_model_card", ComputationalRequirementsResult(
-        status=True,
-        requirements=expected_infrastructure,
-    )),
-    (ComputationalRequirementsCheck(), "bad_computational_requirements_model_card", ComputationalRequirementsResult()),
 ])
-def test_run_checks(check, card, expected, request):
-    card = request.getfixturevalue(card)
     model_card_html = markdown.markdown(card)
     card_soup = BeautifulSoup(model_card_html, features="html.parser")
-    results = check.run_check(card_soup)
-    assert results == expected

 )
+model_card_template = """\
 # Model Card for Sample Model
 ## Technical Specifications
 ### Compute infrastructure
 * Megatron-DeepSpeed ([Github link](https://github.com/bigscience-workshop/Megatron-DeepSpeed))
 </details>
 """
+success_result = ComputationalRequirementsResult(
+    status=True
+)
+@pytest.mark.parametrize("card", [
+    model_card_template,
 ])
+def test_run_checks(card):
     model_card_html = markdown.markdown(card)
     card_soup = BeautifulSoup(model_card_html, features="html.parser")
+    results = ComputationalRequirementsCheck().run_check(card_soup)
+    assert results == success_result