Spaces:

unitxt
/

metric

Running

App Files Files Community

Elron commited on Nov 26, 2024

Commit

9245edf

verified ·

1 Parent(s): d443ad5

Upload folder using huggingface_hub

Browse files

Files changed (6) hide show

inference.py +72 -31
metrics.py +54 -0
operators.py +1 -1
parsing_utils.py +1 -1
standard.py +4 -0
version.py +1 -1

inference.py CHANGED Viewed

@@ -19,6 +19,7 @@ from typing import (
     Optional,
     Sequence,
     Tuple,
     Union,
 )
@@ -1407,6 +1408,11 @@ class IbmGenAiInferenceEngine(
         return dataset
 class OpenAiInferenceEngineParamsMixin(Artifact):
     frequency_penalty: Optional[float] = None
     presence_penalty: Optional[float] = None
@@ -1453,27 +1459,40 @@ class OpenAiInferenceEngine(
     }
     data_classification_policy = ["public"]
     parameters: Optional[OpenAiInferenceEngineParams] = None
-    def get_engine_id(self):
         return get_model_and_label_id(self.model_name, self.label)
-    @classmethod
-    def get_api_param(cls, inference_engine: str, api_param_env_var_name: str):
-        api_key = os.environ.get(api_param_env_var_name)
-        assert api_key is not None, (
-            f"Error while trying to run {inference_engine}."
-            f" Please set the environment param '{api_param_env_var_name}'."
         )
-        return api_key
     def create_client(self):
         from openai import OpenAI
-        api_key = self.get_api_param(
-            inference_engine="OpenAiInferenceEngine",
-            api_param_env_var_name="OPENAI_API_KEY",
         )
-        return OpenAI(api_key=api_key)
     def prepare_engine(self):
         self.client = self.create_client()
@@ -1553,6 +1572,32 @@ class OpenAiInferenceEngine(
         return predict_result
 class TogetherAiInferenceEngineParamsMixin(Artifact):
     max_tokens: Optional[int] = None
     stop: Optional[List[str]] = None
@@ -1652,23 +1697,6 @@ class TogetherAiInferenceEngine(
         return outputs
-class VLLMRemoteInferenceEngine(OpenAiInferenceEngine):
-    label: str = "vllm"
-    def create_client(self):
-        from openai import OpenAI
-        api_key = self.get_api_param(
-            inference_engine="VLLMRemoteInferenceEngine",
-            api_param_env_var_name="VLLM_API_KEY",
-        )
-        api_url = self.get_api_param(
-            inference_engine="VLLMRemoteInferenceEngine",
-            api_param_env_var_name="VLLM_API_URL",
-        )
-        return OpenAI(api_key=api_key, base_url=api_url)
 @deprecation(
     version="2.0.0",
     msg=" You can specify inference parameters directly when initializing an inference engine.",
@@ -2667,7 +2695,7 @@ class LiteLLMInferenceEngine(
 _supported_apis = Literal[
-    "watsonx", "together-ai", "open-ai", "aws", "ollama", "bam", "watsonx-sdk"
 ]
@@ -2698,6 +2726,8 @@ class CrossProviderInferenceEngine(InferenceEngine, StandardAPIParamsMixin):
             "granite-3-8b-instruct": "watsonx/ibm/granite-3-8b-instruct",
             "flan-t5-xxl": "watsonx/google/flan-t5-xxl",
             "llama-3-2-1b-instruct": "watsonx/meta-llama/llama-3-2-1b-instruct",
         },
         "watsonx-sdk": {
             "llama-3-8b-instruct": "meta-llama/llama-3-8b-instruct",
@@ -2723,6 +2753,15 @@ class CrossProviderInferenceEngine(InferenceEngine, StandardAPIParamsMixin):
             "llama-3-2-1b-instruct": "meta-llama/llama-3-2-1b-instruct",
             "flan-t5-xxl": "google/flan-t5-xxl",
         },
     }
     _provider_to_base_class = {
@@ -2733,11 +2772,13 @@ class CrossProviderInferenceEngine(InferenceEngine, StandardAPIParamsMixin):
         "ollama": OllamaInferenceEngine,
         "bam": IbmGenAiInferenceEngine,
         "watsonx-sdk": WMLInferenceEngine,
     }
     _provider_param_renaming = {
         "bam": {"max_tokens": "max_new_tokens", "model": "model_name"},
         "watsonx-sdk": {"max_tokens": "max_new_tokens", "model": "model_name"},
     }
     def get_provider_name(self):
@@ -2747,7 +2788,7 @@ class CrossProviderInferenceEngine(InferenceEngine, StandardAPIParamsMixin):
         provider = self.get_provider_name()
         if provider not in self._provider_to_base_class:
             raise UnitxtError(
-                f"{provider} a known API. Supported apis: {','.join(self.provider_model_map.keys())}"
             )
         if self.model not in self.provider_model_map[provider]:
             raise UnitxtError(

     Optional,
     Sequence,
     Tuple,
+    TypedDict,
     Union,
 )
         return dataset
+class CredentialsOpenAi(TypedDict, total=False):
+    api_key: str
+    api_url: str
 class OpenAiInferenceEngineParamsMixin(Artifact):
     frequency_penalty: Optional[float] = None
     presence_penalty: Optional[float] = None
     }
     data_classification_policy = ["public"]
     parameters: Optional[OpenAiInferenceEngineParams] = None
+    base_url: Optional[str] = None
+    default_headers: Dict[str, str] = {}
+    credentials: CredentialsOpenAi = {}
+    def get_engine_id(self) -> str:
         return get_model_and_label_id(self.model_name, self.label)
+    def _prepare_credentials(self) -> CredentialsOpenAi:
+        api_key = self.credentials.get(
+            "api_key", os.environ.get(f"{self.label.upper()}_API_KEY", None)
         )
+        assert api_key, (
+            f"Error while trying to run {self.label}. "
+            f"Please set the env variable: '{self.label.upper()}_API_KEY'"
+        )
+        api_url = self.credentials.get(
+            "api_url", os.environ.get(f"{self.label.upper()}_API_URL", None)
+        )
+        return {"api_key": api_key, "api_url": api_url}
+    def get_default_headers(self) -> Dict[str, str]:
+        return self.default_headers
     def create_client(self):
         from openai import OpenAI
+        self.credentials = self._prepare_credentials()
+        return OpenAI(
+            api_key=self.credentials["api_key"],
+            base_url=self.base_url or self.credentials["api_url"],
+            default_headers=self.get_default_headers(),
         )
     def prepare_engine(self):
         self.client = self.create_client()
         return predict_result
+class VLLMRemoteInferenceEngine(OpenAiInferenceEngine):
+    label: str = "vllm"
+class RITSInferenceEngine(OpenAiInferenceEngine):
+    label: str = "rits"
+    def get_default_headers(self):
+        return {"RITS_API_KEY": self.credentials["api_key"]}
+    def prepare_engine(self):
+        base_url_template = "https://inference-3scale-apicast-production.apps.rits.fmaas.res.ibm.com/{}/v1"
+        self.base_url = base_url_template.format(self._get_model_name_for_endpoint())
+        logger.info(f"Created RITS inference engine with endpoint: {self.base_url}")
+        super().prepare_engine()
+    def _get_model_name_for_endpoint(self):
+        return (
+            self.model_name.split("/")[-1]
+            .lower()
+            .replace("v0.1", "v01")
+            .replace("vision-", "")
+            .replace(".", "-")
+        )
 class TogetherAiInferenceEngineParamsMixin(Artifact):
     max_tokens: Optional[int] = None
     stop: Optional[List[str]] = None
         return outputs
 @deprecation(
     version="2.0.0",
     msg=" You can specify inference parameters directly when initializing an inference engine.",
 _supported_apis = Literal[
+    "watsonx", "together-ai", "open-ai", "aws", "ollama", "bam", "watsonx-sdk", "rits"
 ]
             "granite-3-8b-instruct": "watsonx/ibm/granite-3-8b-instruct",
             "flan-t5-xxl": "watsonx/google/flan-t5-xxl",
             "llama-3-2-1b-instruct": "watsonx/meta-llama/llama-3-2-1b-instruct",
+            "llama-3-2-11b-vision-instruct": "watsonx/meta-llama/llama-3-2-11b-vision-instruct",
+            "llama-3-2-90b-vision-instruct": "watsonx/meta-llama/llama-3-2-90b-vision-instruct",
         },
         "watsonx-sdk": {
             "llama-3-8b-instruct": "meta-llama/llama-3-8b-instruct",
             "llama-3-2-1b-instruct": "meta-llama/llama-3-2-1b-instruct",
             "flan-t5-xxl": "google/flan-t5-xxl",
         },
+        "rits": {
+            "granite-3-8b-instruct": "ibm-granite/granite-3.0-8b-instruct",
+            "llama-3-1-8b-instruct": "meta-llama/llama-3-1-8b-instruct",
+            "llama-3-1-70b-instruct": "meta-llama/llama-3-1-70b-instruct",
+            "llama-3-2-11b-vision-instruct": "meta-llama/Llama-3.2-11B-Vision-Instruct",
+            "llama-3-2-90b-vision-instruct": "meta-llama/Llama-3.2-90B-Vision-Instruct",
+            "mistral-large-instruct": "mistralai/mistral-large-instruct-2407",
+            "mixtral-8x7b-instruct": "mistralai/mixtral-8x7B-instruct-v0.1",
+        },
     }
     _provider_to_base_class = {
         "ollama": OllamaInferenceEngine,
         "bam": IbmGenAiInferenceEngine,
         "watsonx-sdk": WMLInferenceEngine,
+        "rits": RITSInferenceEngine,
     }
     _provider_param_renaming = {
         "bam": {"max_tokens": "max_new_tokens", "model": "model_name"},
         "watsonx-sdk": {"max_tokens": "max_new_tokens", "model": "model_name"},
+        "rits": {"model": "model_name"},
     }
     def get_provider_name(self):
         provider = self.get_provider_name()
         if provider not in self._provider_to_base_class:
             raise UnitxtError(
+                f"{provider} is not a configured API for CrossProviderInferenceEngine. Supported apis: {','.join(self.provider_model_map.keys())}"
             )
         if self.model not in self.provider_model_map[provider]:
             raise UnitxtError(

metrics.py CHANGED Viewed

@@ -3536,6 +3536,60 @@ class Perplexity(BulkInstanceMetric):
             return shifted_logits, shifted_labels
 class Squad(HuggingfaceMetric):
     hf_metric_name = "squad"
     main_score = "f1"

             return shifted_logits, shifted_labels
+class FaithfulnessHHEM(BulkInstanceMetric):
+    reduction_map = {"mean": ["score"]}
+    main_score = "score"
+    batch_size: int = 2
+    model_name: str = "vectara/hallucination_evaluation_model"
+    prediction_type = str
+    single_reference_per_prediction = True
+    max_context_words = 4096
+    _requirements_list: List[str] = ["transformers", "torch"]
+    def prepare(self):
+        super().prepare()
+        import torch
+        if torch.cuda.is_available():
+            device = "cuda"
+        elif torch.backends.mps.is_available():
+            device = "mps"
+        else:
+            device = "cpu"
+        from transformers import AutoModelForSequenceClassification
+        self.model = AutoModelForSequenceClassification.from_pretrained(
+            self.model_name, trust_remote_code=True
+        ).to(device)
+    def compute(
+        self,
+        references: List[List[Any]],
+        predictions: List[Any],
+        task_data: List[Dict],
+    ) -> List[Dict[str, Any]]:
+        from tqdm import tqdm
+        # treat the references as the contexts and the predictions as answers
+        # concat references
+        contexts = ["\n".join(refs) for refs in references]
+        contexts = [" ".join(c.split(" ")[: self.max_context_words]) for c in contexts]
+        answers = predictions
+        # prepare for computation
+        inputs = [[c, a] for c, a in zip(contexts, answers)]
+        scores = []
+        input_batches = [
+            inputs[x : x + self.batch_size]
+            for x in range(0, len(inputs), self.batch_size)
+        ]
+        for input_batch in tqdm(input_batches, "input batch"):
+            batch_scores = self.model.predict(input_batch).cpu().tolist()
+            scores.extend(batch_scores)
+        return [{"score": score} for score in scores]
 class Squad(HuggingfaceMetric):
     hf_metric_name = "squad"
     main_score = "f1"

operators.py CHANGED Viewed

@@ -450,7 +450,7 @@ class InstanceFieldOperator(InstanceOperator):
                 )
                 if old_value is default_place_holder:
                     if self.not_exist_do_nothing:
-                        return instance
                     old_value = self.get_default
             except Exception as e:
                 raise ValueError(

                 )
                 if old_value is default_place_holder:
                     if self.not_exist_do_nothing:
+                        continue
                     old_value = self.get_default
             except Exception as e:
                 raise ValueError(

parsing_utils.py CHANGED Viewed

@@ -45,7 +45,7 @@ from typing import Any, Tuple
 def consume_name_val(instring: str) -> Tuple[Any, str]:
     name_val = ""
     for char in instring:
-        if char in "[],:{}=":
             break
         name_val += char
     instring = instring[len(name_val) :].strip()

 def consume_name_val(instring: str) -> Tuple[Any, str]:
     name_val = ""
     for char in instring:
+        if char in "[],{}=":
             break
         name_val += char
     instring = instring[len(name_val) :].strip()

standard.py CHANGED Viewed

@@ -140,6 +140,10 @@ class BaseRecipe(Recipe, SourceSequentialOperator):
                 f"post processors must be a list of post processor.  Got postprocessors = {self.postprocessors}"
             )
         if self.template is None:
             raise ValueError(
                 "You must set in the recipe either `template`, `template_card_index`."

                 f"post processors must be a list of post processor.  Got postprocessors = {self.postprocessors}"
             )
+        if self.format is not None and not isinstance(self.format, Format):
+            raise ValueError(
+                f"format parameter must be a list of of class derived from Format.  Got format = {self.format}"
+            )
         if self.template is None:
             raise ValueError(
                 "You must set in the recipe either `template`, `template_card_index`."

version.py CHANGED Viewed

	@@ -1 +1 @@
1	- version = "1.15.7"


1	+ version = "1.15.8"