Add custom Sentence Transformer module

Browse files

Files changed (4) hide show

1_Pooling/config.json +10 -0
config_sentence_transformers.json +10 -0
modules.json +14 -0
vision_transformer.py +64 -0

1_Pooling/config.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "word_embedding_dimension": 768,
+    "pooling_mode_cls_token": true,
+    "pooling_mode_mean_tokens": false,
+    "pooling_mode_max_tokens": false,
+    "pooling_mode_mean_sqrt_len_tokens": false,
+    "pooling_mode_weightedmean_tokens": false,
+    "pooling_mode_lasttoken": false,
+    "include_prompt": true
+  }

config_sentence_transformers.json ADDED Viewed

	@@ -0,0 +1,10 @@

+{
+    "__version__": {
+      "sentence_transformers": "3.1.0.dev0",
+      "transformers": "4.41.2",
+      "pytorch": "2.3.1+cu121"
+    },
+    "prompts": {},
+    "default_prompt_name": null,
+    "similarity_fn_name": "cosine"
+  }

modules.json ADDED Viewed

	@@ -0,0 +1,14 @@

+[
+    {
+      "idx": 0,
+      "name": "0",
+      "path": "",
+      "type": "vision_transformer.VisionTransformer"
+    },
+    {
+      "idx": 1,
+      "name": "1",
+      "path": "1_Pooling",
+      "type": "sentence_transformers.models.Pooling"
+    }
+]

vision_transformer.py ADDED Viewed

	@@ -0,0 +1,64 @@

+from typing import Any, Dict, List, Optional, Tuple, Union
+import torch
+from torch import nn
+from transformers import AutoConfig, AutoModel, AutoProcessor
+class VisionTransformer(nn.Module):
+    """Huggingface AutoModel to generate token embeddings.
+    Loads the correct class, e.g. BERT / RoBERTa etc.
+    Args:
+        model_name_or_path: Huggingface models name
+            (https://huggingface.co/models)
+        model_args: Keyword arguments passed to the Huggingface
+            Transformers model
+        tokenizer_args: Keyword arguments passed to the Huggingface
+            Transformers tokenizer
+        config_args: Keyword arguments passed to the Huggingface
+            Transformers config
+        cache_dir: Cache dir for Huggingface Transformers to store/load
+            models
+    """
+    def __init__(
+        self,
+        model_name_or_path: str,
+        model_args: Optional[Dict[str, Any]] = None,
+        tokenizer_args: Optional[Dict[str, Any]] = None,
+        config_args: Optional[Dict[str, Any]] = None,
+        cache_dir: Optional[str] = None,
+    ) -> None:
+        super(VisionTransformer, self).__init__()
+        if model_args is None:
+            model_args = {}
+        if tokenizer_args is None:
+            tokenizer_args = {}
+        if config_args is None:
+            config_args = {}
+        self.config = AutoConfig.from_pretrained(model_name_or_path, **config_args, cache_dir=cache_dir)
+        self.model = AutoModel.from_pretrained(model_name_or_path, config=self.config, **model_args, cache_dir=cache_dir)
+        self.processor = AutoProcessor.from_pretrained(model_name_or_path, config=self.config, **tokenizer_args, cache_dir=cache_dir)
+    def forward(self, features: Dict[str, torch.Tensor]) -> Dict[str, torch.Tensor]:
+        """Returns token_embeddings, cls_token"""
+        output_states = self.model(pixel_values=features["pixel_values"], return_dict=False)[0]
+        features.update({"token_embeddings": output_states})
+        return features
+    def get_word_embedding_dimension(self) -> int:
+        return self.config.hidden_size
+    def tokenize(
+        self, texts: Union[List[str], List[Dict], List[Tuple[str, str]]], padding: Union[str, bool] = True
+    ) -> Dict[str, torch.Tensor]:
+        return self.processor(texts, return_tensors="pt")
+    def get_config_dict(self) -> Dict[str, Any]:
+        return {key: self.__dict__[key] for key in self.config_keys}
+    def save(self, output_path: str, safe_serialization: bool = True) -> None:
+        self.model.save_pretrained(output_path, safe_serialization=safe_serialization)
+        self.processor.save_pretrained(output_path)