Upload model

Browse files

Files changed (4) hide show

config.json +13 -0
configuration_dpr.py +7 -0
modeling_dpr.py +66 -0
pytorch_model.bin +3 -0

config.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+  "_name_or_path": "/home/secilsen/Desktop/DPR-contrastive-finetuned/DPR-model-contrastive-finetuned/checkpoint-168",
+  "architectures": [
+    "OBSSDPRModel"
+  ],
+  "auto_map": {
+    "AutoConfig": "configuration_dpr.CustomDPRConfig",
+    "AutoModel": "modeling_dpr.OBSSDPRModel"
+  },
+  "model_type": "dpr",
+  "torch_dtype": "float32",
+  "transformers_version": "4.24.0"
+}

configuration_dpr.py ADDED Viewed

	@@ -0,0 +1,7 @@

+from transformers import PretrainedConfig
+class CustomDPRConfig(PretrainedConfig):
+    model_type = 'dpr'
+    def __init__(self, **kwargs):
+        super().__init__(**kwargs)

modeling_dpr.py ADDED Viewed

	@@ -0,0 +1,66 @@

+from transformers import PreTrainedModel, AutoModel, AutoTokenizer
+import torch
+import torch.nn as nn
+from .configuration_dpr import CustomDPRConfig
+from typing import Union, List, Dict
+class OBSSDPRModel(PreTrainedModel):
+    config_class = CustomDPRConfig
+    def __init__(self, config):
+        super().__init__(config)
+        self.config = config
+        self.model = DPRModel()
+    def forward(self, input):
+        return self.model(input)
+class DPRModel(nn.Module):
+    def __init__(self,
+                 question_model_name='facebook/contriever-msmarco',
+                 context_model_name='facebook/contriever-msmarco'):
+        super(DPRModel, self).__init__()
+        self.question_model = AutoModel.from_pretrained(question_model_name)
+        self.context_model = AutoModel.from_pretrained(context_model_name)
+    def freeze_layers(self, freeze_params):
+        num_layers_context = sum(1 for _ in self.context_model.parameters())
+        num_layers_question = sum(1 for _ in self.question_model.parameters())
+        for parameters in list(self.context_model.parameters())[:int(freeze_params * num_layers_context)]:
+            parameters.requires_grad = False
+        for parameters in list(self.context_model.parameters())[int(freeze_params * num_layers_context):]:
+            parameters.requires_grad = True
+        for parameters in list(self.question_model.parameters())[:int(freeze_params * num_layers_question)]:
+            parameters.requires_grad = False
+        for parameters in list(self.question_model.parameters())[int(freeze_params * num_layers_question):]:
+            parameters.requires_grad = True
+    def batch_dot_product(self, context_output, question_output):
+        mat1 = torch.unsqueeze(question_output, dim=1)
+        mat2 = torch.unsqueeze(context_output, dim=2)
+        result = torch.bmm(mat1, mat2)
+        result = torch.squeeze(result, dim=1)
+        result = torch.squeeze(result, dim=1)
+        return result
+    ##FOR CONTRIEVER
+    def mean_pooling(self, token_embeddings, mask):
+        token_embeddings = token_embeddings.masked_fill(~mask[..., None].bool(), 0.)
+        sentence_embeddings = token_embeddings.sum(dim=1) / mask.sum(dim=1)[..., None]
+        return sentence_embeddings
+    def forward(self, batch: Union[List[Dict], Dict]):
+        context_tensor = batch['context_tensor']
+        question_tensor = batch['question_tensor']
+        context_model_output = self.context_model(**context_tensor)
+        question_model_output = self.question_model(**question_tensor)
+        embeddings_context = self.mean_pooling(context_model_output[0], context_tensor['attention_mask'])
+        embeddings_question = self.mean_pooling(question_model_output[0], question_tensor['attention_mask'])
+        scores = self.batch_dot_product(embeddings_context, embeddings_question)  # self.scale
+        return scores

pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b6cdb51315917885d11d8224ca54cc176be86cdc1a62145c2452ec4d6a0feb3e
+size 876003341