Iseratho
/

glove-wiki-gigaword-50

Feature Extraction

Model card Files Files and versions Community

Iseratho commited on Sep 14, 2022

Commit

d4efd8e

•

1 Parent(s): 56e517a

add model

Files changed (2) hide show

config.json +4 -0
pretrained_word2vec.py +26 -0

config.json CHANGED Viewed

@@ -2,6 +2,10 @@
   "architectures": [
     "PretrainedWord2VecHFModel"
   ],
   "hidden_size": 50,
   "model_type": "glove",
   "num_words": 400001,

   "architectures": [
     "PretrainedWord2VecHFModel"
   ],
+  "auto_map": {
+    "AutoConfig": "pretrained_word2vec.PretrainedWord2VecHFConfig",
+    "AutoModel": "pretrained_word2vec.PretrainedWord2VecHFModel"
+  },
   "hidden_size": 50,
   "model_type": "glove",
   "num_words": 400001,

pretrained_word2vec.py ADDED Viewed

	@@ -0,0 +1,26 @@

+from transformers import PreTrainedModel, PretrainedConfig
+from torch import nn
+import torch
+class PretrainedWord2VecHFConfig(PretrainedConfig):
+    model_type = "glove"
+    def __init__(self, num_words=400001, vector_size=50, **kwargs):
+        self.num_words = num_words
+        self.vector_size = vector_size
+        self.hidden_size = self.vector_size  # Required for sBERT
+        super().__init__(**kwargs)
+class PretrainedWord2VecHFModel(PreTrainedModel):
+    config_class = PretrainedWord2VecHFConfig
+    def __init__(self, config):
+        super().__init__(config)
+        self.embeddings = nn.Embedding(config.num_words, config.vector_size)
+    def set_embeddings(self, embeddings):
+        self.embeddings = nn.Embedding.from_pretrained(torch.tensor(embeddings))
+    def forward(self, input_ids, **kwargs):
+        x = self.embeddings(torch.tensor(input_ids))
+        return x