biu-nlp
/

abstract-sim-sentence

Feature Extraction

sentence-similarity

Inference Endpoints

Model card Files Files and versions Community

ravfogs commited on May 13, 2023

Commit

5032567

•

1 Parent(s): cd9a0ff

Update README.md

Files changed (1) hide show

README.md +37 -0

README.md CHANGED Viewed

@@ -1,3 +1,40 @@
 ---
 license: cc-by-3.0
 ---

 ---
 license: cc-by-3.0
+language:
+- en
 ---
+The following python code demonstrates the loading of the model:
+```python
+from transformers import AutoTokenizer, AutoModel
+import torch
+def load_finetuned_model():
+        def fix_module_prefix_in_state_dict(state_dict):
+            return {k.replace('module.', ''): v for k, v in state_dict.items()}
+        sentence_encoder = AutoModel.from_pretrained("sentence-transformers/all-mpnet-base-v2")
+        query_encoder = AutoModel.from_pretrained("sentence-transformers/all-mpnet-base-v2")
+        tokenizer = AutoTokenizer.from_pretrained("sentence-transformers/all-mpnet-base-v2")
+        sentence_encoder.load_state_dict(params_sent_encoder)
+        query_encoder.load_state_dict(params_query_encoder)
+        query_encoder.eval()
+        sentence_encoder.eval()
+        return tokenizer, query_encoder, sentence_encoder
+def encode_batch(model, tokenizer, sentences, device):
+    input_ids = tokenizer(sentences, padding=True, max_length=512, truncation=True, return_tensors="pt",
+                          add_special_tokens=True).to(device)
+    features = model(**input_ids)[0]
+    features =  torch.sum(features[:,1:,:] * input_ids["attention_mask"][:,1:].unsqueeze(-1), dim=1) / torch.clamp(torch.sum(input_ids["attention_mask"][:,1:], dim=1, keepdims=True), min=1e-9)
+    return features
+```