Deepakvictor
/

tan-ta

text2text-generation

Inference Endpoints

Model card Files Files and versions Community

Deepakvictor commited on Aug 14, 2023

Commit

d3f59c0

•

1 Parent(s): efc6f35

Update handler.py

Files changed (1) hide show

handler.py +4 -7

handler.py CHANGED Viewed

@@ -3,16 +3,13 @@ from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
 import torch
 from handler import EndpointHandler
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-class EndpointHandler:
-    def __init__(self, path="Deepakvictor/tan-ta"):
-        self.tokenizer = AutoTokenizer.from_pretrained(path).to(device)
-        self.model = AutoModelForSeq2SeqLM.from_pretrained(path).to(device))
     def __call__(self, data: str) -> str:
         inp = self.tokenizer(data, return_tensors="pt")
-        for q in inp:
-            inp[q] = inp[q].to(device)
         with torch.inference_mode():
             out= self.model.generate(**inp)
         final_output = self.tokenizer.batch_decode(out,skip_special_tokens=True)

 import torch
 from handler import EndpointHandler
+class EndpointHandler():
+    def __init__(self, path=""):
+        self.tokenizer = AutoTokenizer.from_pretrained(path)
+        self.model = AutoModelForSeq2SeqLM.from_pretrained(path)
     def __call__(self, data: str) -> str:
         inp = self.tokenizer(data, return_tensors="pt")
         with torch.inference_mode():
             out= self.model.generate(**inp)
         final_output = self.tokenizer.batch_decode(out,skip_special_tokens=True)