verseAI
/

vai-GPT-NeoXT-Chat-Base-20B

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

manish commited on May 1, 2023

Commit

28e5926

•

1 Parent(s): 0d9a7b6

change return type

Files changed (1) hide show

handler.py +8 -2

handler.py CHANGED Viewed

@@ -7,7 +7,7 @@ class EndpointHandler():
         self.tokenizer = AutoTokenizer.from_pretrained("verseAI/vai-GPT-NeoXT-Chat-Base-20B")
         self.model = AutoModelForCausalLM.from_pretrained("verseAI/vai-GPT-NeoXT-Chat-Base-20B", device_map="auto", load_in_8bit=True)
-    def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
         """
        data args:
             inputs (:obj: `str`)
@@ -17,10 +17,16 @@ class EndpointHandler():
             from transformers import AutoTokenizer, AutoModelForCausalLM
         """
         # infer
         inputs = self.tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(self.model.device)
         outputs = self.model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
         output_str = self.tokenizer.decode(outputs[0])
         print(output_str)
-        return output_str

         self.tokenizer = AutoTokenizer.from_pretrained("verseAI/vai-GPT-NeoXT-Chat-Base-20B")
         self.model = AutoModelForCausalLM.from_pretrained("verseAI/vai-GPT-NeoXT-Chat-Base-20B", device_map="auto", load_in_8bit=True)
+    def __call__(self, data: Dict[str, Any]) -> Dict[str, Any]:
         """
        data args:
             inputs (:obj: `str`)
             from transformers import AutoTokenizer, AutoModelForCausalLM
         """
+        input = data.pop("inputs", data)
+        print(input)
         # infer
         inputs = self.tokenizer("<human>: Hello!\n<bot>:", return_tensors='pt').to(self.model.device)
         outputs = self.model.generate(**inputs, max_new_tokens=10, do_sample=True, temperature=0.8)
         output_str = self.tokenizer.decode(outputs[0])
         print(output_str)
+        # return output_str
+        return {"generated_text": output_str}