JeremyArancio
/

llm-tolkien

JeremyArancio commited on Jun 1, 2023

Commit

88e1248

•

1 Parent(s): 6dec8ee

Update handler

Files changed (2) hide show

README.md CHANGED Viewed

@@ -26,10 +26,10 @@ from peft import PeftConfig, PeftModel
 # Import the model
 config = PeftConfig.from_pretrained("JeremyArancio/llm-tolkien")
-model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, return_dict=True, load_in_8bit=True, device_map='auto')
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
 # Load the Lora model
-model = PeftModel.from_pretrained(model, hf_repo)
 ```
 # Run the model

 # Import the model
 config = PeftConfig.from_pretrained("JeremyArancio/llm-tolkien")
+model = AutoModelForCausalLM.from_pretrained(config.base_model_name_or_path, load_in_8bit=True, device_map='auto')
 tokenizer = AutoTokenizer.from_pretrained(config.base_model_name_or_path)
 # Load the Lora model
+model = PeftModel.from_pretrained(model, "JeremyArancio/llm-tolkien")
 ```
 # Run the model

handler.py CHANGED Viewed

@@ -1,4 +1,4 @@
-from typing import Dict, List, Any
 import logging
 from transformers import AutoModelForCausalLM, AutoTokenizer
@@ -6,6 +6,7 @@ from peft import PeftConfig, PeftModel
 LOGGER = logging.getLogger(__name__)
 class EndpointHandler():
@@ -16,26 +17,24 @@ class EndpointHandler():
         # Load the Lora model
         self.model = PeftModel.from_pretrained(model, path)
-    def __call__(self, data: Dict[str, Any]) -> List[Dict[str, Any]]:
         """
         Args:
             data (Dict): The payload with the text prompt and generation parameters.
         """
         LOGGER.info(f"Received data: {data}")
         # Get inputs
-        inputs = data.pop("inputs", data)
         parameters = data.pop("parameters", None)
-        LOGGER.info("Data extracted.")
         # Preprocess
-        LOGGER.info(f"Start tokenizer: {inputs}")
-        inputs_ids = self.tokenizer(inputs, return_tensors="pt").inputs_ids
         # Forward
         LOGGER.info(f"Start generation.")
         if parameters is not None:
-            outputs = self.model.generate(inputs_ids, **parameters)
         else:
-            outputs = self.model.generate(inputs_ids)
         # Postprocess
-        prediction = self.tokenizer.decode(outputs[0])
         LOGGER.info(f"Generated text: {prediction}")
         return {"generated_text": prediction}

+from typing import Dict, Any
 import logging
 from transformers import AutoModelForCausalLM, AutoTokenizer
 LOGGER = logging.getLogger(__name__)
+logging.basicConfig(level=logging.INFO)
 class EndpointHandler():
         # Load the Lora model
         self.model = PeftModel.from_pretrained(model, path)
+    def __call__(self, data: Dict[str, Any]) -> Dict[str, Any]:
         """
         Args:
             data (Dict): The payload with the text prompt and generation parameters.
         """
         LOGGER.info(f"Received data: {data}")
         # Get inputs
+        prompt = data.pop("prompt", data)
         parameters = data.pop("parameters", None)
         # Preprocess
+        input = self.tokenizer(prompt, return_tensors="pt")
         # Forward
         LOGGER.info(f"Start generation.")
         if parameters is not None:
+            output = self.model.generate(**input, **parameters)
         else:
+            output = self.model.generate(**input)
         # Postprocess
+        prediction = self.tokenizer.decode(output[0])
         LOGGER.info(f"Generated text: {prediction}")
         return {"generated_text": prediction}