Spaces:

yash009
/

textgeneration

Runtime error

Yash Sachdeva commited on Mar 12, 2024

Commit

21e7dd1

1 Parent(s): 5ed2b9f

solar

Files changed (1) hide show

question_paper.py CHANGED Viewed

@@ -6,13 +6,27 @@ from fastapi import FastAPI
 from transformers import AutoModelForCausalLM, AutoTokenizer
 app = FastAPI()
 @app.get("/")
 def llama():
-    tokenizer = AutoTokenizer.from_pretrained("Upstage/SOLAR-10.7B-v1.0")
-    model = AutoModelForCausalLM.from_pretrained("Upstage/SOLAR-10.7B-v1.0", device_map="auto", torch_dtype=torch.float16,)
     text = "Hi, my name is "
-    inputs = tokenizer(text, return_tensors="pt")
-    outputs = model.generate(**inputs, max_new_tokens=64)
-    print(tokenizer.decode(outputs[0], skip_special_tokens=True))
-    return tokenizer.decode(outputs[0], skip_special_tokens=True)

 from transformers import AutoModelForCausalLM, AutoTokenizer
 app = FastAPI()
+MODEL = None
+TOKENIZER = None
 @app.get("/")
 def llama():
     text = "Hi, my name is "
+    inputs = TOKENIZER(text, return_tensors="pt")
+    outputs = MODEL.generate(**inputs, max_new_tokens=64)
+    tresponse = TOKENIZER.decode(outputs[0], skip_special_tokens=True)
+    print(tresponse)
+    return tresponse
+@app.on_event("startup")
+def init_model():
+    global MODEL
+    if not MODEL:
+        print("loading model")
+        TOKENIZER = AutoTokenizer.from_pretrained("Upstage/SOLAR-10.7B-v1.0")
+        MODEL = AutoModelForCausalLM.from_pretrained("Upstage/SOLAR-10.7B-v1.0", device_map="auto", torch_dtype=torch.float16,)
+        print("loaded model")