Spaces:

shrimantasatpati
/

Microsoft_Phi2_Streamlit

Runtime error

shrimantasatpati commited on Dec 16, 2023

Commit

0b252a0

•

1 Parent(s): 3b4796e

Updated app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,6 +2,12 @@ import streamlit as st
 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
 # Load the Phi 2 model and tokenizer
 tokenizer = AutoTokenizer.from_pretrained(
     "microsoft/phi-2",
@@ -10,26 +16,28 @@ tokenizer = AutoTokenizer.from_pretrained(
 model = AutoModelForCausalLM.from_pretrained(
     "microsoft/phi-2",
-    device_map="auto",
     trust_remote_code=True,
-    offload_folder="offload"
 )
 # Streamlit UI
 st.title("Microsoft Phi 2 Streamlit App")
 # User input prompt
-prompt = st.text_area("Enter your prompt:", """Write a story about Nasa""")
 # Generate output based on user input
 if st.button("Generate Output"):
     with torch.no_grad():
-        token_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt")
         output_ids = model.generate(
             token_ids.to(model.device),
             max_new_tokens=512,
             do_sample=True,
-            temperature=0.3
         )
     output = tokenizer.decode(output_ids[0][token_ids.size(1):])

 from transformers import AutoTokenizer, AutoModelForCausalLM
 import torch
+import torch
+from transformers import AutoModelForCausalLM, AutoTokenizer
+import gradio as gr
+# torch.set_default_device("cuda")
 # Load the Phi 2 model and tokenizer
 tokenizer = AutoTokenizer.from_pretrained(
     "microsoft/phi-2",
 model = AutoModelForCausalLM.from_pretrained(
     "microsoft/phi-2",
+    device_map="cpu",
     trust_remote_code=True,
+    # offload_folder="offload",
+    torch_dtype=torch.float32
 )
 # Streamlit UI
 st.title("Microsoft Phi 2 Streamlit App")
 # User input prompt
+prompt = st.text_area("Enter your prompt:", """Write a short summary about how to create a healthy lifestyle.""")
 # Generate output based on user input
 if st.button("Generate Output"):
     with torch.no_grad():
+        token_ids = tokenizer.encode(prompt, add_special_tokens=False, return_tensors="pt",  return_attention_mask=False)
         output_ids = model.generate(
             token_ids.to(model.device),
             max_new_tokens=512,
             do_sample=True,
+            temperature=0.3,
+            max_length=200
         )
     output = tokenizer.decode(output_ids[0][token_ids.size(1):])