Spaces:

Cmentor
/

Phi3-LawPortalCaseManagementAgentV1

Sleeping

TuringsSolutions commited on Aug 2

Commit

b2118f5

•

1 Parent(s): 65aeece

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,12 +1,15 @@
 import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
 # Load tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained("TuringsSolutions/Gemma2LegalEdition", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("TuringsSolutions/Gemma2LegalEdition", trust_remote_code=True)
 def predict(prompt, temperature, max_tokens):
-    inputs = tokenizer(prompt, return_tensors="pt")
     outputs = model.generate(
         **inputs,
         max_new_tokens=max_tokens,

 import gradio as gr
+import torch
 from transformers import AutoTokenizer, AutoModelForCausalLM
 # Load tokenizer and model
 tokenizer = AutoTokenizer.from_pretrained("TuringsSolutions/Gemma2LegalEdition", trust_remote_code=True)
 model = AutoModelForCausalLM.from_pretrained("TuringsSolutions/Gemma2LegalEdition", trust_remote_code=True)
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+model.to(device)
 def predict(prompt, temperature, max_tokens):
+    inputs = tokenizer(prompt, return_tensors="pt").to(device)
     outputs = model.generate(
         **inputs,
         max_new_tokens=max_tokens,