fietje-2b

Sleeping

BramVanroy commited on Feb 5

Commit

568a9e0

•

1 Parent(s): b902422

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,7 @@ from typing import Iterator
 import torch
 import gradio as gr
-import spaces
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
@@ -16,11 +16,12 @@ MAX_INPUT_TOKEN_LENGTH = int(os.getenv("MAX_INPUT_TOKEN_LENGTH", "8192"))
 model_id = "BramVanroy/GEITje-7B-ultra"
 model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto")
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 tokenizer.pad_token_id = tokenizer.eos_token_id
-@spaces.GPU
 def generate(
     message: str,
     chat_history: list[tuple[str, str]],

 import torch
 import gradio as gr
+# import spaces
 import torch
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
 model_id = "BramVanroy/GEITje-7B-ultra"
 model = AutoModelForCausalLM.from_pretrained(model_id, torch_dtype=torch.bfloat16, device_map="auto")
+model = model.to("cuda" if torch.cuda.is_available() else "cpu")
 tokenizer = AutoTokenizer.from_pretrained(model_id)
 tokenizer.pad_token_id = tokenizer.eos_token_id
+# @spaces.GPU
 def generate(
     message: str,
     chat_history: list[tuple[str, str]],