Spaces:

augmxnt
/

shisa

Runtime error

lhl commited on Nov 16, 2023

Commit

d387874

•

1 Parent(s): f00ac1d

try to fit on T4 (16GB RAM)

Files changed (1) hide show

app.py CHANGED Viewed

@@ -31,7 +31,9 @@ model = AutoModelForCausalLM.from_pretrained(
     model_name,
     torch_dtype=torch.bfloat16,
     device_map="auto",
-    load_in_8bit=True,
 )
 streamer = TextIteratorStreamer(tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True)

     model_name,
     torch_dtype=torch.bfloat16,
     device_map="auto",
+    # load_in_8bit=True,
+    # try to make it fit on a T4?
+    load_in_4bit=True
 )
 streamer = TextIteratorStreamer(tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True)