Spaces:

huggingface-projects
/

gemma-2-9b-it

Running on Zero

hysts HF staff commited on Jul 29, 2024

Commit

5f1f01a

1 Parent(s): 79b912b

Not use 8 bit quantization

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,12 +5,7 @@ from typing import Iterator
 import gradio as gr
 import spaces
 import torch
-from transformers import (
-    AutoModelForCausalLM,
-    BitsAndBytesConfig,
-    GemmaTokenizerFast,
-    TextIteratorStreamer,
-)
 DESCRIPTION = """\
 # Gemma 2 9B IT
@@ -33,7 +28,7 @@ tokenizer = GemmaTokenizerFast.from_pretrained(model_id)
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     device_map="auto",
-    quantization_config=BitsAndBytesConfig(load_in_8bit=True),
 )
 model.config.sliding_window = 4096
 model.eval()

 import gradio as gr
 import spaces
 import torch
+from transformers import AutoModelForCausalLM, GemmaTokenizerFast, TextIteratorStreamer
 DESCRIPTION = """\
 # Gemma 2 9B IT
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
     device_map="auto",
+    torch_dtype=torch.bfloat16,
 )
 model.config.sliding_window = 4096
 model.eval()