webpluging

Paused

ranamhamoud commited on Apr 17

Commit

ed082d8

•

1 Parent(s): 297485e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -5,7 +5,7 @@ from typing import Iterator
 from mongoengine import connect, Document, StringField, SequenceField
 import gradio as gr
 import spaces
-from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 from peft import PeftModel
 # Constants
@@ -29,7 +29,7 @@ if not torch.cuda.is_available():
     DESCRIPTION += "\n<p>Running on CPU 🥶 This demo does not work on CPU.</p>"
 # Model and Tokenizer Configuration
-model_id = "meta-llama/Llama-2-7b-chat-hf"
 bnb_config = BitsAndBytesConfig(
     load_in_4bit=True,
     bnb_4bit_use_double_quant=False,

 from mongoengine import connect, Document, StringField, SequenceField
 import gradio as gr
 import spaces
+from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig, TextIteratorStreamer
 from peft import PeftModel
 # Constants
     DESCRIPTION += "\n<p>Running on CPU 🥶 This demo does not work on CPU.</p>"
 # Model and Tokenizer Configuration
+model_id = "meta-llama/Llama-2-7b-hf"
 bnb_config = BitsAndBytesConfig(
     load_in_4bit=True,
     bnb_4bit_use_double_quant=False,