Qwen-7B-instruct

Sleeping

ehristoforu commited on Nov 26, 2024

Commit

8133244

verified ·

1 Parent(s): ed219f9

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -9,7 +9,6 @@ from threading import Thread
 HF_TOKEN = os.environ.get("HF_TOKEN", None)
 MODEL_ID = "ehristoforu/SoRu-0008"
-MODELS = os.environ.get("MODELS")
 MODEL_NAME = MODELS.split("/")[-1]
 TITLE = "<h1><center>Qwen2-7B-instruct</center></h1>"
@@ -37,11 +36,11 @@ text-align: center;
 """
 model = AutoModelForCausalLM.from_pretrained(
-          MODELS,
           torch_dtype=torch.float16,
           device_map="auto",
         )
-tokenizer = Qwen2Tokenizer.from_pretrained(MODELS)
 @spaces.GPU
 def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):

 HF_TOKEN = os.environ.get("HF_TOKEN", None)
 MODEL_ID = "ehristoforu/SoRu-0008"
 MODEL_NAME = MODELS.split("/")[-1]
 TITLE = "<h1><center>Qwen2-7B-instruct</center></h1>"
 """
 model = AutoModelForCausalLM.from_pretrained(
+          MODEL_ID,
           torch_dtype=torch.float16,
           device_map="auto",
         )
+tokenizer = Qwen2Tokenizer.from_pretrained(MODEL_ID)
 @spaces.GPU
 def stream_chat(message: str, history: list, temperature: float, max_new_tokens: int, top_p: float, top_k: int, penalty: float):