DeepSeek-R1-Qwen-7B

Runtime error

nikravan commited on 13 days ago

Commit

8f997e4

verified ·

1 Parent(s): 6814d81

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ from transformers import AutoModelForCausalLM, AutoTokenizer, BitsAndBytesConfig
 subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
-MODEL_ID = "deepseek-ai/DeepSeek-R1-Distill-Qwen-14B"
 CHAT_TEMPLATE = "َAuto"
 MODEL_NAME = MODEL_ID.split("/")[-1]
 CONTEXT_LENGTH = 16000
@@ -102,7 +102,7 @@ tokenizer = AutoTokenizer.from_pretrained(MODEL_ID)
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
-    quantization_config=quantization_config,
     attn_implementation="flash_attention_2",
 )

 subprocess.run('pip install flash-attn --no-build-isolation', env={'FLASH_ATTENTION_SKIP_CUDA_BUILD': "TRUE"}, shell=True)
+MODEL_ID = "deepseek-ai/DeepSeek-R1-Distill-Qwen-7B"
 CHAT_TEMPLATE = "َAuto"
 MODEL_NAME = MODEL_ID.split("/")[-1]
 CONTEXT_LENGTH = 16000
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_ID,
     device_map="auto",
+    #quantization_config=quantization_config,
     attn_implementation="flash_attention_2",
 )