Update README.md

Files changed (1) hide show

README.md CHANGED Viewed

@@ -46,8 +46,8 @@ This model has been quantized using [GPTQModel](https://github.com/ModelCloud/GP
 from transformers import AutoTokenizer
 from gptqmodel import GPTQModel
-tokenizer = AutoTokenizer.from_pretrained("ModelCloud/QwQ-32B-Preview-GPTQ-4bit")
-model = GPTQModel.load("ModelCloud/QwQ-32B-Preview-GPTQ-4bit")
 messages = [
     {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},

 from transformers import AutoTokenizer
 from gptqmodel import GPTQModel
+tokenizer = AutoTokenizer.from_pretrained("ModelCloud/QwQ-32B-Preview-gptqmodel-4bit-vortex-v1")
+model = GPTQModel.load("ModelCloud/QwQ-32B-Preview-gptqmodel-4bit-vortex-v1")
 messages = [
     {"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},