Spaces:

Yersel
/

qwen-30B

Sleeping

Yersel commited on Jun 11

Commit

1a908a5

1 Parent(s): 65adc46

adapt chatbot

Files changed (1) hide show

app.py CHANGED Viewed

@@ -6,7 +6,7 @@ import gradio as gr
 model_id = "Qwen/Qwen3-1.7B"
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
-    torch_dtype = torch.bfloat16
 )
 tokenizer = AutoTokenizer.from_pretrained(model_id)
@@ -38,17 +38,15 @@ def respuesta(
     input_ids = tokenizer.apply_chat_template(
         messages,
         add_generation_prompt=True,
-        return_tensors='pt'
     ).to(model.device)
-    # terminators = [
-    #     tokenizer.eos_token_id,
-    #     tokenizer.convert_tokens_to_ids("<|eot_id|>")
-    # ]
     outputs = model.generate(
-        input_ids,
         max_new_tokens=max_tokens,
         do_sample=True,
         temperature=temperature,

 model_id = "Qwen/Qwen3-1.7B"
 model = AutoModelForCausalLM.from_pretrained(
     model_id,
+    torch_dtype = "auto"
 )
 tokenizer = AutoTokenizer.from_pretrained(model_id)
     input_ids = tokenizer.apply_chat_template(
         messages,
+        tokenize=False,
         add_generation_prompt=True,
+        enable_thinking=True
     ).to(model.device)
+    model_inputs = tokenizer([text], return_tensor='pt')
     outputs = model.generate(
+        **model_inputs,
         max_new_tokens=max_tokens,
         do_sample=True,
         temperature=temperature,