qwen3vl-2b-autoparts-3class

LoRA-адаптер поверх Qwen3-VL-2B-Instruct для классификации фото автозапчастей.

Что делает модель

Принимает фото автозапчасти и отвечает одним словом:

Ответ Значение
CATALOG Студийное/каталожное фото: белый фон, стрелки, водяные знаки, аннотации
REAL Живое фото продавца: естественная обстановка, обычный фон
USED Б/у запчасть: грязная, ржавая, потёртая, со следами эксплуатации

Использование

from unsloth import FastVisionModel
from peft import PeftModel
from PIL import Image

model, tokenizer = FastVisionModel.from_pretrained(
    "unsloth/Qwen3-VL-2B-Instruct-unsloth-bnb-4bit",
    load_in_4bit=True,
)
model = PeftModel.from_pretrained(model, "Stepan222/qwen3vl-2b-autoparts-3class")
FastVisionModel.for_inference(model)

def predict(image_path):
    img = Image.open(image_path).convert("RGB")
    messages = [{"role": "user", "content": [
        {"type": "image"},
        {"type": "text", "text": "Определи тип фото автозапчасти. Ответь одним словом: CATALOG, REAL или USED."},
    ]}]
    input_text = tokenizer.apply_chat_template(messages, add_generation_prompt=True)
    inputs = tokenizer(img, input_text, add_special_tokens=False, return_tensors="pt").to("cuda")
    output = model.generate(**inputs, max_new_tokens=10, temperature=0.1, min_p=0.1)
    return tokenizer.decode(output[0][inputs.input_ids.shape[1]:], skip_special_tokens=True).strip()

print(predict("photo.jpg"))  # CATALOG / REAL / USED

Данные

  • ~293 CATALOG фото
  • ~310 REAL фото
  • ~294 USED фото
Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Stepan222/qwen3vl-2b-autoparts-3class

Adapter
(70)
this model