qwen3vl-2b-autoparts-3class

LoRA-адаптер поверх Qwen3-VL-2B-Instruct для классификации фото автозапчастей.

Что делает модель

Принимает фото автозапчасти и отвечает одним словом:

Ответ	Значение
`CATALOG`	Студийное/каталожное фото: белый фон, стрелки, водяные знаки, аннотации
`REAL`	Живое фото продавца: естественная обстановка, обычный фон
`USED`	Б/у запчасть: грязная, ржавая, потёртая, со следами эксплуатации

Использование

from unsloth import FastVisionModel
from peft import PeftModel
from PIL import Image

model, tokenizer = FastVisionModel.from_pretrained(
    "unsloth/Qwen3-VL-2B-Instruct-unsloth-bnb-4bit",
    load_in_4bit=True,
)
model = PeftModel.from_pretrained(model, "Stepan222/qwen3vl-2b-autoparts-3class")
FastVisionModel.for_inference(model)

def predict(image_path):
    img = Image.open(image_path).convert("RGB")
    messages = [{"role": "user", "content": [
        {"type": "image"},
        {"type": "text", "text": "Определи тип фото автозапчасти. Ответь одним словом: CATALOG, REAL или USED."},
    ]}]
    input_text = tokenizer.apply_chat_template(messages, add_generation_prompt=True)
    inputs = tokenizer(img, input_text, add_special_tokens=False, return_tensors="pt").to("cuda")
    output = model.generate(**inputs, max_new_tokens=10, temperature=0.1, min_p=0.1)
    return tokenizer.decode(output[0][inputs.input_ids.shape[1]:], skip_special_tokens=True).strip()

print(predict("photo.jpg"))  # CATALOG / REAL / USED

Данные

~293 CATALOG фото
~310 REAL фото
~294 USED фото

Downloads last month: -; Downloads are not tracked for this model. How to track

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for Stepan222/qwen3vl-2b-autoparts-3class

Base model

Qwen/Qwen3-VL-2B-Instruct

Adapter

(70)

this model