qwen3vl-2b-autoparts-3class
LoRA-адаптер поверх Qwen3-VL-2B-Instruct для классификации фото автозапчастей.
Что делает модель
Принимает фото автозапчасти и отвечает одним словом:
| Ответ | Значение |
|---|---|
CATALOG |
Студийное/каталожное фото: белый фон, стрелки, водяные знаки, аннотации |
REAL |
Живое фото продавца: естественная обстановка, обычный фон |
USED |
Б/у запчасть: грязная, ржавая, потёртая, со следами эксплуатации |
Использование
from unsloth import FastVisionModel
from peft import PeftModel
from PIL import Image
model, tokenizer = FastVisionModel.from_pretrained(
"unsloth/Qwen3-VL-2B-Instruct-unsloth-bnb-4bit",
load_in_4bit=True,
)
model = PeftModel.from_pretrained(model, "Stepan222/qwen3vl-2b-autoparts-3class")
FastVisionModel.for_inference(model)
def predict(image_path):
img = Image.open(image_path).convert("RGB")
messages = [{"role": "user", "content": [
{"type": "image"},
{"type": "text", "text": "Определи тип фото автозапчасти. Ответь одним словом: CATALOG, REAL или USED."},
]}]
input_text = tokenizer.apply_chat_template(messages, add_generation_prompt=True)
inputs = tokenizer(img, input_text, add_special_tokens=False, return_tensors="pt").to("cuda")
output = model.generate(**inputs, max_new_tokens=10, temperature=0.1, min_p=0.1)
return tokenizer.decode(output[0][inputs.input_ids.shape[1]:], skip_special_tokens=True).strip()
print(predict("photo.jpg")) # CATALOG / REAL / USED
Данные
- ~293 CATALOG фото
- ~310 REAL фото
- ~294 USED фото
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support
Model tree for Stepan222/qwen3vl-2b-autoparts-3class
Base model
Qwen/Qwen3-VL-2B-Instruct