Spaces:

AARANHA
/

detecta_espaco

Sleeping

App Files Files Community

AARANHA commited on Sep 9

Commit

e853293

verified ·

1 Parent(s): 58fd0df

Update app.py

Browse files

Files changed (1) hide show

app.py +44 -35

app.py CHANGED Viewed

@@ -1,50 +1,55 @@
-# app.py — versão testada e garantida
-from transformers import AutoImageProcessor, AutoModelForImageClassification
 from PIL import Image
 import gradio as gr
-import torch
-# ✅ Modelo real e disponível no Hugging Face
-model_name = "nvidia/segformer-b3-finetuned-ade-512-512"
-processor = AutoImageProcessor.from_pretrained(model_name)
-model = AutoModelForImageClassification.from_pretrained(model_name)
-# Mapeamento de labels do ADE20K para português (classes de ambientes)
-# Fonte: https://github.com/CSAILVision/ADE20K/blob/master/ade20k_annotator/objectInfo150.csv
 label_map = {
-    "bedroom": "Quarto",
-    "living room": "Sala de estar",
-    "kitchen": "Cozinha",
-    "bathroom": "Banheiro",
-    "dining room": "Sala de jantar",
-    "office": "Escritório",
-    "corridor": "Corredor",
-    "closet": "Closet",
-    "garage": "Garagem",
-    "attic": "Sótão",
-    "basement": "Porão",
-    "laundry room": "Lavanderia",
-    "balcony": "Varanda",
-    "entryway": "Hall de entrada",
 }
 def classify_room(image):
-    """Classifica o tipo de cômodo na imagem."""
     if image is None:
         return "Nenhuma imagem fornecida", 0.0
-    inputs = processor(images=image, return_tensors="pt")
-    with torch.no_grad():
-        outputs = model(**inputs)
-        logits = outputs.logits
-        probabilities = torch.softmax(logits, dim=-1)
-        confidence, predicted_idx = torch.max(probabilities, dim=-1)
-        label_en = model.config.id2label[predicted_idx.item()].lower()  # Ex: "Living room" → "living room"
-        label_pt = label_map.get(label_en, label_en.title())  # Fallback com primeira letra maiúscula
-    return label_pt, confidence.item()
 # Interface Gradio
 demo = gr.Interface(
@@ -54,8 +59,12 @@ demo = gr.Interface(
         gr.Textbox(label="Tipo de Cômodo Detectado"),
         gr.Number(label="Confiança", precision=4)
     ],
-    title="🔍 Detector de Cômodos (Sala, Quarto, Cozinha...)",
-    description="Envie uma foto e descubra que tipo de cômodo é — usando IA especializada e gratuita!",
 )
 if __name__ == "__main__":

+# app.py — versão FINAL, FUNCIONAL e PRECISA
+from transformers import pipeline
 from PIL import Image
 import gradio as gr
+# ✅ Modelo real e disponível: CLIP
+classifier = pipeline("zero-shot-image-classification", model="openai/clip-vit-base-patch32")
+# Defina os rótulos em português (você controla!)
+candidate_labels = [
+    "uma foto de uma sala de estar",
+    "uma foto de um quarto",
+    "uma foto de uma cozinha",
+    "uma foto de um banheiro",
+    "uma foto de um escritório",
+    "uma foto de uma sala de jantar",
+    "uma foto de um corredor",
+    "uma foto de um closet",
+    "uma foto de uma garagem",
+    "uma foto de uma varanda",
+]
+# Mapeamento para nomes curtos em PT-BR
 label_map = {
+    "uma foto de uma sala de estar": "Sala de estar",
+    "uma foto de um quarto": "Quarto",
+    "uma foto de uma cozinha": "Cozinha",
+    "uma foto de um banheiro": "Banheiro",
+    "uma foto de um escritório": "Escritório",
+    "uma foto de uma sala de jantar": "Sala de jantar",
+    "uma foto de um corredor": "Corredor",
+    "uma foto de um closet": "Closet",
+    "uma foto de uma garagem": "Garagem",
+    "uma foto de uma varanda": "Varanda",
 }
 def classify_room(image):
+    """Classifica o tipo de cômodo usando CLIP (zero-shot)."""
     if image is None:
         return "Nenhuma imagem fornecida", 0.0
+    # CLIP espera PIL Image
+    results = classifier(image, candidate_labels=candidate_labels, multi_label=False)
+    # Pega o top-1
+    top_result = results[0]
+    label_en = top_result['label']
+    confidence = top_result['score']
+    label_pt = label_map.get(label_en, label_en)
+    return label_pt, confidence
 # Interface Gradio
 demo = gr.Interface(
         gr.Textbox(label="Tipo de Cômodo Detectado"),
         gr.Number(label="Confiança", precision=4)
     ],
+    title="🔍 Detector de Cômodos com CLIP (Zero-Shot)",
+    description="Precisão muito melhorada — compara sua imagem com descrições em português.",
+    examples=[
+        ["https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/bedroom.jpg"],
+        ["https://huggingface.co/datasets/huggingface/documentation-images/resolve/main/living_room.jpg"]
+    ]
 )
 if __name__ == "__main__":