Spaces:

thomasinovic
/

sketch-recognition

Sleeping

App Files Files Community

thomasinovic commited on Nov 28, 2025

Commit

efc35c0

0 Parent(s):

initialize repo

Browse files

Files changed (7) hide show

.gitattributes +35 -0
CNN.py +33 -0
README.md +13 -0
app.py +68 -0
labels.json +1 -0
model_weights.pth +3 -0
requirements.txt +2 -0

.gitattributes ADDED Viewed

	@@ -0,0 +1,35 @@

+*.7z filter=lfs diff=lfs merge=lfs -text
+*.arrow filter=lfs diff=lfs merge=lfs -text
+*.bin filter=lfs diff=lfs merge=lfs -text
+*.bz2 filter=lfs diff=lfs merge=lfs -text
+*.ckpt filter=lfs diff=lfs merge=lfs -text
+*.ftz filter=lfs diff=lfs merge=lfs -text
+*.gz filter=lfs diff=lfs merge=lfs -text
+*.h5 filter=lfs diff=lfs merge=lfs -text
+*.joblib filter=lfs diff=lfs merge=lfs -text
+*.lfs.* filter=lfs diff=lfs merge=lfs -text
+*.mlmodel filter=lfs diff=lfs merge=lfs -text
+*.model filter=lfs diff=lfs merge=lfs -text
+*.msgpack filter=lfs diff=lfs merge=lfs -text
+*.npy filter=lfs diff=lfs merge=lfs -text
+*.npz filter=lfs diff=lfs merge=lfs -text
+*.onnx filter=lfs diff=lfs merge=lfs -text
+*.ot filter=lfs diff=lfs merge=lfs -text
+*.parquet filter=lfs diff=lfs merge=lfs -text
+*.pb filter=lfs diff=lfs merge=lfs -text
+*.pickle filter=lfs diff=lfs merge=lfs -text
+*.pkl filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text
+*.pth filter=lfs diff=lfs merge=lfs -text
+*.rar filter=lfs diff=lfs merge=lfs -text
+*.safetensors filter=lfs diff=lfs merge=lfs -text
+saved_model/**/* filter=lfs diff=lfs merge=lfs -text
+*.tar.* filter=lfs diff=lfs merge=lfs -text
+*.tar filter=lfs diff=lfs merge=lfs -text
+*.tflite filter=lfs diff=lfs merge=lfs -text
+*.tgz filter=lfs diff=lfs merge=lfs -text
+*.wasm filter=lfs diff=lfs merge=lfs -text
+*.xz filter=lfs diff=lfs merge=lfs -text
+*.zip filter=lfs diff=lfs merge=lfs -text
+*.zst filter=lfs diff=lfs merge=lfs -text
+*tfevents* filter=lfs diff=lfs merge=lfs -text

CNN.py ADDED Viewed

	@@ -0,0 +1,33 @@

+import torch
+import torch.nn as nn
+class CNN(nn.Module):
+    def __init__(self, n_filters, hidden_dim, n_layers, n_classes):
+        super().__init__()
+        self.conv1 = nn.Conv2d(1, n_filters, 5)
+        self.relu1 = nn.ReLU()
+        self.maxpool1 = nn.MaxPool2d(2)
+        self.conv2 = nn.Conv2d(n_filters, 2*n_filters, 5)
+        self.relu2 = nn.ReLU()
+        self.maxpool2 = nn.MaxPool2d(2)
+        self.input_dim = 960
+        self.flatten = nn.Flatten()
+        self.inp_layer = nn.Linear(self.input_dim, hidden_dim)
+        self.classifier = nn.ModuleList([
+            nn.Sequential(
+                nn.Linear(hidden_dim, hidden_dim),
+                nn.BatchNorm1d(hidden_dim),
+                nn.ReLU(),
+                nn.Dropout(p=0.3)
+            ) for i in range(n_layers)
+        ])
+        self.out_layer = nn.Linear(hidden_dim, n_classes)
+    def forward(self, x):
+        x = self.maxpool1(self.relu1(self.conv1(x)))
+        x = self.maxpool2(self.relu2(self.conv2(x)))
+        x = self.inp_layer(torch.flatten(x, start_dim=1))
+        for layer in self.classifier:
+            x = layer(x)
+        x = self.out_layer(x)
+        return x

README.md ADDED Viewed

	@@ -0,0 +1,13 @@

+---
+title: Sketch Recognition
+emoji: 🏢
+colorFrom: green
+colorTo: blue
+sdk: gradio
+sdk_version: 5.49.1
+app_file: app.py
+pinned: false
+short_description: This space uses a CNN to classify drawings.
+---
+Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

app.py ADDED Viewed

	@@ -0,0 +1,68 @@

+import gradio as gr
+import torch
+import torch.nn.functional as F
+import torchvision.transforms as T
+import json
+import os
+from pathlib import Path
+from CNN import CNN
+# def greet(name):
+#     return "Hello " + name + "!!"
+# demo = gr.Interface(fn=greet, inputs="text", outputs="text")
+# demo.launch()
+# Load the model
+n_classes = 345
+params = {
+    'n_filters': 30,
+    'hidden_dim': 100,
+    'n_layers': 2,
+    'n_classes': n_classes
+}
+print('testesesesf')
+model = CNN(**params)
+model.load_state_dict(torch.load('model_weights.ptn', map_location='cpu'))
+model.eval()
+# utils
+labels_path = 'labels.json'
+with open(labels_path, 'r') as f:
+    names = json.load(f)
+transform = T.Compose([
+    T.ToTensor(),                            # (1, H, W), values in [0, 1], white=1 black=0
+    T.Lambda(lambda x: 1.0 - x),             # invert -> white=0, black=1
+    T.Resize((28, 28), interpolation=T.InterpolationMode.BILINEAR),
+    # T.Normalize((0.5,), (0.5,))            # optional if your model expects [-1, 1]
+])
+def predict(input_image):
+    img = input_image['composite']
+    if img is None:
+        return {"No drawing detected": 1.0}
+    img = transform(img)
+    img = img.unsqueeze(0).to(torch.float32) # add batch dimension
+    # torch.save(img, )
+    with torch.no_grad():
+        out = model(img)
+    # idx = torch.argmax(out).item()
+    probs = F.softmax(out, dim=1).squeeze(0)
+    res = {names[i]:proba.item() for i, proba in enumerate(probs)}
+    return res
+demo = gr.Interface(
+    fn=predict,
+    inputs=gr.Sketchpad(
+        label="Draw a sketch",
+        image_mode='L',
+        brush=gr.Brush(default_size=15, default_color='black', colors=['black'], color_mode='fixed')
+        ),
+    outputs=gr.Label(num_top_classes=5),
+    title="Sketch Recognition model",
+    clear_btn=gr.ClearButton(),
+    live=True
+)
+print('test')
+demo.launch()

labels.json ADDED Viewed

	@@ -0,0 +1 @@

+ ["aircraft carrier", "airplane", "alarm clock", "ambulance", "angel", "animal migration", "ant", "anvil", "apple", "arm", "asparagus", "axe", "backpack", "banana", "bandage", "barn", "baseball bat", "baseball", "basket", "basketball", "bat", "bathtub", "beach", "bear", "beard", "bed", "bee", "belt", "bench", "bicycle", "binoculars", "bird", "birthday cake", "blackberry", "blueberry", "book", "boomerang", "bottlecap", "bowtie", "bracelet", "brain", "bread", "bridge", "broccoli", "broom", "bucket", "bulldozer", "bus", "bush", "butterfly", "cactus", "cake", "calculator", "calendar", "camel", "camera", "camouflage", "campfire", "candle", "cannon", "canoe", "car", "carrot", "castle", "cat", "ceiling fan", "cell phone", "cello", "chair", "chandelier", "church", "circle", "clarinet", "clock", "cloud", "coffee cup", "compass", "computer", "cookie", "cooler", "couch", "cow", "crab", "crayon", "crocodile", "crown", "cruise ship", "cup", "diamond", "dishwasher", "diving board", "dog", "dolphin", "donut", "door", "dragon", "dresser", "drill", "drums", "duck", "dumbbell", "ear", "elbow", "elephant", "envelope", "eraser", "eye", "eyeglasses", "face", "fan", "feather", "fence", "finger", "fire hydrant", "fireplace", "firetruck", "fish", "flamingo", "flashlight", "flip flops", "floor lamp", "flower", "flying saucer", "foot", "fork", "frog", "frying pan", "garden hose", "garden", "giraffe", "goatee", "golf club", "grapes", "grass", "guitar", "hamburger", "hammer", "hand", "harp", "hat", "headphones", "hedgehog", "helicopter", "helmet", "hexagon", "hockey puck", "hockey stick", "horse", "hospital", "hot air balloon", "hot dog", "hot tub", "hourglass", "house plant", "house", "hurricane", "ice cream", "jacket", "jail", "kangaroo", "key", "keyboard", "knee", "knife", "ladder", "lantern", "laptop", "leaf", "leg", "light bulb", "lighter", "lighthouse", "lightning", "line", "lion", "lipstick", "lobster", "lollipop", "mailbox", "map", "marker", "matches", "megaphone", "mermaid", "microphone", "microwave", "monkey", "moon", "mosquito", "motorbike", "mountain", "mouse", "moustache", "mouth", "mug", "mushroom", "nail", "necklace", "nose", "ocean", "octagon", "octopus", "onion", "oven", "owl", "paint can", "paintbrush", "palm tree", "panda", "pants", "paper clip", "parachute", "parrot", "passport", "peanut", "pear", "peas", "pencil", "penguin", "piano", "pickup truck", "picture frame", "pig", "pillow", "pineapple", "pizza", "pliers", "police car", "pond", "pool", "popsicle", "postcard", "potato", "power outlet", "purse", "rabbit", "raccoon", "radio", "rain", "rainbow", "rake", "remote control", "rhinoceros", "rifle", "river", "roller coaster", "rollerskates", "sailboat", "sandwich", "saw", "saxophone", "school bus", "scissors", "scorpion", "screwdriver", "sea turtle", "see saw", "shark", "sheep", "shoe", "shorts", "shovel", "sink", "skateboard", "skull", "skyscraper", "sleeping bag", "smiley face", "snail", "snake", "snorkel", "snowflake", "snowman", "soccer ball", "sock", "speedboat", "spider", "spoon", "spreadsheet", "square", "squiggle", "squirrel", "stairs", "star", "steak", "stereo", "stethoscope", "stitches", "stop sign", "stove", "strawberry", "streetlight", "string bean", "submarine", "suitcase", "sun", "swan", "sweater", "swing set", "sword", "syringe", "t-shirt", "table", "teapot", "teddy-bear", "telephone", "television", "tennis racquet", "tent", "The Eiffel Tower", "The Great Wall of China", "The Mona Lisa", "tiger", "toaster", "toe", "toilet", "tooth", "toothbrush", "toothpaste", "tornado", "tractor", "traffic light", "train", "tree", "triangle", "trombone", "truck", "trumpet", "umbrella", "underwear", "van", "vase", "violin", "washing machine", "watermelon", "waterslide", "whale", "wheel", "windmill", "wine bottle", "wine glass", "wristwatch", "yoga", "zebra", "zigzag"]

model_weights.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9451738bf2b8d46c28ce059e9020e65acccb1130123eceaf00e6083f3fb94c4
+size 798193

requirements.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ torch
2	+ json