Spaces:

NLP2425
/

NewDemo

Sleeping

App Files Files Community

Icarevic commited on Jun 8

Commit

5bf80cd

verified ·

1 Parent(s): b3ab79e

Update app.py

Browse files

Files changed (1) hide show

app.py +36 -46

app.py CHANGED Viewed

@@ -8,16 +8,12 @@ from transformers import AutoTokenizer, AutoModelForSequenceClassification
 print("Pokrećem aplikaciju...")
-# --- Učitavanje SVM pipelinea ---
-print("Učitavam SVM pipeline...")
 svm_pipeline = joblib.load("svm_pipeline.pkl")
-# --- Učitavanje riječnika za CNN i GRU ---
-print("Učitavam riječnik...")
 with open("word2idx.json", "r", encoding="utf-8") as f:
     word2idx = json.load(f)
-# --- Definicija CNN modela ---
 class CNNModel(nn.Module):
     def __init__(self, vocab_size, embed_dim=300, num_classes=3, kernel_sizes=[3,4,5], num_filters=128):
         super(CNNModel, self).__init__()
@@ -27,7 +23,6 @@ class CNNModel(nn.Module):
         ])
         self.dropout = nn.Dropout(0.5)
         self.fc = nn.Linear(num_filters * len(kernel_sizes), num_classes)
     def forward(self, x):
         x = self.embedding(x).unsqueeze(1)
         convs = [F.relu(conv(x)).squeeze(3) for conv in self.convs]
@@ -36,124 +31,119 @@ class CNNModel(nn.Module):
         x = self.dropout(x)
         return self.fc(x)
-# --- Definicija GRU modela ---
 class GRUModel(nn.Module):
     def __init__(self, vocab_size, embed_dim=300, hidden_dim=256, num_layers=1, num_classes=3):
         super(GRUModel, self).__init__()
         self.embedding = nn.Embedding(vocab_size, embed_dim, padding_idx=0)
         self.gru = nn.GRU(embed_dim, hidden_dim, num_layers=num_layers, batch_first=True)
         self.fc = nn.Linear(hidden_dim, num_classes)
     def forward(self, x):
         x = self.embedding(x)
         _, h_n = self.gru(x)
         out = self.fc(h_n[-1])
         return out
-# --- Učitavanje CNN i GRU modela ---
 vocab_size = len(word2idx) + 1
 embed_dim = 300
 num_classes = 3
-print("Učitavam CNN model...")
 cnn_model = CNNModel(vocab_size, embed_dim, num_classes)
 cnn_model.load_state_dict(torch.load("cnn_model.pt", map_location=torch.device('cpu')))
 cnn_model.eval()
-print("Učitavam GRU model...")
 gru_model = GRUModel(vocab_size, embed_dim, hidden_dim=256, num_layers=1, num_classes=num_classes)
 gru_model.load_state_dict(torch.load("gru_model.pt", map_location=torch.device('cpu')))
 gru_model.eval()
-# --- Učitavanje BERTić modela i tokenizer ---
-print("Učitavam BERTić model i tokenizer...")
 bert_tokenizer = AutoTokenizer.from_pretrained("my_finetuned_model")
 bert_model = AutoModelForSequenceClassification.from_pretrained("my_finetuned_model")
 bert_model.eval()
-# --- Rječnik za mapiranje oznaka ---
 label_names = {0: 'pozitivno', 1: 'neutralno', 2: 'negativno'}
-# --- Pretvaranje teksta u indekse za CNN i GRU ---
 def text_to_indices(text, max_len=100):
     tokens = text.lower().split()
-    print(f"Tokeni: {tokens}")
     indices = [word2idx.get(token, 0) for token in tokens]
-    print(f"Indeksi: {indices}")
     if len(indices) < max_len:
         indices += [0] * (max_len - len(indices))
     else:
         indices = indices[:max_len]
     tensor = torch.tensor([indices], dtype=torch.long)
-    print(f"Tensor shape: {tensor.shape}")
     return tensor
-# --- Funkcije za predikciju ---
 def predict_svm(text):
-    print(f"Predikcija SVM za tekst: {text}")
     proba = svm_pipeline.predict_proba([text])[0]
     pred = svm_pipeline.classes_[proba.argmax()]
-    print(f"SVM predikcija: {pred}, povjerenje: {proba.max():.2f}")
     return f"{label_names[pred]} (p={proba.max():.2f})"
 def predict_cnn(text):
-    print(f"Predikcija CNN za tekst: {text}")
     with torch.no_grad():
         inputs = text_to_indices(text)
         outputs = cnn_model(inputs)
-        print(f"CNN output: {outputs}")
         probs = F.softmax(outputs, dim=1)
         pred = torch.argmax(probs, dim=1).item()
         confidence = probs[0][pred].item()
-    print(f"CNN predikcija: {pred}, povjerenje: {confidence:.2f}")
     return f"{label_names[pred]} (p={confidence:.2f})"
 def predict_gru(text):
-    print(f"Predikcija GRU za tekst: {text}")
     with torch.no_grad():
         inputs = text_to_indices(text)
         outputs = gru_model(inputs)
-        print(f"GRU output: {outputs}")
         probs = F.softmax(outputs, dim=1)
         pred = torch.argmax(probs, dim=1).item()
         confidence = probs[0][pred].item()
-    print(f"GRU predikcija: {pred}, povjerenje: {confidence:.2f}")
     return f"{label_names[pred]} (p={confidence:.2f})"
 def predict_bert(text):
-    print(f"Predikcija BERTić za tekst: {text}")
     inputs = bert_tokenizer(text, return_tensors="pt", truncation=True, padding=True)
     with torch.no_grad():
         outputs = bert_model(**inputs)
-        print(f"BERTić output logits: {outputs.logits}")
         probs = F.softmax(outputs.logits, dim=1)
         pred = torch.argmax(probs, dim=1).item()
         confidence = probs[0][pred].item()
-    print(f"BERTić predikcija: {pred}, povjerenje: {confidence:.2f}")
     return f"{label_names[pred]} (p={confidence:.2f})"
-# --- Gradio sučelje ---
 def predict_all(text):
     return (
         predict_svm(text),
         predict_cnn(text),
         predict_gru(text),
-        predict_bert(text)
     )
-demo = gr.Interface(
-    fn=predict_all,
-    inputs=gr.Textbox(lines=3, placeholder="Upiši tekst za klasifikaciju..."),
-    outputs=[
-        gr.Textbox(label="SVM (RBF)"),
-        gr.Textbox(label="CNN"),
-        gr.Textbox(label="GRU"),
-        gr.Textbox(label="BERTić")
-    ],
-    title="Demo klasifikacije teksta",
-    description="Predikcije koriste SVM, CNN, GRU i BERTić modele."
-)
 if __name__ == "__main__":
-    demo.launch(share=True, debug=True)

 print("Pokrećem aplikaciju...")
+# --- Učitavanje modela i riječnika ---
 svm_pipeline = joblib.load("svm_pipeline.pkl")
 with open("word2idx.json", "r", encoding="utf-8") as f:
     word2idx = json.load(f)
 class CNNModel(nn.Module):
     def __init__(self, vocab_size, embed_dim=300, num_classes=3, kernel_sizes=[3,4,5], num_filters=128):
         super(CNNModel, self).__init__()
         ])
         self.dropout = nn.Dropout(0.5)
         self.fc = nn.Linear(num_filters * len(kernel_sizes), num_classes)
     def forward(self, x):
         x = self.embedding(x).unsqueeze(1)
         convs = [F.relu(conv(x)).squeeze(3) for conv in self.convs]
         x = self.dropout(x)
         return self.fc(x)
 class GRUModel(nn.Module):
     def __init__(self, vocab_size, embed_dim=300, hidden_dim=256, num_layers=1, num_classes=3):
         super(GRUModel, self).__init__()
         self.embedding = nn.Embedding(vocab_size, embed_dim, padding_idx=0)
         self.gru = nn.GRU(embed_dim, hidden_dim, num_layers=num_layers, batch_first=True)
         self.fc = nn.Linear(hidden_dim, num_classes)
     def forward(self, x):
         x = self.embedding(x)
         _, h_n = self.gru(x)
         out = self.fc(h_n[-1])
         return out
 vocab_size = len(word2idx) + 1
 embed_dim = 300
 num_classes = 3
 cnn_model = CNNModel(vocab_size, embed_dim, num_classes)
 cnn_model.load_state_dict(torch.load("cnn_model.pt", map_location=torch.device('cpu')))
 cnn_model.eval()
 gru_model = GRUModel(vocab_size, embed_dim, hidden_dim=256, num_layers=1, num_classes=num_classes)
 gru_model.load_state_dict(torch.load("gru_model.pt", map_location=torch.device('cpu')))
 gru_model.eval()
 bert_tokenizer = AutoTokenizer.from_pretrained("my_finetuned_model")
 bert_model = AutoModelForSequenceClassification.from_pretrained("my_finetuned_model")
 bert_model.eval()
 label_names = {0: 'pozitivno', 1: 'neutralno', 2: 'negativno'}
 def text_to_indices(text, max_len=100):
     tokens = text.lower().split()
     indices = [word2idx.get(token, 0) for token in tokens]
     if len(indices) < max_len:
         indices += [0] * (max_len - len(indices))
     else:
         indices = indices[:max_len]
     tensor = torch.tensor([indices], dtype=torch.long)
     return tensor
 def predict_svm(text):
     proba = svm_pipeline.predict_proba([text])[0]
     pred = svm_pipeline.classes_[proba.argmax()]
     return f"{label_names[pred]} (p={proba.max():.2f})"
 def predict_cnn(text):
     with torch.no_grad():
         inputs = text_to_indices(text)
         outputs = cnn_model(inputs)
         probs = F.softmax(outputs, dim=1)
         pred = torch.argmax(probs, dim=1).item()
         confidence = probs[0][pred].item()
     return f"{label_names[pred]} (p={confidence:.2f})"
 def predict_gru(text):
     with torch.no_grad():
         inputs = text_to_indices(text)
         outputs = gru_model(inputs)
         probs = F.softmax(outputs, dim=1)
         pred = torch.argmax(probs, dim=1).item()
         confidence = probs[0][pred].item()
     return f"{label_names[pred]} (p={confidence:.2f})"
 def predict_bert(text):
     inputs = bert_tokenizer(text, return_tensors="pt", truncation=True, padding=True)
     with torch.no_grad():
         outputs = bert_model(**inputs)
         probs = F.softmax(outputs.logits, dim=1)
         pred = torch.argmax(probs, dim=1).item()
         confidence = probs[0][pred].item()
     return f"{label_names[pred]} (p={confidence:.2f})"
 def predict_all(text):
     return (
         predict_svm(text),
         predict_cnn(text),
         predict_gru(text),
+        predict_bert(text),
+    )
+def clear_all():
+    return "", "", "", "", ""
+with gr.Blocks() as demo:
+    # Naslov veći, centriran
+    gr.Markdown(
+        """
+        <h1 style="text-align: center; font-size: 48px; margin-bottom: 5px;">Analiza sentimenta</h1>
+        <p style="text-align: center; font-size: 16px; margin-top: 0;">Predikcije koriste SVM, CNN, GRU i BERTić modele.</p>
+        """,
+        elem_id="naslov"
     )
+    input_text = gr.Textbox(lines=3, label="Unesite rečenicu za analizu:")
+    with gr.Row():
+        submit_btn = gr.Button("Submit", variant="primary")
+        clear_btn = gr.Button("Clear", variant="secondary")
+    with gr.Row():
+        with gr.Column():
+            gr.Markdown("### Machine Learning")
+            svm_output = gr.Textbox(label="SVM (RBF)")
+        with gr.Column():
+            gr.Markdown("### Deep Learning")
+            cnn_output = gr.Textbox(label="CNN")
+            gru_output = gr.Textbox(label="GRU")
+        with gr.Column():
+            gr.Markdown("### Transformers")
+            bert_output = gr.Textbox(label="BERTić")
+    submit_btn.click(fn=predict_all, inputs=input_text, outputs=[svm_output, cnn_output, gru_output, bert_output])
+    clear_btn.click(fn=clear_all, inputs=None, outputs=[input_text, svm_output, cnn_output, gru_output, bert_output])
 if __name__ == "__main__":
+    demo.launch(share=True)