Spaces:

HipFil98
/

Testa_di_Marianna

Running

App Files Files Community

HipFil98 commited on Feb 27

Commit

190fffe

verified ·

1 Parent(s): 9be43af

Update app.py

Browse files

Files changed (1) hide show

app.py +35 -9

app.py CHANGED Viewed

@@ -12,14 +12,14 @@ class MariannaBot:
         self.db_keys = [key.decode("utf-8") for key, value in self.database.items()]
         self.reset_state()
     def initialize_encoder(self):
         """
-        Inizializza il modello encoder e pre-calcola gli embedding delle chiavi del database.
-        Questo metodo dovrebbe essere chiamato una sola volta all'avvio del bot.
         """
         try:
             # Initialize the encoder model
-            encoder_model = "nickprock/sentence-bert-base-italian-uncased"
             cross_encoder_model = "nickprock/cross-encoder-italian-bert-stsb"
             self.encoder = SentenceTransformer(encoder_model)
             self.cross_encoder = CrossEncoder(cross_encoder_model)
@@ -63,7 +63,6 @@ class MariannaBot:
             if not legend_keys:
                 return "Mi dispiace, al momento non ho leggende da raccontare."
-            # Se abbiamo già raccontato tutte le storie, ricominciamo
             available_keys = [key for key in legend_keys if key.decode('utf-8') not in self.main_k]
             if not available_keys:
                 self.main_k = []  # Reset della lista delle storie raccontate
@@ -81,7 +80,7 @@ class MariannaBot:
         except Exception:
             self.state = "initial"
             self.is_telling_stories = False
-            return "Mi dispiace, c'è stato un problema. Vuoi provare con qualcos'altro? (sì/no)"
     def handle_query(self, message):
         """Handle user queries by searching the database"""
@@ -104,11 +103,38 @@ class MariannaBot:
             best_hit = reranked_hits[0]
             best_title = self.db_keys[best_hit['corpus_id']]
-            # Using your existing code for handling the best match
             if best_title is not None:
-                best_title_bytes = best_title.encode("utf-8")  # Converti la stringa in bytes
                 if best_title_bytes in self.database:
                     value = self.database[best_title_bytes]
@@ -138,7 +164,7 @@ class MariannaBot:
             if message in ["sì", "si"]:
                 self.state = "query"
                 self.is_telling_stories = False
-                return "Di cosa vorresti sapere?"
             elif message == "no":
                 self.state = "end"
                 return "Va bene, grazie per aver parlato con me."
@@ -195,7 +221,7 @@ def main():
             gr.Markdown("## Chat con Marianna - 'La Testa di Napoli'")
         with gr.Row():
-            gr.Image("marianna-102.jpeg",
                     elem_id="marianna-image",
                     width=250)

         self.db_keys = [key.decode("utf-8") for key, value in self.database.items()]
         self.reset_state()
     def initialize_encoder(self):
         """
+        Initialize encoder and cross-encoder model.
         """
         try:
             # Initialize the encoder model
+            encoder_model = "nickprock/sentence-bert-base-italian-xxl-uncased"
             cross_encoder_model = "nickprock/cross-encoder-italian-bert-stsb"
             self.encoder = SentenceTransformer(encoder_model)
             self.cross_encoder = CrossEncoder(cross_encoder_model)
             if not legend_keys:
                 return "Mi dispiace, al momento non ho leggende da raccontare."
             available_keys = [key for key in legend_keys if key.decode('utf-8') not in self.main_k]
             if not available_keys:
                 self.main_k = []  # Reset della lista delle storie raccontate
         except Exception:
             self.state = "initial"
             self.is_telling_stories = False
+            return "Mi dispiace, c'è stato un problema nel recuperare la storia. Vuoi provare con qualcos'altro? (sì/no)"
     def handle_query(self, message):
         """Handle user queries by searching the database"""
             best_hit = reranked_hits[0]
             best_title = self.db_keys[best_hit['corpus_id']]
+            best_score = best_hit['cross-score']
+            #print(best_title, best_score)
+            # Main treshold = 0.75
+            similarity_threshold = 0.75
+            # treshold granularity
+            if best_score < similarity_threshold:
+                # low confidence (< 0.35)
+                if best_score < 0.55:
+                    return "Mi dispiace, non ho informazioni su questo argomento. Puoi chiedermi di altro sulla città di Napoli."
+                # medium confidence(0.55 - 0.75)
+                else:
+                    alternative_hits = [self.db_keys[hit['corpus_id']] for hit in reranked_hits[:2]]
+                    suggestions = ", ".join(alternative_hits)
+                    best_title_bytes = best_title.encode("utf-8")
+                    if best_title_bytes in self.database:
+                        value = self.database[best_title_bytes]
+                        deserialized_value = pickle.loads(value)
+                        partial_info = deserialized_value.get('short_intro', deserialized_value['intro'].split('.')[0] + '.')
+                        self.state = "query"
+                        self.is_telling_stories = False
+                        return f"Potrei avere alcune informazioni su {best_title}, ma non sono completamente sicura sia ciò che stai cercando. I miei suggerimenti sono {suggestions}. \n\nCosa ti interessa?"
+                    else:
+                        return f"Ho trovato qualcosa su {best_title}, ma non sono completamente sicura. Vuoi saperne di più? (sì/no)"
+            # high confidence (above the threshold)
             if best_title is not None:
+                best_title_bytes = best_title.encode("utf-8")
                 if best_title_bytes in self.database:
                     value = self.database[best_title_bytes]
             if message in ["sì", "si"]:
                 self.state = "query"
                 self.is_telling_stories = False
+                return "Potresti dirmi di cosa vorresti sapere?"
             elif message == "no":
                 self.state = "end"
                 return "Va bene, grazie per aver parlato con me."
             gr.Markdown("## Chat con Marianna - 'La Testa di Napoli'")
         with gr.Row():
+            gr.Image("/home/filippo/Scrivania/Marianna_head/Marianna_testa/marianna-102.jpeg",
                     elem_id="marianna-image",
                     width=250)