Spaces:

MathieuGAL
/

NOVA_API

Running

App Files Files Community

MathieuGAL commited on Oct 19

Commit

bccf607

verified ·

1 Parent(s): 2063ded

Update app.py

Browse files

Files changed (1) hide show

app.py +42 -43

app.py CHANGED Viewed

@@ -13,27 +13,33 @@ from datetime import datetime
 # ======================================================================
 DATA_FILE_PATH = "data/QR.csv"
-CHROMA_DB_PATH = "data/bdd_ChromaDB"
 COLLECTION_NAME = "qr_data_dual_embeddings"
 Q_COLUMN_NAME = "Question"
 R_COLUMN_NAME = "Reponse"
 SYSTEM_PROMPT_PATH = "data/system_prompt.txt"
 SRC_CROSS_ENCODER = "models/mmarco-mMiniLMv2-L12-H384-v1"
 SRC_PARAPHRASE = "models/paraphrase-mpnet-base-v2"
 N_RESULTS_RETRIEVAL = 10
 N_RESULTS_RERANK = 3
-GEMINI_API_KEY = "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g"
 GEMINI_MODEL = "gemini-2.5-flash"
 MAX_CONVERSATION_HISTORY = 10
 # Configuration pour l'accès externe (host et port)
 API_HOST = '0.0.0.0'
-API_PORT = 1212
 # ======================================================================
 # VARIABLES GLOBALES
@@ -56,6 +62,7 @@ def load_models():
     """Charge les modèles SentenceTransformer et CrossEncoder."""
     print("⏳ Chargement des modèles...")
     try:
         cross_encoder = CrossEncoder(
             SRC_CROSS_ENCODER if os.path.exists(SRC_CROSS_ENCODER)
             else "cross-encoder/mmarco-mMiniLMv2-L12-H384-v1"
@@ -68,6 +75,7 @@ def load_models():
         return cross_encoder, paraphrase
     except Exception as e:
         print(f"❌ Erreur chargement modèles: {e}")
         raise
 def load_data():
@@ -94,19 +102,17 @@ def load_system_prompt():
             return f.read().strip()
     except FileNotFoundError:
         default = "Tu es un assistant utile et concis. Réponds à la requête de l'utilisateur."
-        print(f"⚠️ System prompt non trouvé. Utilisation du prompt par défaut.")
         return default
 def initialize_gemini_client():
     """Initialise le client Google Gemini."""
     try:
-        # NOTE: Using a placeholder key in the code. A real API key
-        # should be loaded from an environment variable or a secret.
-        if GEMINI_API_KEY == "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g":
-             print("⚠️ Clé Gemini par défaut. Assurez-vous d'utiliser une clé valide ou un secret.")
         return genai.Client(api_key=GEMINI_API_KEY)
     except Exception as e:
-        print(f"❌ Erreur Gemini: {e}")
         raise
 # ======================================================================
@@ -117,21 +123,24 @@ def setup_chromadb_collection(client, df, model_paraphrase):
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
     try:
         collection = client.get_or_create_collection(name=COLLECTION_NAME)
     except Exception as e:
-        print(f"❌ Erreur get/create collection ChromaDB: {e}")
         raise
     if collection.count() == total_docs and total_docs > 0:
-        print(f"✅ Collection déjà remplie ({collection.count()} docs).")
         return collection
     if total_docs == 0:
-        print("⚠️ DataFrame vide.")
         return collection
-    print(f"⏳ Remplissage de ChromaDB ({len(df)} lignes)...")
     docs, metadatas, ids = [], [], []
@@ -148,26 +157,16 @@ def setup_chromadb_collection(client, df, model_paraphrase):
         metadatas.append({**meta, "type": "reponse"})
         ids.append(f"id_{i}_R")
-    # --- Potentielle source d'erreur: Encodage ---
-    try:
-        embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
-    except Exception as e:
-        print(f"❌ Erreur d'encodage des documents pour ChromaDB: {e}")
-        raise
     try:
-        # Tentative de suppression et recréation pour forcer la mise à jour
         client.delete_collection(name=COLLECTION_NAME)
-    except Exception:
-        # Ignorer si la collection n'existe pas ou si la suppression échoue
         pass
-    try:
-        collection = client.get_or_create_collection(name=COLLECTION_NAME)
-        collection.add(embeddings=embeddings, documents=docs, metadatas=metadatas, ids=ids)
-    except Exception as e:
-        print(f"❌ Erreur d'ajout des données à la collection ChromaDB: {e}")
-        raise
     print(f"✅ Collection remplie: {collection.count()} documents.")
     return collection
@@ -226,8 +225,12 @@ def generate_rag_prompt(query_text, df_results, conversation_history):
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
-        for msg in conversation_history:
             role = "USER" if msg["role"] == "user" else "ASSISTANT"
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
@@ -258,6 +261,7 @@ def add_to_history(session_id, role, content):
     conversation_histories[session_id].append({"role": role, "content": content})
     if len(conversation_histories[session_id]) > MAX_CONVERSATION_HISTORY * 2:
         conversation_histories[session_id] = conversation_histories[session_id][-(MAX_CONVERSATION_HISTORY * 2):]
@@ -294,6 +298,7 @@ def get_answer(query_text, collection, model_paraphrase, model_cross_encoder, co
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
     return final_prompt
 # ======================================================================
@@ -308,32 +313,26 @@ def initialize_global_resources():
     print("⚙️  INITIALISATION RAG")
     print("="*50)
-    os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
-        # 1. Chargement des modèles, données et prompt
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
         system_prompt = load_system_prompt()
         gemini_client = initialize_gemini_client()
     except Exception:
-        # Si une erreur se produit ici (modèles/données), on ne continue pas.
         return False
     try:
-        # 2. Initialisation et configuration de ChromaDB
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
-        # Note : Le chemin doit être accessible en écriture
-        chroma_client = chromadb.PersistentClient(path=CHROMA_DB_PATH)
         collection = setup_chromadb_collection(chroma_client, df, model_paraphrase)
         print("✅ INITIALISATION COMPLÈTE\n")
         return True
     except Exception as e:
-        # 3. Gérer spécifiquement les erreurs ChromaDB
         print(f"❌ Erreur lors de l'initialisation de ChromaDB ou du remplissage: {e}")
-        # Pour les déploiements sur Hugging Face Spaces, vérifiez que 'data/bdd_ChromaDB'
-        # est accessible en écriture, ou essayez de le placer dans '/tmp/bdd_ChromaDB'.
         return False
 # ======================================================================
@@ -353,7 +352,7 @@ def api_status():
 def api_get_answer():
     """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
-        return jsonify({"error": "Ressources non chargées"}), 500
     try:
         data = request.get_json()
@@ -379,7 +378,7 @@ def api_get_answer():
         return jsonify({"generated_response": response})
     except Exception as e:
-        print(f"❌ Erreur: {e}")
         return jsonify({"error": str(e)}), 500
 @app.route('/api/clear_history', methods=['POST'])
@@ -416,10 +415,10 @@ if __name__ == '__main__':
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
-        print(f"💡 Pour un accès depuis l'extérieur, utilisez l'adresse IP publique de votre machine et assurez-vous que le port {API_PORT} est ouvert.")
         print("="*50 + "\n")
         # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:
-        print("❌ Impossible de démarrer le serveur")

 # ======================================================================
 DATA_FILE_PATH = "data/QR.csv"
+# CORRECTION CRITIQUE: Déplacement de la DB vers /tmp
+# Ce répertoire est le seul garanti en écriture sur Hugging Face Spaces.
+CHROMA_DB_PATH = "/tmp/bdd_ChromaDB"
 COLLECTION_NAME = "qr_data_dual_embeddings"
 Q_COLUMN_NAME = "Question"
 R_COLUMN_NAME = "Reponse"
 SYSTEM_PROMPT_PATH = "data/system_prompt.txt"
+# Les chemins des modèles sont conservés (ils se mettront en cache dans /tmp grâce au Dockerfile)
 SRC_CROSS_ENCODER = "models/mmarco-mMiniLMv2-L12-H384-v1"
 SRC_PARAPHRASE = "models/paraphrase-mpnet-base-v2"
 N_RESULTS_RETRIEVAL = 10
 N_RESULTS_RERANK = 3
+# Récupération de la clé depuis l'environnement (Hugging Face Secrets)
+# Si non trouvée, utilise la clé de placeholder.
+GEMINI_API_KEY = os.getenv("GEMINI_API_KEY", "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g")
 GEMINI_MODEL = "gemini-2.5-flash"
 MAX_CONVERSATION_HISTORY = 10
 # Configuration pour l'accès externe (host et port)
 API_HOST = '0.0.0.0'
+API_PORT = 1212 # Le port 1212 est conservé, il doit être configuré dans le README.md
 # ======================================================================
 # VARIABLES GLOBALES
     """Charge les modèles SentenceTransformer et CrossEncoder."""
     print("⏳ Chargement des modèles...")
     try:
+        # Tente de charger localement, sinon télécharge (le cache se fera dans /tmp)
         cross_encoder = CrossEncoder(
             SRC_CROSS_ENCODER if os.path.exists(SRC_CROSS_ENCODER)
             else "cross-encoder/mmarco-mMiniLMv2-L12-H384-v1"
         return cross_encoder, paraphrase
     except Exception as e:
         print(f"❌ Erreur chargement modèles: {e}")
+        # Note: L'erreur de PermissionError est maintenant gérée par le Dockerfile
         raise
 def load_data():
             return f.read().strip()
     except FileNotFoundError:
         default = "Tu es un assistant utile et concis. Réponds à la requête de l'utilisateur."
+        print(f"⚠️ System prompt non trouvé à {SYSTEM_PROMPT_PATH}. Utilisation du prompt par défaut.")
         return default
 def initialize_gemini_client():
     """Initialise le client Google Gemini."""
+    if GEMINI_API_KEY == "AIzaSyDXXY7uSXryTxZ51jQFsSLcPnC_Ivt9V1g":
+        print("⚠️ AVIS: Clé Gemini par défaut/placeholder détectée. Veuillez la remplacer par un secret d'environnement nommé 'GEMINI_API_KEY' pour la production.")
     try:
         return genai.Client(api_key=GEMINI_API_KEY)
     except Exception as e:
+        print(f"❌ Erreur lors de l'initialisation du client Gemini: {e}")
         raise
 # ======================================================================
     """Configure et remplit la collection ChromaDB."""
     total_docs = len(df) * 2
+    # S'assurer que le répertoire de la DB existe
+    os.makedirs(CHROMA_DB_PATH, exist_ok=True)
     try:
         collection = client.get_or_create_collection(name=COLLECTION_NAME)
     except Exception as e:
+        print(f"❌ Erreur lors de l'accès à la collection ChromaDB: {e}")
         raise
     if collection.count() == total_docs and total_docs > 0:
+        print(f"✅ Collection déjà remplie ({collection.count()} docs) dans {CHROMA_DB_PATH}.")
         return collection
     if total_docs == 0:
+        print("⚠️ DataFrame vide. Collection non remplie.")
         return collection
+    print(f"⏳ Remplissage de ChromaDB ({len(df)} lignes) à l'emplacement: {CHROMA_DB_PATH}...")
     docs, metadatas, ids = [], [], []
         metadatas.append({**meta, "type": "reponse"})
         ids.append(f"id_{i}_R")
+    embeddings = model_paraphrase.encode(docs, show_progress_bar=False).tolist()
+    # Nettoyage et recréation (pour le cas où les données CSV ont changé)
     try:
         client.delete_collection(name=COLLECTION_NAME)
+    except:
         pass
+    collection = client.get_or_create_collection(name=COLLECTION_NAME)
+    collection.add(embeddings=embeddings, documents=docs, metadatas=metadatas, ids=ids)
     print(f"✅ Collection remplie: {collection.count()} documents.")
     return collection
     history_str = ""
     if conversation_history:
         history_str = "HISTORIQUE:\n"
+        # Ajout du contexte pour le LLM, mais on ne veut pas l'historique complet
+        # On va limiter l'historique à l'affichage si on dépasse MAX_CONVERSATION_HISTORY
+        display_history = conversation_history[-(MAX_CONVERSATION_HISTORY * 2):]
+        for msg in display_history:
             role = "USER" if msg["role"] == "user" else "ASSISTANT"
+            # On utilise 'content' pour le texte du message
             history_str += f"{role}: {msg['content']}\n"
         history_str += "\n"
     conversation_histories[session_id].append({"role": role, "content": content})
+    # Limiter la taille de l'historique conservé en mémoire
     if len(conversation_histories[session_id]) > MAX_CONVERSATION_HISTORY * 2:
         conversation_histories[session_id] = conversation_histories[session_id][-(MAX_CONVERSATION_HISTORY * 2):]
     df_results = retrieve_and_rerank(query_text, collection, model_paraphrase, model_cross_encoder)
     final_prompt = generate_rag_prompt(query_text, df_results, conversation_history)
+    # On retourne le prompt final RAG pour référence, mais l'appel Gemini est fait après
     return final_prompt
 # ======================================================================
     print("⚙️  INITIALISATION RAG")
     print("="*50)
+    # Le répertoire /tmp est géré par la variable CHROMA_DB_PATH
     try:
         model_cross_encoder, model_paraphrase = load_models()
         df = load_data()
         system_prompt = load_system_prompt()
         gemini_client = initialize_gemini_client()
     except Exception:
+        # L'erreur est déjà print dans les fonctions de chargement
         return False
     try:
         print(f"⏳ Initialisation de ChromaDB à l'emplacement: {CHROMA_DB_PATH}")
+        # Le PersistentClient créera les fichiers dans le chemin spécifié (maintenant dans /tmp)
+        chroma_client = chromadb.PersistentClient(path=CHROMA_DB_PATH)
         collection = setup_chromadb_collection(chroma_client, df, model_paraphrase)
         print("✅ INITIALISATION COMPLÈTE\n")
         return True
     except Exception as e:
         print(f"❌ Erreur lors de l'initialisation de ChromaDB ou du remplissage: {e}")
         return False
 # ======================================================================
 def api_get_answer():
     """Endpoint principal pour obtenir une réponse."""
     if any(x is None for x in [model_cross_encoder, model_paraphrase, collection, system_prompt, gemini_client]):
+        return jsonify({"error": "Ressources non chargées. Veuillez vérifier les logs d'initialisation."}), 500
     try:
         data = request.get_json()
         return jsonify({"generated_response": response})
     except Exception as e:
+        print(f"❌ Erreur générale de l'API: {e}")
         return jsonify({"error": str(e)}), 500
 @app.route('/api/clear_history', methods=['POST'])
         print("🌐 SERVEUR DÉMARRÉ")
         print(f"✅ API accessible à l'URL (via l'interface réseau locale): http://{local_ip}:{API_PORT}")
         print(f"✅ Route Status: http://{local_ip}:{API_PORT}/status")
+        print(f"💡 N'oubliez pas de configurer 'app_port: 1212' et 'sdk: docker' dans votre README.md !")
         print("="*50 + "\n")
         # L'utilisation de host='0.0.0.0' dans app.run() permet l'accès depuis l'extérieur
         app.run(host=API_HOST, port=API_PORT, debug=False)
     else:
+        print("❌ Impossible de démarrer le serveur. Veuillez vérifier les logs pour les erreurs d'initialisation.")