test-inwi-cleverlytics-v11

Sleeping

App Files Files Community

abdelom commited on 11 days ago

Commit

f798c9d

verified ·

1 Parent(s): 063548c

Upload 7 files

Browse files

Files changed (8) hide show

.gitattributes +1 -0
Accueil.py +42 -0
Chatbot myinwi.xlsx +3 -0
README.md +1 -12
img/logo inwi celeverlytics.png +0 -0
pages/1_Chatbot_FR.py +304 -0
pages/2_Chatbot_AR.py +296 -0
requirements.txt +11 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+Chatbot[[:space:]]myinwi.xlsx filter=lfs diff=lfs merge=lfs -text

Accueil.py ADDED Viewed

	@@ -0,0 +1,42 @@

+import base64
+import streamlit as st
+from pathlib import Path
+def get_base64_of_bin_file(bin_file_path: str) -> str:
+    file_bytes = Path(bin_file_path).read_bytes()
+    return base64.b64encode(file_bytes).decode()
+def main():
+    st.set_page_config(page_title="INWI Chatbot - Accueil", layout="wide")
+    # Read local image and convert to Base64
+    img_base64 = get_base64_of_bin_file("./img/logo inwi celeverlytics.png")
+    css_logo = f"""
+    <style>
+    [data-testid="stSidebarNav"]::before {{
+        content: "";
+        display: block;
+        margin: 0 auto 20px auto;
+        width: 80%;
+        height: 100px;
+        background-image: url("data:image/png;base64,{img_base64}");
+        background-size: contain;
+        background-repeat: no-repeat;
+        background-position: center;
+    }}
+    </style>
+    """
+    st.markdown(css_logo, unsafe_allow_html=True)
+    st.title("👋 Bienvenue sur le Chatbot INWI")
+    st.markdown(
+        """
+        Ceci est la page principale.
+        Vous pouvez choisir le **Chatbot en Français** ou le **Chatbot en Arabe** en naviguant dans le menu de gauche (sous "Pages" ou "Select a page").
+        """
+    )
+    st.write("Veuillez sélectionner la langue désirée dans la barre latérale.")
+if __name__ == "__main__":
+    main()

Chatbot myinwi.xlsx ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:090d7da624e8a495525ff7f76b7ada897e30f91cbe3a8871f42532ef5e45a323
+size 435917

README.md CHANGED Viewed

@@ -1,12 +1 @@
----
-title: Test Inwi Cleverlytics V0
-emoji: 🚀
-colorFrom: green
-colorTo: blue
-sdk: streamlit
-sdk_version: 1.41.1
-app_file: app.py
-pinned: false
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference


1	+ Test du prompte chatbot inwi

img/logo inwi celeverlytics.png ADDED Viewed

pages/1_Chatbot_FR.py ADDED Viewed

	@@ -0,0 +1,304 @@

+import streamlit as st
+import pandas as pd
+import os
+from pathlib import Path
+import base64
+# LangChain & Hugging Face
+from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.vectorstores import Chroma
+from langchain.schema import Document
+from langchain.prompts import PromptTemplate
+from langchain.llms import HuggingFaceHub
+from langchain.chains import LLMChain
+import pysqlite3
+import sys
+sys.modules["sqlite3"] = pysqlite3
+#####################
+# 1. HELPER FUNCTIONS
+#####################
+def get_base64_of_bin_file(bin_file_path: str) -> str:
+    file_bytes = Path(bin_file_path).read_bytes()
+    return base64.b64encode(file_bytes).decode()
+def find_parent_fr(data, r, col):
+    """
+    Trouve la question parente pour une ligne et colonne donnée dans le DataFrame (version FR).
+    """
+    i = r - 1
+    parent = None
+    while i >= 0 and pd.isna(parent):
+        parent = data.iloc[i, col]
+        i -= 1
+    return parent
+def create_contextual_fr(df, category, strat_id=0):
+    """
+    Crée un DataFrame avec questions-réponses contextuelles (version FR).
+    """
+    rows = []
+    columns_qna = list(df.columns)
+    for r, row in df.iterrows():
+        for level, col in enumerate(df.columns):
+            question = row[col]
+            if pd.isna(question):
+                continue
+            # Si la question est un "leaf node"
+            if level == 4 or pd.isna(row[columns_qna[level + 1]]):
+                # Gérer des sous-questions multiples
+                if "\n*Si" in question or "\n *" in question or "\n*" in question:
+                    questions = question.replace("\n*Si", "\n*").replace("\n *", "\n*").split("\n*")
+                    for subquestion in questions:
+                        if len(subquestion.strip()) == 0:
+                            continue
+                        context = []
+                        for i in range(level - 1, -1, -1):
+                            parent = df.iloc[r, i]
+                            if pd.isna(parent):
+                                parent = find_parent_fr(df, r, i)
+                            if pd.notna(parent):
+                                context = [parent] + context
+                        rows.append({
+                            "id": strat_id + len(rows) + 1,
+                            "question": " > ".join(context),
+                            "answer": subquestion.strip(),
+                            "category": category,
+                        })
+                else:
+                    context = []
+                    for i in range(level - 1, -1, -1):
+                        parent = df.iloc[r, i]
+                        if pd.isna(parent):
+                            parent = find_parent_fr(df, r, i)
+                        if pd.notna(parent):
+                            context = [parent] + context
+                    rows.append({
+                        "id": strat_id + len(rows) + 1,
+                        "question": " > ".join(context),
+                        "answer": question.strip(),
+                        "category": category,
+                    })
+    return pd.DataFrame(rows)
+def load_excel_and_create_vectorstore_fr(excel_path: str, persist_dir: str = "./chroma_db_fr"):
+    """
+    Charge les données depuis plusieurs feuilles Excel (version FR),
+    construit & stocke un Chroma VectorStore.
+    """
+    # 1. Charger les feuilles Excel
+    qna_tree_fr0 = pd.read_excel(excel_path, sheet_name="Prépayé (FR)", skiprows=1).iloc[:, :5]
+    qna_tree_fr1 = pd.read_excel(excel_path, sheet_name="Postpayé (FR)", skiprows=1).iloc[:, :5]
+    qna_tree_fr2 = pd.read_excel(excel_path, sheet_name="Wifi (FR)",      skiprows=1).iloc[:, :5]
+    # 2. Construire le contexte
+    context_fr0 = create_contextual_fr(qna_tree_fr0, "Prépayé", strat_id = 0)
+    context_fr1 = create_contextual_fr(qna_tree_fr1, "Postpayé", strat_id = len(context_fr0))
+    context_fr2 = create_contextual_fr(qna_tree_fr2, "Wifi",     strat_id = len(context_fr0) + len(context_fr1))
+    # 3. Concaténer les DataFrame
+    context_fr = pd.concat([context_fr0, context_fr1, context_fr2], axis=0)
+    # 4. Créer une colonne "context"
+    context_fr["context"] = context_fr.apply(
+        lambda row: f"{row['question']} > {row['answer']}",
+        axis=1
+    )
+    # 5. Convertir chaque ligne en Document
+    documents_fr = [
+        Document(
+            page_content=row["context"],
+            metadata={"id": row["id"], "category": row["category"]}
+        )
+        for _, row in context_fr.iterrows()
+    ]
+    # 6. Créer & persister le vecteur
+    embedding_model_fr = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
+    vectorstore_fr = Chroma.from_documents(documents_fr, embedding_model_fr, persist_directory=persist_dir)
+    vectorstore_fr.persist()
+    return vectorstore_fr
+def load_existing_vectorstore_fr(persist_dir: str = "./chroma_db_fr"):
+    """
+    Charge un VectorStore Chroma déjà stocké (version FR).
+    """
+    embedding_model_fr = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
+    vectorstore_fr = Chroma(
+        persist_directory=persist_dir,
+        embedding_function=embedding_model_fr
+    )
+    return vectorstore_fr
+def retrieve_context_fr(retriever_fr, query, top_k=5):
+    """
+    Récupère les top_k résultats pour la question (version FR).
+    """
+    results_fr = retriever_fr.get_relevant_documents(query)
+    context_fr_list = []
+    for _, result in enumerate(results_fr[:top_k], start=1):
+        context_fr_list.append(result.page_content)
+    return context_fr_list
+#########################
+# 2. PROMPT & LLM FR   #
+#########################
+prompt_template_fr = PromptTemplate(
+    input_variables=["context", "query"],
+    template=(
+        """[SYSTEM]
+Vous êtes un assistant client professionnel, expérimenté et bienveillant pour l'opérateur téléphonique INWI.
+Vous excellez dans la gestion des clients, en répondant à leurs problèmes et questions.
+Fournir un service client et des conseils en se basant sur les contextes fournis :
+- Répondre aux salutations de manière courtoise et amicale, par exemple : "Je suis l'assistant IA d'INWI'. Comment puis-je vous aider aujourd'hui ?"
+- Identifier le besoin du client et demander des clarifications si nécessaire, tout en s'appuyant uniquement sur le contexte.
+- Si la question n'est pas liée au contexte d'INWI, veuillez informer poliment que vous ne pouvez pas répondre à des questions hors contexte INWI.
+- Si la réponse ne figure pas dans le contexte, vous pouvez dire "Je n'ai pas assez d'information" et proposer d'appeler le service client au 120.
+- Structurer les réponses de manière concise et efficace. Et n'inventez pas d'infos non présentes dans le contexte.
+- Informer le client qu’il peut vous recontacter pour toute assistance supplémentaire.
+- Ne parlez pas des concurrents qui offrent la meme service d'INWI.
+- Ne jamais insulter ou répondre à une insulte.
+- Ne demandez pas d’informations personnelles ou d’identification du client.
+- Orientez vers le catalogue sur le site web INWI si la question concerne une offre du catalogue.
+- Donnez des solutions standard pour les problèmes techniques avec des options.
+- Avant de générer votre réponse, éliminez toutes les structures comme '[Action] [texte]' et gardez uniquement les informations utiles.
+- Ne jamais parler des sujets suivants : [
+    "politique", "élections", "partis", "gouvernement", "lois", "réformes",
+    "religion", "croyances", "pratiques religieuses", "théologie",
+    "moralité", "débat", "philosophie", "éthique", "discrimination",
+    "concurrence", "Maroc Telecom", "IAM", "Orange", "comparaison",
+    "sécurité", "fraude", "santé", "médicaments", "traitement", "diagnostic", "maladie",
+    "finance", "investissement", "bourse", "crypto", "banque", "assurance",
+    "violence", "haine", "contenu explicite", "sexe", "adultes",
+    "illégal", "faux documents", "streaming illégal"
+]
+INWI est un opérateur de télécommunications marocain offrant des services mobiles, Internet et solutions de télécommunications
+pour les particuliers et les entreprises. Il se distingue par son engagement à fournir des services de qualité, innovants et
+accessibles, tout en contribuant au développement numérique du pays.
+Les clients sont notre priorité, et notre but est de résoudre leurs problèmes.
+Votre rôle est de fournir un service client professionnel et efficace sans inventer d'informations.
+[CONTEXTE]
+{context}
+[QUESTION DU CLIENT]
+{query}
+[RÉPONSE]"""
+    )
+)
+# Configuration du LLM HuggingFace (FR)
+os.environ["HUGGINGFACEHUB_API"]
+llm_fr = HuggingFaceHub(
+    repo_id="mistralai/Mistral-7B-Instruct-v0.3",
+    model_kwargs={
+        "temperature": 0.5,
+        "max_length": 500
+    }
+)
+# Chaîne FR
+llm_chain_fr = LLMChain(llm=llm_fr, prompt=prompt_template_fr)
+#########################
+# 3. STREAMLIT MAIN APP #
+#########################
+def main():
+    st.subheader("INWI IA Chatbot - Français")
+     # Read local image and convert to Base64
+    img_base64 = get_base64_of_bin_file("./img/logo inwi celeverlytics.png")
+    css_logo = f"""
+    <style>
+    [data-testid="stSidebarNav"]::before {{
+        content: "";
+        display: block;
+        margin: 0 auto 20px auto;
+        width: 80%;
+        height: 100px;
+        background-image: url("data:image/png;base64,{img_base64}");
+        background-size: contain;
+        background-repeat: no-repeat;
+        background-position: center;
+    }}
+    </style>
+    """
+    st.markdown(css_logo, unsafe_allow_html=True)
+    # Charger ou créer le retriever
+    if "retriever_fr" not in st.session_state:
+        st.session_state["retriever_fr"] = None
+    st.sidebar.header("Vector Store Options (FR)")
+    if st.sidebar.button("Créer la Vector Store (FR)"):
+        with st.spinner("Extraction et création de la vector store FR..."):
+            excel_path = "Chatbot myinwi.xlsx"
+            persist_directory_fr = "./chroma_db_fr"
+            vectorstore_fr = load_excel_and_create_vectorstore_fr(
+                excel_path=excel_path,
+                persist_dir=persist_directory_fr
+            )
+            st.session_state["retriever_fr"] = vectorstore_fr.as_retriever(
+                search_type="mmr",
+                search_kwargs={"k": 5, "lambda_mult": 0.5}
+            )
+        st.success("Vector store FR créée et chargée avec succès !")
+    if st.sidebar.button("Charger la Vector Store existante (FR)"):
+        with st.spinner("Chargement de la vector store FR existante..."):
+            persist_directory_fr = "./chroma_db_fr"
+            vectorstore_fr = load_existing_vectorstore_fr(persist_directory_fr)
+            st.session_state["retriever_fr"] = vectorstore_fr.as_retriever(
+                search_type="mmr",
+                search_kwargs={"k": 5, "lambda_mult": 0.5}
+            )
+        st.success("Vector store FR chargée avec succès !")
+    st.write("""Je suis là pour répondre à toutes vos questions concernant nos
+            services, nos offres mobiles et Internet, ainsi que nos solutions adaptées à vos besoins (FR).""")
+    # Zone de texte
+    user_query_fr = st.chat_input("Posez votre question ici (FR)...")
+    if user_query_fr:
+        if not st.session_state["retriever_fr"]:
+            st.warning("Veuillez d'abord créer ou charger la Vector Store (FR).")
+            return
+        # Récupération du contexte
+        context_fr_list = retrieve_context_fr(st.session_state["retriever_fr"], user_query_fr, top_k=5)
+        if context_fr_list:
+            with st.spinner("Génération de la réponse..."):
+                response_fr = llm_chain_fr.run({"context": "\n".join(context_fr_list), "query": user_query_fr})
+                # Séparer si jamais le prompt contient [RÉPONSE], sinon on affiche tout
+                response_fr = response_fr.split("[RÉPONSE]")[-1]
+            st.write("**Question :**")
+            st.write(user_query_fr)
+            st.write("**Réponse :**")
+            st.write(response_fr)
+        else:
+            st.write("Aucun contexte trouvé pour cette question. Essayez autre chose.")
+if __name__ == "__main__":
+    main()

pages/2_Chatbot_AR.py ADDED Viewed

	@@ -0,0 +1,296 @@

+import streamlit as st
+import pandas as pd
+import os
+from pathlib import Path
+import base64
+# LangChain & Hugging Face
+from langchain.embeddings import HuggingFaceEmbeddings
+from langchain.vectorstores import Chroma
+from langchain.schema import Document
+from langchain.prompts import PromptTemplate
+from langchain.llms import HuggingFaceHub
+from langchain.chains import LLMChain
+import pysqlite3
+import sys
+sys.modules["sqlite3"] = pysqlite3
+#####################
+# 1. HELPER FUNCTIONS
+#####################
+def get_base64_of_bin_file(bin_file_path: str) -> str:
+    file_bytes = Path(bin_file_path).read_bytes()
+    return base64.b64encode(file_bytes).decode()
+def find_parent_ar(data, r, col):
+    """
+     Trouve la question parente pour une ligne et colonne donnée dans le DataFrame (version AR).
+    """
+    i = r - 1
+    parent = None
+    while i >= 0 and pd.isna(parent):
+        parent = data.iloc[i, col]
+        i -= 1
+    return parent
+def create_contextual_ar(df, category, strat_id=0):
+    """
+    Crée un DataFrame avec questions-réponses contextuelles (version AR).
+    """
+    rows = []
+    columns_qna = list(df.columns)
+    for r, row in df.iterrows():
+        for level, col in enumerate(df.columns):
+            question = row[col]
+            if pd.isna(question):
+                continue
+            # Si la question est un "leaf node"
+            if level == 4 or pd.isna(row[columns_qna[level + 1]]):
+                # Gérer des sous-questions multiples
+                if "\n*Si" in question or "\n *" in question or "\n*" in question:
+                    questions = question.replace("\n*Si", "\n*").replace("\n *", "\n*").split("\n*")
+                    for subquestion in questions:
+                        if len(subquestion.strip()) == 0:
+                            continue
+                        context = []
+                        for i in range(level - 1, -1, -1):
+                            parent = df.iloc[r, i]
+                            if pd.isna(parent):
+                                parent = find_parent_ar(df, r, i)
+                            if pd.notna(parent):
+                                context = [parent] + context
+                        rows.append({
+                            "id": strat_id + len(rows) + 1,
+                            "question": " > ".join(context),
+                            "answer": subquestion.strip(),
+                            "category": category,
+                        })
+                else:
+                    context = []
+                    for i in range(level - 1, -1, -1):
+                        parent = df.iloc[r, i]
+                        if pd.isna(parent):
+                            parent = find_parent_ar(df, r, i)
+                        if pd.notna(parent):
+                            context = [parent] + context
+                    rows.append({
+                        "id": strat_id + len(rows) + 1,
+                        "question": " > ".join(context),
+                        "answer": question.strip(),
+                        "category": category,
+                    })
+    return pd.DataFrame(rows)
+def load_excel_and_create_vectorstore_ar(excel_path: str, persist_dir: str = "./chroma_db_ar"):
+    """
+    Charge les données depuis plusieurs feuilles Excel (version AR),
+    construit & stocke un Chroma VectorStore.
+    """
+    # 1. Charger les feuilles Excel
+    qna_tree_ar0 = pd.read_excel(excel_path, sheet_name="Prépayé (AR)", skiprows=1).iloc[:, :5]
+    qna_tree_ar1 = pd.read_excel(excel_path, sheet_name="Postpayé (AR)", skiprows=1).iloc[:, :5]
+    qna_tree_ar2 = pd.read_excel(excel_path, sheet_name="Wifi (AR)",      skiprows=1).iloc[:, :5]
+    # 2. Construire le contexte
+    context_ar0 = create_contextual_ar(qna_tree_ar0, "دفع مسبق", strat_id = 0)
+    context_ar1 = create_contextual_ar(qna_tree_ar1, "دفع لاحق", strat_id = len(context_ar0))
+    context_ar2 = create_contextual_ar(qna_tree_ar2, "واي فاي",   strat_id = len(context_ar0) + len(context_ar1))
+    # 3. Concaténer les DataFrame
+    context_ar = pd.concat([context_ar0, context_ar1, context_ar2], axis=0)
+    # 4. Créer une colonne "context"
+    context_ar["context"] = context_ar.apply(
+        lambda row: f"{row['question']} > {row['answer']}",
+        axis=1
+    )
+    # 5. Convertir chaque ligne en Document
+    documents_ar = [
+        Document(
+            page_content=row["context"],
+            metadata={"id": row["id"], "category": row["category"]}
+        )
+        for _, row in context_ar.iterrows()
+    ]
+    # 6. Créer & persister le vecteur
+    embedding_model_ar = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
+    vectorstore_ar = Chroma.from_documents(documents_ar, embedding_model_ar, persist_directory=persist_dir)
+    vectorstore_ar.persist()
+    return vectorstore_ar
+def load_existing_vectorstore_ar(persist_dir: str = "./chroma_db_ar"):
+    """
+    Charge un VectorStore Chroma déjà stocké (version AR).
+    """
+    embedding_model_ar = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
+    vectorstore_ar = Chroma(
+        persist_directory=persist_dir,
+        embedding_function=embedding_model_ar
+    )
+    return vectorstore_ar
+def retrieve_context_ar(retriever_ar, query, top_k=5):
+    """
+    Récupère les top_k résultats pour la question (version AR).
+    """
+    results_ar = retriever_ar.get_relevant_documents(query)
+    context_ar_list = []
+    for _, result in enumerate(results_ar[:top_k], start=1):
+        context_ar_list.append(result.page_content)
+    return context_ar_list
+#########################
+# 2. PROMPT & LLM (AR) #
+#########################
+prompt_template_ar = PromptTemplate(
+    input_variables=["context", "query"],
+    template=(
+        """[SYSTEM]
+أنت مساعد لخدمة عملاء INWI، محترف وخبير ومتعاون. تتقن التعامل مع استفسارات ومشاكل العملاء.
+استند فقط إلى المعلومات المتوفرة في السياقات التالية دون اختراع معلومات غير موجودة:
+- استخدم تحية مهذبة وودّية، على سبيل المثال: "مرحباً، أنا المساعد الذكي من إنوي. كيف يمكنني خدمتك اليوم؟"
+- تعرّف على احتياج العميل واطلب التوضيح إذا لزم الأمر بالاعتماد على المعلومات المتوفرة فقط.
+- إن لم يكن السؤال ضمن سياق إنوي، أخبر العميل بلطف أنك غير قادر على الإجابة خارج سياق إنوي.
+- إذا لم تجد إجابة واضحة في السياق، يمكنك إبلاغ العميل بعدم توفر المعلومات واقتراح الاتصال بخدمة العملاء على الرقم 120.
+- احرص على أن تكون ردودك موجزة وفعالة. وتجنّب اختلاق أي تفاصيل غير موجودة في السياق.
+- أخبر العميل بأنه يمكنه التواصل معك مجدداً لمزيد من المساعدة.
+- لا تتحدث عن المنافسين الذين يقدمون نفس خدمات إنوي.
+- امتنع تماماً عن أي إهانة أو رد على إهانة.
+- لا تطلب أي معلومات شخصية أو هوية العميل.
+- وجّه العميل إلى كتالوج موقع إنوي إذا كان سؤاله يتعلق بعروض من الكتالوج.
+- قدّم حلولاً قياسية للمشكلات التقنية مع عرض الخيارات المتاحة.
+- قبل إرسال الجواب، تجنب أي تنسيق مثل "[Action] [نص]" واحتفظ فقط بالمعلومات المفيدة.
+- لا تتحدث عن المواضيع التالية إطلاقاً: [
+    "السياسة", "الانتخابات", "الأحزاب", "الحكومة", "القوانين", "الإصلاحات",
+    "الدين", "العقائد", "الممارسات الدينية", "علم اللاهوت",
+    "الأخلاق", "الجدل", "الفلسفة", "المعايير", "التمييز",
+    "المنافسة", "مقارنة إنوي مع شركات أخرى",
+    "الأمن", "الاحتيال", "الصحة", "الأدوية", "التشخيص الطبي",
+    "التمويل", "الاستثمار", "البورصة", "العملات الرقمية", "البنوك", "التأمين",
+    "العنف", "الكراهية", "المحتوى الفاضح", "الجنس",
+    "المخالفات القانونية", "الوثائق المزورة", "البث غير الشرعي"
+]
+إنوي (INWI) هي شركة اتصالات مغربية تقدم خدمات الهاتف المحمول والإنترنت وحلول الاتصالات للأفراد والشركات.
+تتميز بالتزامها بتوفير خدمات عالية الجودة ومبتكرة، والمساهمة في التطور الرقمي في المغرب.
+العملاء هم أولويتنا، وهدفنا مساعدتهم وحل مشاكلهم.
+دورك هو تقديم خدمة عملاء احترافية وفعالة بدون اختراع معلومات من خارج السياق.
+[السياق]
+{context}
+[سؤال العميل]
+{query}
+[الإجابة]"""
+    )
+)
+# Configuration du LLM HuggingFace (AR)
+os.environ["HUGGINGFACEHUB_API_TOKEN"]
+llm_ar = HuggingFaceHub(
+    repo_id="MBZUAI-Paris/Atlas-Chat-9B",
+    model_kwargs={
+        "temperature": 0.5,
+        "max_length": 500
+    }
+)
+# Chaîne AR
+llm_chain_ar = LLMChain(llm=llm_ar, prompt=prompt_template_ar)
+#########################
+# 3. STREAMLIT MAIN APP #
+#########################
+def main():
+    st.subheader("INWI IA Chatbot - Arabe")
+     # Read local image and convert to Base64
+    img_base64 = get_base64_of_bin_file("./img/logo inwi celeverlytics.png")
+    css_logo = f"""
+    <style>
+    [data-testid="stSidebarNav"]::before {{
+        content: "";
+        display: block;
+        margin: 0 auto 20px auto;
+        width: 80%;
+        height: 100px;
+        background-image: url("data:image/png;base64,{img_base64}");
+        background-size: contain;
+        background-repeat: no-repeat;
+        background-position: center;
+    }}
+    </style>
+    """
+    st.markdown(css_logo, unsafe_allow_html=True)
+    if "retriever_ar" not in st.session_state:
+        st.session_state["retriever_ar"] = None
+    st.sidebar.subheader("Vector Store Options (AR)")
+    if st.sidebar.button("Créer la Vector Store (AR)"):
+        with st.spinner("Extraction et création de la vector store AR..."):
+            excel_path = "Chatbot myinwi.xlsx"
+            persist_directory_ar = "./chroma_db_ar"
+            vectorstore_ar = load_excel_and_create_vectorstore_ar(
+                excel_path=excel_path,
+                persist_dir=persist_directory_ar
+            )
+            st.session_state["retriever_ar"] = vectorstore_ar.as_retriever(
+                search_type="mmr",
+                search_kwargs={"k": 5, "lambda_mult": 0.5}
+            )
+        st.success("Vector store FR créée et chargée avec succès !")
+    if st.sidebar.button("Charger la Vector Store existante (AR)"):
+        with st.spinner("Chargement de la vector store FR existante..."):
+            persist_directory_ar = "./chroma_db_ar"
+            vectorstore_ar = load_existing_vectorstore_ar(persist_directory_ar)
+            st.session_state["retriever_ar"] = vectorstore_ar.as_retriever(
+                search_type="mmr",
+                search_kwargs={"k": 5, "lambda_mult": 0.5}
+            )
+        st.success("Vector store AR chargée avec succès !")
+    st.write("""مرحباً! أنا هنا للإجابة على جميع أسئلتك المتعلقة بخدمات إنوي
+            وعروض الهاتف المحمول والإنترنت، وأي حلول أخرى قد تناسب احتياجاتك (AR).""")
+    user_query_ar = st.chat_input("Posez votre question ici (AR)...")
+    if user_query_ar:
+        if not st.session_state["retriever_ar"]:
+            st.warning("Veuillez d'abord créer ou charger la Vector Store (AR).")
+            return
+        # Récupération du contexte
+        context_ar_list = retrieve_context_ar(st.session_state["retriever_ar"], user_query_ar, top_k=5)
+        if context_ar_list:
+            with st.spinner("Génération de la réponse..."):
+                response_ar = llm_chain_ar.run({"context": "\n".join(context_ar_list), "query": user_query_ar})
+                response_ar = response_ar.split("[الإجابة]")[-1]
+            st.write("**سؤال العميل:**")
+            st.write(user_query_ar)
+            st.write("**الإجابة:**")
+            st.write(response_ar)
+        else:
+            st.write("Aucun contexte trouvé pour cette question. Essayez autre chose.")
+if __name__ == "__main__":
+    main()

requirements.txt ADDED Viewed

	@@ -0,0 +1,11 @@

+streamlit
+pandas
+langchain
+huggingface_hub
+torch
+langchain_community
+openpyxl
+sentence_transformers
+pysqlite3-binary
+chromadb==0.4.0
+langchain-chroma==0.1.4