Spaces:

MarcdeFalco
/

codeeducrag

Sleeping

File size: 5,440 Bytes

import gradio as gr
from huggingface_hub import login, InferenceClient
import os
from langchain_community.vectorstores import FAISS
from langchain_community.embeddings import HuggingFaceEmbeddings
import umap
import pandas as pd

HF_TOKEN = os.getenv("HUGGINGFACE_TOKEN")

login(token=HF_TOKEN)
client = InferenceClient(token=HF_TOKEN)


embeddings = HuggingFaceEmbeddings(model_name="OrdalieTech/Solon-embeddings-large-0.1")

db_code = FAISS.load_local("faiss_code_education",
        embeddings,
        allow_dangerous_deserialization=True)

reducer = umap.UMAP()
index = db_code.index
ntotal = min(index.ntotal, 4998)
embeds = index.reconstruct_n(0, ntotal)
umap_embeds = reducer.fit_transform(embeds)

articles_df = pd.DataFrame({
    "x" : umap_embeds[:,0],
    "y" : umap_embeds[:,1],
    "type" : [ "Source" ] * len(umap_embeds),
})

system_prompt = """Tu es un assistant juridique spécialisé dans le Code de l'éducation français. 
Ta mission est d'aider les utilisateurs à comprendre la législation en répondant à leurs questions.

Voici comment tu dois procéder :

1. **Analyse de la question:** Lis attentivement la question de l'utilisateur.
2. **Identification des articles pertinents:** Examine les 10 articles de loi fournis et sélectionne ceux qui sont les plus pertinents pour répondre à la question.
3. **Formulation de la réponse:** Rédige une réponse claire et concise en français, en utilisant les informations des articles sélectionnés. Cite explicitement les articles que tu utilises (par exemple, "Selon l'article L311-3...").
4. **Structure de la réponse:** Si ta réponse s'appuie sur plusieurs articles, structure-la de manière logique, en séparant les informations provenant de chaque article.
5. **Cas ambigus:** 
* Si la question est trop vague, demande des précisions à l'utilisateur.
* Si plusieurs articles pourraient s'appliquer, présente les différentes interprétations possibles."""


def query_rag(query, model, system_prompt):
    docs = db_code.similarity_search(query, 10)

    article_dict = {}
    context_list = []
    for doc in docs:
        article = doc.metadata
        context_list.append(' > '.join(article['chemin'])+'\n'+article['texte']+'\n---\n')
        article_dict[article['article']] = article

    user = 'Question de l\'utilisateur : ' + query + '\nContexte législatif :\n' + '\n'.join(context_list)

    messages = [ { "role" : "system", "content" : system_prompt } ]
    messages.append( { "role" : "user", "content" : user } )

    if "factice" in model:
        return user, article_dict

    chat_completion = client.chat_completion(
        messages=messages,
        model=model,
        max_tokens=1024)

    return chat_completion.choices[0].message.content, article_dict

def create_context_response(response, article_dict):
    context = '\n'
    for i, article in enumerate(article_dict):
        art = article_dict[article]
        context += '* **' + ' > '.join(art['chemin']) + '** : '+ art['texte'].replace('\n', '\n    ')+'\n'
    return context

def chat_interface(query, model, system_prompt):
    response, article_dict = query_rag(query, model, system_prompt)
    context = create_context_response(response, article_dict)
    return response, context

def update_plot(query):
    query_embed = embeddings.embed_documents([query])[0]
    query_umap_embed = reducer.transform([query_embed])
    
    data = {
        "x": umap_embeds[:, 0].tolist() + [query_umap_embed[0, 0]],
        "y": umap_embeds[:, 1].tolist() + [query_umap_embed[0, 1]],
        "type": ["Source"] * len(umap_embeds) + ["Requête"]
    }
    return pd.DataFrame(data)

with gr.Blocks(title="Assistant Juridique pour le Code de l'éducation (Beta)") as demo:
    gr.Markdown(
        """
        ## Posez vos questions sur le Code de l'éducation
        
        **Créé par Marc de Falco**

        **Avertissement :** Les informations fournies sont données à titre indicatif et ne constituent pas un avis juridique. Les serveurs étant publics, veuillez ne pas inclure de données sensibles.
        """
    )

    query_box = gr.Textbox(label="Votre question")

    model = gr.Dropdown(
        label="Modèle de langage",
        choices=[
            "meta-llama/Meta-Llama-3-70B-Instruct",
            "meta-llama/Meta-Llama-3-8B-Instruct",
            "HuggingFaceH4/zephyr-7b-beta",
            "NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO",
            "mistralai/Mixtral-8x22B-v0.1",
            "factice: question+contexte"
            ],
        value="meta-llama/Meta-Llama-3-70B-Instruct")

    submit_button = gr.Button("Envoyer")

    with gr.Tab(label="Réponse"):
        response_box = gr.Markdown()
    with gr.Tab(label="Sources"):
        sources_box = gr.Markdown()
    with gr.Tab(label="Visualisation"):
        scatter_plot = gr.ScatterPlot(articles_df,
                x = "x", y = "y",
                color="type",
                label="Visualisation des embeddings",
                width=500,
                height=500)
    with gr.Tab(label="Paramètres"):
        system_box = gr.Textbox(label="Invite systeme", value=system_prompt,
                                lines=20)

    submit_button.click(chat_interface, 
                inputs=[query_box, model, system_box], 
                outputs=[response_box, sources_box])
    submit_button.click(update_plot, inputs=[query_box], outputs=[scatter_plot])

demo.launch()