File size: 21,162 Bytes
f93e0d7 fd3bbca f93e0d7 089cebf f93e0d7 fd3bbca f93e0d7 8f371b4 fd3bbca f93e0d7 fd3bbca 8f371b4 fd3bbca f93e0d7 fd3bbca f93e0d7 8f371b4 f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca f93e0d7 fd3bbca |
|
# -*- coding: utf-8 -*-
# === Imports ===
import gradio as gr
import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer, pipeline
from datetime import datetime
import os
import json
import logging
from huggingface_hub import login
import requests
from bs4 import BeautifulSoup
from concurrent.futures import ThreadPoolExecutor
import re
os.environ['PYTORCH_CUDA_ALLOC_CONF'] = expandable_segments:True
# --- Configuration du logger ---
logging.basicConfig(
level=logging.INFO,
format="%(asctime)s - %(levelname)s - %(message)s",
handlers=[
logging.FileHandler("project.log"),
logging.StreamHandler()
]
)
# --- Authentification Hugging Face ---
# Assurez-vous que la variable d'environnement HF_TOKEN est définie avec votre token Hugging Face
# Sinon, vous pouvez la définir directement ici
# os.environ["HF_TOKEN"] = "votre_token_huggingface"
login(token=os.environ["HF_TOKEN"])
# === Chargement des modèles ===
# AgentManager
manager_model_name = "meta-llama/Llama-3.1-8B-Instruct"
manager_model = AutoModelForCausalLM.from_pretrained(
manager_model_name,
device_map="auto",
torch_dtype=torch.bfloat16 # Utilisation de bfloat16 comme recommandé
)
manager_tokenizer = AutoTokenizer.from_pretrained(manager_model_name)
# AgentResearcher
researcher_model_name = "hiieu/Meta-Llama-3-8B-Instruct-function-calling-json-mode"
researcher_model = AutoModelForCausalLM.from_pretrained(
researcher_model_name,
torch_dtype=torch.bfloat16, # Utilisation de bfloat16 comme recommandé
device_map="auto",
)
researcher_tokenizer = AutoTokenizer.from_pretrained(researcher_model_name)
# AgentAnalyzer
analyzer_model_name = "jpacifico/Chocolatine-3B-Instruct-DPO-Revised"
analyzer_model = AutoModelForCausalLM.from_pretrained(
analyzer_model_name,
device_map="auto",
torch_dtype=torch.float16
)
analyzer_tokenizer = AutoTokenizer.from_pretrained(analyzer_model_name)
# AgentCoder
coder_model_name = "Qwen/Qwen2.5-Coder-7B-Instruct"
coder_model = AutoModelForCausalLM.from_pretrained(
coder_model_name,
torch_dtype="auto",
device_map="auto"
)
coder_tokenizer = AutoTokenizer.from_pretrained(coder_model_name)
# === Variables Globales ===
project_state = {
"AgentManager": {"structured_summary": None},
"AgentResearcher": {"search_results": None},
"AgentAnalyzer": {"analysis_report": None, "instruction_for_coder": None},
"AgentCoder": {"final_code": None}
}
# --- Prompts prédéfinis ---
manager_prompt_template = """
Vous êtes l'AgentManager d'un système multi-agent.
- Votre rôle est d'interagir avec l'utilisateur pour comprendre sa demande.
- Vous devez poser des questions pertinentes pour obtenir toutes les informations nécessaires.
- Une fois que vous estimez avoir suffisamment d'informations, vous générez un résumé structuré du projet.
- Vous incluez les informations des variables du projet si elles ne sont pas vides.
- Vous demandez une validation explicite à l'utilisateur pour le résumé généré.
- Vous pouvez modifier les variables du projet si l'utilisateur en fait la demande.
Variables du projet :
{variables_context}
"""
researcher_prompt_template = """
System: Vous êtes un assistant de recherche. Vos tâches sont :
1. Basé sur le résumé structuré suivant :
{structured_summary}
2. Effectuer des recherches dans la documentation Gradio en ligne.
3. Extraire des extraits de code ou des exemples utiles.
4. Formater clairement les résultats pour validation.
Format de sortie :
- Documentation : ...
- Extraits de code : ...
"""
analyzer_prompt_template = """
Vous êtes un assistant d'analyse. Vos tâches sont :
1. Vérifier la cohérence des résultats de recherche avec le résumé structuré :
{structured_summary}
2. Analyser les résultats de recherche :
{search_results}
3. Générer un rapport indiquant si les résultats sont **valide** ou **non valide**.
4. Si **non valide**, spécifier les éléments manquants ou incohérences.
5. Votre réponse doit commencer par 'Validité: Oui' ou 'Validité: Non', suivi du rapport d'analyse.
"""
# === Fonctions Utilitaires de l'AgentManager ===
def get_variables_context():
variables = {}
for agent, data in project_state.items():
variables[agent] = {}
for key, value in data.items():
variables[agent][key] = value if value else "N/A"
variables_context = json.dumps(variables, indent=2, ensure_ascii=False)
return variables_context
def update_project_state(modifications):
for var, value in modifications.items():
keys = var.split('.')
target = project_state
for key in keys[:-1]:
target = target.get(key, {})
target[keys[-1]] = value
def extract_modifications(user_input):
modifications = {}
if "modifie" in user_input.lower():
matches = re.findall(r"modifie la variable (\w+(?:\.\w+)*) à (.+)", user_input, re.IGNORECASE)
for match in matches:
var_name, var_value = match
modifications[var_name.strip()] = var_value.strip()
return modifications
def extract_structured_summary(response):
start_token = "Résumé Structuré :"
end_token = "Fin du Résumé"
start_index = response.find(start_token)
end_index = response.find(end_token, start_index)
if start_index != -1 and end_index != -1:
summary = response[start_index + len(start_token):end_index].strip()
return summary
else:
logging.warning("Le résumé structuré n'a pas pu être extrait.")
return None
# === AgentManager ===
def agent_manager(chat_history, user_input):
variables_context = get_variables_context()
system_prompt = manager_prompt_template.format(variables_context=variables_context)
conversation = [{"role": "system", "content": system_prompt}]
# Ajouter l'historique
for turn in chat_history:
conversation.append({"role": "user", "content": turn['user']})
conversation.append({"role": "assistant", "content": turn['assistant']})
# Ajouter l'entrée utilisateur actuelle
conversation.append({"role": "user", "content": user_input})
# Vérifier si l'utilisateur souhaite modifier des variables
modifications = extract_modifications(user_input)
if modifications:
update_project_state(modifications)
response = "Les variables ont été mises à jour selon votre demande."
chat_history.append({'user': user_input, 'assistant': response})
return response, chat_history, False
# Générer la réponse
prompt = manager_tokenizer.apply_chat_template(conversation, add_generation_prompt=True, tokenize=False)
input_ids = manager_tokenizer(prompt, return_tensors="pt").to(manager_model.device)
output_ids = manager_model.generate(
input_ids["input_ids"],
max_new_tokens=256,
eos_token_id=manager_tokenizer.eos_token_id,
pad_token_id=manager_tokenizer.pad_token_id,
attention_mask=input_ids["attention_mask"]
)
response = manager_tokenizer.decode(output_ids[0], skip_special_tokens=True)
chat_history.append({'user': user_input, 'assistant': response})
# Vérifier si un résumé a été généré pour validation
if "Validez-vous ce résumé" in response:
structured_summary = extract_structured_summary(response)
project_state["AgentManager"]["structured_summary"] = structured_summary
return response, chat_history, True # Indique que le résumé est prêt pour validation
else:
return response, chat_history, False
# --- AgentResearcher ---
def fetch_webpage(url: str) -> str:
try:
response = requests.get(url, timeout=10)
response.raise_for_status()
logging.info(f"Page téléchargée avec succès : {url}")
return response.text
except requests.RequestException as e:
logging.error(f"Erreur lors de la récupération de la page {url}: {e}")
return ""
def extract_information_from_html(html: str, keyword: str) -> list:
try:
soup = BeautifulSoup(html, "html.parser")
results = []
for code_block in soup.find_all("code"):
if keyword.lower() in code_block.get_text().lower():
results.append(code_block.get_text())
logging.info(f"Nombre de sections extraites pour '{keyword}' : {len(results)}")
return results
except Exception as e:
logging.error(f"Erreur lors de l'extraction des informations : {e}")
return []
def search_gradio_docs(query: str) -> dict:
url = "https://gradio.app/docs/"
logging.info(f"Lancement de la recherche pour la requête : {query}")
html_content = fetch_webpage(url)
if not html_content:
return {"error": "Impossible de télécharger la documentation Gradio."}
results = extract_information_from_html(html_content, query)
if not results:
return {"error": f"Aucun résultat trouvé pour '{query}'."}
return {"query": query, "results": results}
def agent_researcher():
structured_summary = project_state["AgentManager"]["structured_summary"]
if not structured_summary:
return "Le résumé structuré n'est pas disponible."
# Création du prompt en utilisant apply_chat_template
messages = [
{"role": "system", "content": "Vous êtes un assistant de recherche. Vous devez répondre en JSON avec les clés 'documentation' et 'extraits_code'."},
{"role": "user", "content": researcher_prompt_template.format(structured_summary=structured_summary)}
]
input_ids = researcher_tokenizer.apply_chat_template(
messages,
add_generation_prompt=True,
return_tensors="pt"
).to(researcher_model.device)
terminators = [
researcher_tokenizer.eos_token_id,
researcher_tokenizer.convert_tokens_to_ids("<|eot_id|>")
]
output_ids = researcher_model.generate(
input_ids["input_ids"],
max_new_tokens=512,
eos_token_id=terminators,
do_sample=True,
temperature=0.6,
top_p=0.9,
)
response_ids = output_ids[0][input_ids["input_ids"].shape[-1]:]
response = researcher_tokenizer.decode(response_ids, skip_special_tokens=True)
# Parser la réponse JSON
try:
response_json = json.loads(response)
except json.JSONDecodeError:
logging.error("La réponse du modèle n'est pas un JSON valide.")
response_json = {"documentation": "", "extraits_code": ""}
# Recherches dynamiques
search_results = search_gradio_docs(structured_summary)
if "error" in search_results:
logging.error(search_results["error"])
return search_results["error"]
# Mise à jour de l'état global
project_state["AgentResearcher"]["search_results"] = {
"model_response": response_json,
"dynamic_results": search_results["results"]
}
return f"Résultats de l'AgentResearcher :\n{response_json}\n\nRésultats dynamiques :\n{search_results['results']}"
# --- AgentAnalyzer ---
def agent_analyzer():
structured_summary = project_state["AgentManager"]["structured_summary"]
search_results = project_state["AgentResearcher"]["search_results"]
if not structured_summary or not search_results:
return "Les informations nécessaires ne sont pas disponibles pour l'analyse."
# Création du prompt avec apply_chat_template
messages = [
{"role": "system", "content": "Vous êtes un assistant d'analyse. Votre tâche est d'analyser les résultats de recherche et de vérifier leur cohérence avec le résumé structuré."},
{"role": "user", "content": analyzer_prompt_template.format(
structured_summary=structured_summary,
search_results=json.dumps(search_results, ensure_ascii=False)
)}
]
prompt = analyzer_tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)
# Création du pipeline
analyzer_pipeline = pipeline(
"text-generation",
model=analyzer_model,
tokenizer=analyzer_tokenizer,
device_map="auto"
)
# Génération du rapport d'analyse
sequences = analyzer_pipeline(
prompt,
do_sample=True,
temperature=0.7,
top_p=0.9,
num_return_sequences=1,
max_new_tokens=256,
)
analysis_report = sequences[0]['generated_text']
# Mise à jour de l'état global
project_state["AgentAnalyzer"]["analysis_report"] = analysis_report
# Détermination de la validité
if "Validité: Oui" in analysis_report:
instruction_for_coder = f"Générer du code basé sur :\n{structured_summary}\n\nRésultats de recherche :\n{search_results}"
project_state["AgentAnalyzer"]["instruction_for_coder"] = instruction_for_coder
return f"Rapport valide.\nInstructions pour l'AgentCoder prêtes."
elif "Validité: Non" in analysis_report:
project_state["AgentAnalyzer"]["instruction_for_coder"] = None
# Retourner le rapport à l'AgentManager pour clarification
return f"Rapport non valide. Besoin de clarification.\n{analysis_report}"
else:
project_state["AgentAnalyzer"]["instruction_for_coder"] = None
return f"Le rapport d'analyse ne contient pas d'information claire sur la validité. Besoin de clarification.\n{analysis_report}"
# --- AgentCoder ---
def agent_coder():
instruction_for_coder = project_state["AgentAnalyzer"]["instruction_for_coder"]
if not instruction_for_coder:
return "Les instructions pour le code ne sont pas disponibles."
# Création des messages avec apply_chat_template
messages = [
{"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},
{"role": "user", "content": instruction_for_coder}
]
prompt = coder_tokenizer.apply_chat_template(
messages,
tokenize=False,
add_generation_prompt=True
)
# Préparation des entrées du modèle
model_inputs = coder_tokenizer(prompt, return_tensors="pt").to(coder_model.device)
# Génération du code
generated_ids = coder_model.generate(
**model_inputs,
max_new_tokens=1024,
temperature=0.7,
top_p=0.9,
)
# Exclure les tokens du prompt des sorties
generated_ids = generated_ids[:, model_inputs.input_ids.shape[-1]:]
final_code = coder_tokenizer.decode(generated_ids[0], skip_special_tokens=True)
# Mise à jour de l'état global
project_state["AgentCoder"]["final_code"] = final_code
return f"Code généré par l'AgentCoder :\n{final_code}"
# === Fonction d'interaction avec l'utilisateur ===
def user_interaction(message, chat_history):
if chat_history is None:
chat_history = []
# Vérifier si nous attendons une validation
if chat_history and isinstance(chat_history[-1], dict) and chat_history[-1].get('status') == 'awaiting_validation':
# Traiter la validation de l'utilisateur
user_validation = message
if user_validation.lower() in ["oui", "yes"]:
# Procéder avec les agents
researcher_response = agent_researcher()
analyzer_response = agent_analyzer()
if "valide" in analyzer_response.lower():
coder_response = agent_coder()
response = coder_response
else:
response = analyzer_response
else:
response = "Le résumé structuré n'a pas été validé. Veuillez fournir plus de détails."
# Retirer le statut de chat_history
chat_history.pop()
chat_history.append({'user': message, 'assistant': response})
return chat_history, chat_history
else:
# Interaction régulière avec l'AgentManager
response, chat_history, is_summary_ready = agent_manager(chat_history, message)
if is_summary_ready:
# Indiquer que nous attendons une validation
chat_history.append({'status': 'awaiting_validation'})
return chat_history, chat_history
# === Interface Gradio ===
with gr.Blocks() as interface:
with gr.Tabs():
# Onglet "Chat"
with gr.Tab("Chat"):
with gr.Row():
# Colonne gauche : Chat principal
with gr.Column(scale=3):
chatbot = gr.Chatbot(label="Chat Principal")
state = gr.State([]) # Historique des messages
msg = gr.Textbox(placeholder="Entrez votre message ici...")
send_btn = gr.Button("Envoyer")
# Colonne droite : Statut des agents et logs
with gr.Column(scale=2):
agent_status_chat = gr.Chatbot(label="Suivi des Agents")
logs_box = gr.Textbox(
value="",
lines=10,
interactive=False,
placeholder="Logs d'exécution",
label="Logs",
)
# Onglet "Output"
with gr.Tab("Output"):
output_code = gr.Code(
value="# Le code généré sera affiché ici.\n",
language="python",
label="Code Final",
)
# === Fonctions de mise à jour des statuts et logs ===
def update_agent_status_and_logs(chat_history):
"""
Met à jour les messages des agents et les logs d'exécution.
"""
# Initialisation des messages
agent_status_messages = []
# AgentManager
structured_summary = project_state["AgentManager"]["structured_summary"]
if structured_summary:
manager_message = f"AgentManager : Résumé structuré disponible.\n{structured_summary}"
else:
manager_message = "AgentManager : En attente d'informations de l'utilisateur."
agent_status_messages.append(("AgentManager", manager_message))
# AgentResearcher
researcher_result = project_state["AgentResearcher"]["search_results"]
if researcher_result:
researcher_message = (
f"AgentResearcher : Résultats obtenus\n"
f"Documentation : {researcher_result.get('documentation', 'N/A')}\n"
f"Extraits de code : {researcher_result.get('extraits_code', 'N/A')}"
)
else:
researcher_message = "AgentResearcher : Recherche en cours..."
agent_status_messages.append(("AgentResearcher", researcher_message))
# AgentAnalyzer
analysis_report = project_state["AgentAnalyzer"]["analysis_report"]
if analysis_report:
analyzer_message = (
f"AgentAnalyzer : Analyse terminée\n"
f"{analysis_report}"
)
else:
analyzer_message = "AgentAnalyzer : Analyse en cours..."
agent_status_messages.append(("AgentAnalyzer", analyzer_message))
# AgentCoder
final_code = project_state["AgentCoder"]["final_code"]
if final_code:
coder_message = "AgentCoder : Code généré avec succès ✔️"
else:
coder_message = "AgentCoder : En attente des instructions."
agent_status_messages.append(("AgentCoder", coder_message))
# Logs
logs = ""
with open("project.log", "r") as log_file:
logs = log_file.read()
return agent_status_messages, logs
# === Fonction principale de réponse ===
def respond(message, chat_history, agent_chat):
"""
Gestion des interactions principales et mise à jour des statuts/logs.
"""
# Mettre à jour le chat principal
updated_chat_history, _ = user_interaction(message, chat_history)
bot_message = updated_chat_history[-1]["assistant"]
# Mettre à jour le statut des agents et les logs
agent_status, logs = update_agent_status_and_logs(updated_chat_history)
# Mettre à jour le chatbot des agents
agent_chat.clear()
for agent_name, msg_content in agent_status:
agent_chat.append((agent_name, msg_content))
# Générer le code final si disponible
generated_code = project_state["AgentCoder"].get("final_code", "")
if not generated_code:
generated_code = "# Aucun code n'a encore été généré."
else:
generated_code = f"{generated_code}"
return chatbot.update([(message, bot_message)]), updated_chat_history, agent_chat.update(), logs, generated_code
# === Actions des boutons et soumission ===
send_btn.click(
respond,
inputs=[msg, state, agent_status_chat],
outputs=[chatbot, state, agent_status_chat, logs_box, output_code],
)
msg.submit(
respond,
inputs=[msg, state, agent_status_chat],
outputs=[chatbot, state, agent_status_chat, logs_box, output_code],
)
# Lancer l'interface
if __name__ == "__main__":
interface.launch() |