Spaces:

Woziii
/

chorege

Paused

App Files Files Community

chorege / app.py

Woziii

Update app.py

c38f940 verified 7 months ago

raw

history blame contribute delete

21.1 kB

	# -- coding: utf-8 --

	# === Imports ===
	import gradio as gr
	import torch
	from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer, pipeline
	from datetime import datetime
	import os
	import json
	import logging
	from huggingface_hub import login
	import requests
	from bs4 import BeautifulSoup
	from concurrent.futures import ThreadPoolExecutor
	import re

	# --- Configuration du logger ---
	logging.basicConfig(
	level=logging.INFO,
	format="%(asctime)s - %(levelname)s - %(message)s",
	handlers=[
	logging.FileHandler("project.log"),
	logging.StreamHandler()
	]
	)

	# --- Authentification Hugging Face ---
	# Assurez-vous que la variable d'environnement HF_TOKEN est définie avec votre token Hugging Face
	# Sinon, vous pouvez la définir directement ici
	# os.environ["HF_TOKEN"] = "votre_token_huggingface"

	login(token=os.environ["HF_TOKEN"])

	# === Chargement des modèles ===
	# AgentManager
	manager_model_name = "meta-llama/Llama-3.1-8B-Instruct"
	manager_model = AutoModelForCausalLM.from_pretrained(
	manager_model_name,
	device_map="auto",
	torch_dtype=torch.bfloat16 # Utilisation de bfloat16 comme recommandé
	)
	manager_tokenizer = AutoTokenizer.from_pretrained(manager_model_name)

	# AgentResearcher
	researcher_model_name = "hiieu/Meta-Llama-3-8B-Instruct-function-calling-json-mode"
	researcher_model = AutoModelForCausalLM.from_pretrained(
	researcher_model_name,
	torch_dtype=torch.bfloat16, # Utilisation de bfloat16 comme recommandé
	device_map="auto",
	)
	researcher_tokenizer = AutoTokenizer.from_pretrained(researcher_model_name)

	# AgentAnalyzer
	analyzer_model_name = "jpacifico/Chocolatine-3B-Instruct-DPO-Revised"
	analyzer_model = AutoModelForCausalLM.from_pretrained(
	analyzer_model_name,
	device_map="auto",
	torch_dtype=torch.float16
	)
	analyzer_tokenizer = AutoTokenizer.from_pretrained(analyzer_model_name)

	# AgentCoder
	coder_model_name = "Qwen/Qwen2.5-Coder-7B-Instruct"
	coder_model = AutoModelForCausalLM.from_pretrained(
	coder_model_name,
	torch_dtype="auto",
	device_map="auto"
	)
	coder_tokenizer = AutoTokenizer.from_pretrained(coder_model_name)

	# === Variables Globales ===
	project_state = {
	"AgentManager": {"structured_summary": None},
	"AgentResearcher": {"search_results": None},
	"AgentAnalyzer": {"analysis_report": None, "instruction_for_coder": None},
	"AgentCoder": {"final_code": None}
	}

	# --- Prompts prédéfinis ---
	manager_prompt_template = """
	Vous êtes l'AgentManager d'un système multi-agent.

	- Votre rôle est d'interagir avec l'utilisateur pour comprendre sa demande.
	- Vous devez poser des questions pertinentes pour obtenir toutes les informations nécessaires.
	- Une fois que vous estimez avoir suffisamment d'informations, vous générez un résumé structuré du projet.
	- Vous incluez les informations des variables du projet si elles ne sont pas vides.
	- Vous demandez une validation explicite à l'utilisateur pour le résumé généré.
	- Vous pouvez modifier les variables du projet si l'utilisateur en fait la demande.

	Variables du projet :
	{variables_context}
	"""

	researcher_prompt_template = """
	System: Vous êtes un assistant de recherche. Vos tâches sont :
	1. Basé sur le résumé structuré suivant :
	{structured_summary}
	2. Effectuer des recherches dans la documentation Gradio en ligne.
	3. Extraire des extraits de code ou des exemples utiles.
	4. Formater clairement les résultats pour validation.

	Format de sortie :
	- Documentation : ...
	- Extraits de code : ...
	"""

	analyzer_prompt_template = """
	Vous êtes un assistant d'analyse. Vos tâches sont :
	1. Vérifier la cohérence des résultats de recherche avec le résumé structuré :
	{structured_summary}
	2. Analyser les résultats de recherche :
	{search_results}
	3. Générer un rapport indiquant si les résultats sont valide ou non valide.
	4. Si non valide, spécifier les éléments manquants ou incohérences.
	5. Votre réponse doit commencer par 'Validité: Oui' ou 'Validité: Non', suivi du rapport d'analyse.
	"""

	# === Fonctions Utilitaires de l'AgentManager ===
	def get_variables_context():
	variables = {}
	for agent, data in project_state.items():
	variables[agent] = {}
	for key, value in data.items():
	variables[agent][key] = value if value else "N/A"
	variables_context = json.dumps(variables, indent=2, ensure_ascii=False)
	return variables_context

	def update_project_state(modifications):
	for var, value in modifications.items():
	keys = var.split('.')
	target = project_state
	for key in keys[:-1]:
	target = target.get(key, {})
	target[keys[-1]] = value

	def extract_modifications(user_input):
	modifications = {}
	if "modifie" in user_input.lower():
	matches = re.findall(r"modifie la variable (\w+(?:\.\w+)*) à (.+)", user_input, re.IGNORECASE)
	for match in matches:
	var_name, var_value = match
	modifications[var_name.strip()] = var_value.strip()
	return modifications

	def extract_structured_summary(response):
	start_token = "Résumé Structuré :"
	end_token = "Fin du Résumé"
	start_index = response.find(start_token)
	end_index = response.find(end_token, start_index)
	if start_index != -1 and end_index != -1:
	summary = response[start_index + len(start_token):end_index].strip()
	return summary
	else:
	logging.warning("Le résumé structuré n'a pas pu être extrait.")
	return None

	# === AgentManager ===
	def agent_manager(chat_history, user_input):
	variables_context = get_variables_context()
	system_prompt = manager_prompt_template.format(variables_context=variables_context)

	conversation = [{"role": "system", "content": system_prompt}]

	# Ajouter l'historique
	for turn in chat_history:
	conversation.append({"role": "user", "content": turn['user']})
	conversation.append({"role": "assistant", "content": turn['assistant']})

	# Ajouter l'entrée utilisateur actuelle
	conversation.append({"role": "user", "content": user_input})

	# Vérifier si l'utilisateur souhaite modifier des variables
	modifications = extract_modifications(user_input)
	if modifications:
	update_project_state(modifications)
	response = "Les variables ont été mises à jour selon votre demande."
	chat_history.append({'user': user_input, 'assistant': response})
	return response, chat_history, False

	# Générer la réponse
	prompt = manager_tokenizer.apply_chat_template(conversation, add_generation_prompt=True, tokenize=False)

	input_ids = manager_tokenizer(prompt, return_tensors="pt").to(manager_model.device)
	output_ids = manager_model.generate(
	input_ids["input_ids"],
	max_new_tokens=256,
	eos_token_id=manager_tokenizer.eos_token_id,
	pad_token_id=manager_tokenizer.pad_token_id,
	attention_mask=input_ids["attention_mask"]
	)
	response = manager_tokenizer.decode(output_ids[0], skip_special_tokens=True)

	chat_history.append({'user': user_input, 'assistant': response})

	# Vérifier si un résumé a été généré pour validation
	if "Validez-vous ce résumé" in response:
	structured_summary = extract_structured_summary(response)
	project_state["AgentManager"]["structured_summary"] = structured_summary
	return response, chat_history, True # Indique que le résumé est prêt pour validation
	else:
	return response, chat_history, False

	# --- AgentResearcher ---
	def fetch_webpage(url: str) -> str:
	try:
	response = requests.get(url, timeout=10)
	response.raise_for_status()
	logging.info(f"Page téléchargée avec succès : {url}")
	return response.text
	except requests.RequestException as e:
	logging.error(f"Erreur lors de la récupération de la page {url}: {e}")
	return ""

	def extract_information_from_html(html: str, keyword: str) -> list:
	try:
	soup = BeautifulSoup(html, "html.parser")
	results = []
	for code_block in soup.find_all("code"):
	if keyword.lower() in code_block.get_text().lower():
	results.append(code_block.get_text())
	logging.info(f"Nombre de sections extraites pour '{keyword}' : {len(results)}")
	return results
	except Exception as e:
	logging.error(f"Erreur lors de l'extraction des informations : {e}")
	return []

	def search_gradio_docs(query: str) -> dict:
	url = "https://gradio.app/docs/"
	logging.info(f"Lancement de la recherche pour la requête : {query}")
	html_content = fetch_webpage(url)
	if not html_content:
	return {"error": "Impossible de télécharger la documentation Gradio."}
	results = extract_information_from_html(html_content, query)
	if not results:
	return {"error": f"Aucun résultat trouvé pour '{query}'."}
	return {"query": query, "results": results}

	def agent_researcher():
	structured_summary = project_state["AgentManager"]["structured_summary"]
	if not structured_summary:
	return "Le résumé structuré n'est pas disponible."

	# Création du prompt en utilisant apply_chat_template
	messages = [
	{"role": "system", "content": "Vous êtes un assistant de recherche. Vous devez répondre en JSON avec les clés 'documentation' et 'extraits_code'."},
	{"role": "user", "content": researcher_prompt_template.format(structured_summary=structured_summary)}
	]

	input_ids = researcher_tokenizer.apply_chat_template(
	messages,
	add_generation_prompt=True,
	return_tensors="pt"
	).to(researcher_model.device)

	terminators = [
	researcher_tokenizer.eos_token_id,
	researcher_tokenizer.convert_tokens_to_ids("<\|eot_id\|>")
	]

	output_ids = researcher_model.generate(
	input_ids["input_ids"],
	max_new_tokens=512,
	eos_token_id=terminators,
	do_sample=True,
	temperature=0.6,
	top_p=0.9,
	)
	response_ids = output_ids[0][input_ids["input_ids"].shape[-1]:]
	response = researcher_tokenizer.decode(response_ids, skip_special_tokens=True)

	# Parser la réponse JSON
	try:
	response_json = json.loads(response)
	except json.JSONDecodeError:
	logging.error("La réponse du modèle n'est pas un JSON valide.")
	response_json = {"documentation": "", "extraits_code": ""}

	# Recherches dynamiques
	search_results = search_gradio_docs(structured_summary)
	if "error" in search_results:
	logging.error(search_results["error"])
	return search_results["error"]

	# Mise à jour de l'état global
	project_state["AgentResearcher"]["search_results"] = {
	"model_response": response_json,
	"dynamic_results": search_results["results"]
	}

	return f"Résultats de l'AgentResearcher :\n{response_json}\n\nRésultats dynamiques :\n{search_results['results']}"

	# --- AgentAnalyzer ---
	def agent_analyzer():
	structured_summary = project_state["AgentManager"]["structured_summary"]
	search_results = project_state["AgentResearcher"]["search_results"]
	if not structured_summary or not search_results:
	return "Les informations nécessaires ne sont pas disponibles pour l'analyse."

	# Création du prompt avec apply_chat_template
	messages = [
	{"role": "system", "content": "Vous êtes un assistant d'analyse. Votre tâche est d'analyser les résultats de recherche et de vérifier leur cohérence avec le résumé structuré."},
	{"role": "user", "content": analyzer_prompt_template.format(
	structured_summary=structured_summary,
	search_results=json.dumps(search_results, ensure_ascii=False)
	)}
	]
	prompt = analyzer_tokenizer.apply_chat_template(messages, add_generation_prompt=True, tokenize=False)

	# Création du pipeline
	analyzer_pipeline = pipeline(
	"text-generation",
	model=analyzer_model,
	tokenizer=analyzer_tokenizer,
	device_map="auto"
	)

	# Génération du rapport d'analyse
	sequences = analyzer_pipeline(
	prompt,
	do_sample=True,
	temperature=0.7,
	top_p=0.9,
	num_return_sequences=1,
	max_new_tokens=256,
	)
	analysis_report = sequences[0]['generated_text']

	# Mise à jour de l'état global
	project_state["AgentAnalyzer"]["analysis_report"] = analysis_report

	# Détermination de la validité
	if "Validité: Oui" in analysis_report:
	instruction_for_coder = f"Générer du code basé sur :\n{structured_summary}\n\nRésultats de recherche :\n{search_results}"
	project_state["AgentAnalyzer"]["instruction_for_coder"] = instruction_for_coder
	return f"Rapport valide.\nInstructions pour l'AgentCoder prêtes."
	elif "Validité: Non" in analysis_report:
	project_state["AgentAnalyzer"]["instruction_for_coder"] = None
	# Retourner le rapport à l'AgentManager pour clarification
	return f"Rapport non valide. Besoin de clarification.\n{analysis_report}"
	else:
	project_state["AgentAnalyzer"]["instruction_for_coder"] = None
	return f"Le rapport d'analyse ne contient pas d'information claire sur la validité. Besoin de clarification.\n{analysis_report}"

	# --- AgentCoder ---
	def agent_coder():
	instruction_for_coder = project_state["AgentAnalyzer"]["instruction_for_coder"]
	if not instruction_for_coder:
	return "Les instructions pour le code ne sont pas disponibles."

	# Création des messages avec apply_chat_template
	messages = [
	{"role": "system", "content": "You are Qwen, created by Alibaba Cloud. You are a helpful assistant."},
	{"role": "user", "content": instruction_for_coder}
	]
	prompt = coder_tokenizer.apply_chat_template(
	messages,
	tokenize=False,
	add_generation_prompt=True
	)

	# Préparation des entrées du modèle
	model_inputs = coder_tokenizer(prompt, return_tensors="pt").to(coder_model.device)

	# Génération du code
	generated_ids = coder_model.generate(
	**model_inputs,
	max_new_tokens=1024,
	temperature=0.7,
	top_p=0.9,
	)
	# Exclure les tokens du prompt des sorties
	generated_ids = generated_ids[:, model_inputs.input_ids.shape[-1]:]
	final_code = coder_tokenizer.decode(generated_ids[0], skip_special_tokens=True)

	# Mise à jour de l'état global
	project_state["AgentCoder"]["final_code"] = final_code

	return f"Code généré par l'AgentCoder :\n{final_code}"

	# === Fonction d'interaction avec l'utilisateur ===
	def user_interaction(message, chat_history):
	if chat_history is None:
	chat_history = []

	# Vérifier si nous attendons une validation
	if chat_history and isinstance(chat_history[-1], dict) and chat_history[-1].get('status') == 'awaiting_validation':
	# Traiter la validation de l'utilisateur
	user_validation = message
	if user_validation.lower() in ["oui", "yes"]:
	# Procéder avec les agents
	researcher_response = agent_researcher()
	analyzer_response = agent_analyzer()
	if "valide" in analyzer_response.lower():
	coder_response = agent_coder()
	response = coder_response
	else:
	response = analyzer_response
	else:
	response = "Le résumé structuré n'a pas été validé. Veuillez fournir plus de détails."
	# Retirer le statut de chat_history
	chat_history.pop()
	chat_history.append({'user': message, 'assistant': response})
	return chat_history, chat_history
	else:
	# Interaction régulière avec l'AgentManager
	response, chat_history, is_summary_ready = agent_manager(chat_history, message)
	if is_summary_ready:
	# Indiquer que nous attendons une validation
	chat_history.append({'status': 'awaiting_validation'})
	return chat_history, chat_history

	# === Interface Gradio ===
	with gr.Blocks() as interface:
	with gr.Tabs():
	# Onglet "Chat"
	with gr.Tab("Chat"):
	with gr.Row():
	# Colonne gauche : Chat principal
	with gr.Column(scale=3):
	chatbot = gr.Chatbot(label="Chat Principal")
	state = gr.State([]) # Historique des messages
	msg = gr.Textbox(placeholder="Entrez votre message ici...")
	send_btn = gr.Button("Envoyer")

	# Colonne droite : Statut des agents et logs
	with gr.Column(scale=2):
	agent_status_chat = gr.Chatbot(label="Suivi des Agents")
	logs_box = gr.Textbox(
	value="",
	lines=10,
	interactive=False,
	placeholder="Logs d'exécution",
	label="Logs",
	)

	# Onglet "Output"
	with gr.Tab("Output"):
	output_code = gr.Code(
	value="# Le code généré sera affiché ici.\n",
	language="python",
	label="Code Final",
	)

	# === Fonctions de mise à jour des statuts et logs ===
	def update_agent_status_and_logs(chat_history):
	"""
	Met à jour les messages des agents et les logs d'exécution.
	"""
	# Initialisation des messages
	agent_status_messages = []

	# AgentManager
	structured_summary = project_state["AgentManager"]["structured_summary"]
	if structured_summary:
	manager_message = f"AgentManager : Résumé structuré disponible.\n{structured_summary}"
	else:
	manager_message = "AgentManager : En attente d'informations de l'utilisateur."
	agent_status_messages.append(("AgentManager", manager_message))

	# AgentResearcher
	researcher_result = project_state["AgentResearcher"]["search_results"]
	if researcher_result:
	researcher_message = (
	f"AgentResearcher : Résultats obtenus\n"
	f"Documentation : {researcher_result.get('documentation', 'N/A')}\n"
	f"Extraits de code : {researcher_result.get('extraits_code', 'N/A')}"
	)
	else:
	researcher_message = "AgentResearcher : Recherche en cours..."
	agent_status_messages.append(("AgentResearcher", researcher_message))

	# AgentAnalyzer
	analysis_report = project_state["AgentAnalyzer"]["analysis_report"]
	if analysis_report:
	analyzer_message = (
	f"AgentAnalyzer : Analyse terminée\n"
	f"{analysis_report}"
	)
	else:
	analyzer_message = "AgentAnalyzer : Analyse en cours..."
	agent_status_messages.append(("AgentAnalyzer", analyzer_message))

	# AgentCoder
	final_code = project_state["AgentCoder"]["final_code"]
	if final_code:
	coder_message = "AgentCoder : Code généré avec succès ✔️"
	else:
	coder_message = "AgentCoder : En attente des instructions."
	agent_status_messages.append(("AgentCoder", coder_message))

	# Logs
	logs = ""
	with open("project.log", "r") as log_file:
	logs = log_file.read()

	return agent_status_messages, logs

	# === Fonction principale de réponse ===
	def respond(message, chat_history, agent_chat):
	"""
	Gestion des interactions principales et mise à jour des statuts/logs.
	"""
	# Mettre à jour le chat principal
	updated_chat_history, _ = user_interaction(message, chat_history)
	bot_message = updated_chat_history[-1]["assistant"]

	# Mettre à jour le statut des agents et les logs
	agent_status, logs = update_agent_status_and_logs(updated_chat_history)

	# Mettre à jour le chatbot des agents
	agent_chat.clear()
	for agent_name, msg_content in agent_status:
	agent_chat.append((agent_name, msg_content))

	# Générer le code final si disponible
	generated_code = project_state["AgentCoder"].get("final_code", "")
	if not generated_code:
	generated_code = "# Aucun code n'a encore été généré."
	else:
	generated_code = f"{generated_code}"

	return chatbot.update([(message, bot_message)]), updated_chat_history, agent_chat.update(), logs, generated_code

	# === Actions des boutons et soumission ===
	send_btn.click(
	respond,
	inputs=[msg, state, agent_status_chat],
	outputs=[chatbot, state, agent_status_chat, logs_box, output_code],
	)
	msg.submit(
	respond,
	inputs=[msg, state, agent_status_chat],
	outputs=[chatbot, state, agent_status_chat, logs_box, output_code],
	)

	# Lancer l'interface
	if __name__ == "__main__":
	interface.launch()