Spaces:

angelsg213
/

TESTING22

Sleeping

App Files Files Community

TESTING22 / app.py

angelsg213

Update app.py

57c0034 verified 6 days ago

raw

history blame contribute delete

75.6 kB

	import gradio as gr
	import PyPDF2
	import os
	import json
	import pandas as pd
	import re
	from datetime import datetime
	from huggingface_hub import InferenceClient
	from reportlab.lib.pagesizes import letter, A4
	from reportlab.lib import colors
	from reportlab.lib.units import inch
	from reportlab.platypus import SimpleDocTemplate, Table, TableStyle, Paragraph, Spacer
	from reportlab.lib.styles import getSampleStyleSheet, ParagraphStyle
	from reportlab.lib.enums import TA_CENTER, TA_RIGHT, TA_LEFT
	import time
	import numpy as np
	import wave

	# Para TTS emocional
	try:
	from gtts import gTTS
	GTTS_AVAILABLE = True
	except ImportError:
	GTTS_AVAILABLE = False
	print("⚠️ gTTS no disponible. Instala con: pip install gtts")

	# ============= EXTRAER TEXTO DEL PDF =============
	def extraer_texto_pdf(pdf_file):
	try:
	pdf_reader = PyPDF2.PdfReader(pdf_file)
	texto = ""
	for pagina in pdf_reader.pages:
	texto += pagina.extract_text() + "\n"
	return texto
	except Exception as e:
	return f"Error: {str(e)}"

	# ============= GENERAR AUDIO CON EMOCIÓN MEJORADO =============
	# ============= GENERAR AUDIO CON EMOCIÓN MEJORADO =============
	# ============= GENERAR AUDIO CON EMOCIÓN MEJORADO =============
	# ============= GENERAR AUDIO CON EMOCIÓN Y ANÁLISIS DE SENTIMIENTO =============

	# ============= GENERAR AUDIO CON EMOCIÓN - VERSIÓN CORREGIDA =============
	def generar_audio_respuesta(texto, client):
	"""TTS emocional FUNCIONAL con gTTS (Google Text-to-Speech) - Diciembre 2024"""

	try:
	# Limpiar y preparar texto
	texto_limpio = texto.replace("*", "").replace("#", "").replace("`", "").replace("€", " euros").strip()
	oraciones = re.split(r'[.!?]+', texto_limpio)
	oraciones = [o.strip() for o in oraciones if o.strip() and len(o.strip()) > 10]
	texto_audio = ". ".join(oraciones[:5]) + "." if len(oraciones) > 5 else ". ".join(oraciones) + "."

	if len(texto_audio) > 500:
	texto_audio = texto_audio[:497] + "..."

	print(f"🎤 Generando audio para: '{texto_audio[:100]}...'")

	# PASO 1: Análisis emocional
	emocion_detectada = "neutral"
	confianza = 0.5

	try:
	print("🧠 Analizando emoción...")
	emotion_response = client.text_classification(
	text=texto_audio[:512],
	model="finiteautomata/beto-sentiment-analysis"
	)
	if emotion_response and len(emotion_response) > 0:
	label = emotion_response[0]['label'].lower()
	sentiment_to_emotion = {
	'pos': 'joy',
	'positive': 'joy',
	'neu': 'neutral',
	'neutral': 'neutral',
	'neg': 'sadness',
	'negative': 'sadness'
	}
	emocion_detectada = sentiment_to_emotion.get(label, 'neutral')
	confianza = emotion_response[0]['score']
	print(f"😊 Emoción: {emocion_detectada} (confianza: {confianza:.2%})")
	except Exception as e:
	print(f"⚠️ Error en análisis emocional: {str(e)[:100]}")

	# PASO 2: Generar audio con gTTS
	print("🔊 Generando audio con Google TTS...")

	if GTTS_AVAILABLE:
	tts = gTTS(text=texto_audio, lang='es', slow=False)
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	audio_path = f"audio_emocional_{emocion_detectada}_{timestamp}.mp3"
	tts.save(audio_path)

	if os.path.exists(audio_path) and os.path.getsize(audio_path) > 1000:
	print(f"✅ Audio generado: {audio_path} ({os.path.getsize(audio_path)} bytes)")
	return audio_path

	print("⚠️ Intentando método alternativo...")
	return generar_audio_alternativo(texto, client)

	except Exception as e:
	print(f"❌ Error general: {str(e)}")
	return None, "neutral", 0.5

	def generar_audio_alternativo(texto, client):
	"""Método alternativo usando HuggingFace TTS"""
	emocion_detectada = "neutral"
	confianza = 0.5

	texto_limpio = texto.replace("*", "").replace("#", "").replace("`", "").replace("€", " euros").strip()
	oraciones = re.split(r'[.!?]+', texto_limpio)
	oraciones = [o.strip() for o in oraciones if o.strip() and len(o.strip()) > 10]
	texto_audio = ". ".join(oraciones[:3]) + "."

	if len(texto_audio) > 400:
	texto_audio = texto_audio[:397] + "..."

	modelos_tts = ["facebook/mms-tts-spa"]

	for modelo in modelos_tts:
	try:
	print(f"🔊 Probando: {modelo}")
	audio_data = client.text_to_speech(text=texto_audio, model=modelo)

	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	audio_path = f"audio_{timestamp}.wav"

	with open(audio_path, "wb") as f:
	if isinstance(audio_data, bytes):
	f.write(audio_data)
	elif hasattr(audio_data, 'read'):
	f.write(audio_data.read())
	else:
	for chunk in audio_data:
	if chunk:
	f.write(chunk if isinstance(chunk, bytes) else bytes(chunk))

	if os.path.exists(audio_path) and os.path.getsize(audio_path) > 1000:
	print(f"✅ Audio generado con {modelo}")
	return audio_path
	else:
	if os.path.exists(audio_path):
	os.remove(audio_path)
	except Exception as e:
	print(f"❌ Error con {modelo}: {str(e)[:100]}")

	return None, emocion_detectada, confianza


	# ============= ASISTENTE IA CONVERSACIONAL =============
	def asistente_ia_factura(texto, pregunta_usuario):
	"""Asistente IA que explica conceptos, responde preguntas y da consejos sobre facturas"""

	token = os.getenv("aa")
	if not token:
	return "❌ Error: Falta configurar HF_TOKEN en Settings → Secrets", None

	texto_limpio = texto[:6000]

	prompt = f"""Eres un asistente experto en facturas y finanzas que ayuda a entender documentos comerciales.

	TEXTO DE LA FACTURA:
	{texto_limpio}

	PREGUNTA DEL USUARIO: {pregunta_usuario}

	INSTRUCCIONES:
	1. Responde de forma clara, amigable y profesional en español
	2. Si te preguntan sobre conceptos (IVA, base imponible, etc.), explícalos de manera sencilla
	3. Si te preguntan datos específicos, extráelos del texto de la factura
	4. Da consejos útiles cuando sea relevante (gestión, pagos, fiscalidad básica)
	5. Si no encuentras información específica en la factura, indícalo claramente
	6. Usa un lenguaje accesible para personas sin conocimientos técnicos
	7. Sé conciso pero completo (máximo 200 palabras)
	8. IMPORTANTE: Tu respuesta será convertida a audio, así que:
	- Usa frases cortas y claras
	- Evita símbolos especiales como *, #, €
	- Usa "euros" en lugar de "€"
	- Habla en tono conversacional y natural

	Responde ahora:"""

	modelos = [
	"Qwen/Qwen2.5-72B-Instruct",
	"meta-llama/Llama-3.2-3B-Instruct",
	"mistralai/Mistral-Nemo-Instruct-2407"
	]

	for modelo in modelos:
	try:
	print(f"\n🤖 Consultando con: {modelo}")
	client = InferenceClient(token=token)

	response = client.chat.completions.create(
	model=modelo,
	messages=[
	{"role": "system", "content": "Eres un asistente experto en facturas, finanzas y contabilidad básica. Ayudas a las personas a entender sus documentos comerciales de forma clara y amigable. Respondes en un estilo conversacional perfecto para convertir a audio."},
	{"role": "user", "content": prompt}
	],
	max_tokens=600,
	temperature=0.7
	)

	respuesta = response.choices[0].message.content
	print(f"✅ Respuesta obtenida con {modelo}")

	# Generar audio de la respuesta
	# Generar audio emocional de la respuesta
	print("🎵 Iniciando generación de audio emocional...")
	audio_path = generar_audio_respuesta(respuesta, client)

	# Crear transcripción con información emocional
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	transcripcion_path = f"transcripcion_{timestamp}.txt"

	with open(transcripcion_path, "w", encoding="utf-8") as f:
	f.write("=" * 60 + "\n")
	f.write("TRANSCRIPCIÓN DE AUDIO - ASISTENTE IA\n")
	f.write("=" * 60 + "\n\n")
	f.write(f"Fecha: {datetime.now().strftime('%d/%m/%Y %H:%M:%S')}\n")
	f.write(f"\n" + "-" * 60 + "\n\n")
	f.write("TEXTO COMPLETO:\n\n")
	f.write(respuesta)
	f.write(f"\n\n" + "-" * 60 + "\n")
	f.write(f"\nArchivo de audio: {audio_path if audio_path else 'No generado'}\n")
	f.write("=" * 60 + "\n")

	if audio_path and os.path.exists(audio_path):
	print(f"✅ Audio generado correctamente: {audio_path}")
	return respuesta, audio_path, transcripcion_path
	else:
	print("⚠️ No se pudo generar el audio, pero la respuesta está disponible")
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	audio_vacio = f"audio_no_disponible_{timestamp}.mp3"
	with open(audio_vacio, "w") as f:
	f.write("")
	return respuesta, audio_vacio, transcripcion_path

	except Exception as e:
	print(f"❌ Error con {modelo}: {str(e)}")
	continue

	return "❌ No se pudo obtener respuesta del asistente IA", None, None, "neutral", 0.0



	# ============= ANÁLISIS DE SENTIMIENTO DE FACTURA =============
	def analizar_sentimiento_factura(texto, client):
	"""Analiza si la factura tiene alertas, urgencias o problemas"""

	prompt = f"""Analiza esta factura y determina si hay algo preocupante o urgente.
	TEXTO: {texto[:3000]}

	Responde en formato JSON:
	{{
	"sentimiento": "positivo/neutral/alerta",
	"urgencia": "alta/media/baja",
	"razon": "explicación breve",
	"recomendacion": "qué hacer"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=300,
	temperature=0.3
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"sentimiento": "neutral", "urgencia": "baja", "razon": "Análisis no disponible", "recomendacion": "Revisar manualmente"}

	# ============= SUGERENCIAS INTELIGENTES =============
	def generar_sugerencias_ia(datos_json, client):
	"""Genera sugerencias personalizadas basadas en la factura"""

	prompt = f"""Basándote en esta factura, da 3 sugerencias útiles y prácticas:

	DATOS: {json.dumps(datos_json, indent=2)}

	Responde en español con:
	1. Sugerencia sobre organización
	2. Sugerencia sobre pagos o plazos
	3. Sugerencia sobre optimización o ahorro

	Sé breve (máximo 150 palabras total):"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.7
	)

	return response.choices[0].message.content
	except:
	return "💡 Sugerencias: Mantén tus facturas organizadas por fecha, verifica los plazos de pago, y considera digitalizar todos tus documentos."

	# ============= EXTRACTOR DE CATEGORÍAS =============
	def extraer_categorias_gasto(datos_json, client):
	"""Categoriza automáticamente el tipo de gasto"""

	productos = datos_json.get('productos', [])
	texto_productos = " ".join([p.get('descripcion', '') for p in productos[:5]])

	prompt = f"""Clasifica esta factura en UNA categoría de gasto:

	Productos/Servicios: {texto_productos}
	Total: {datos_json.get('totales', {}).get('total', 0)}€

	Categorías posibles:
	- Oficina y suministros
	- Tecnología e IT
	- Servicios profesionales
	- Marketing y publicidad
	- Viajes y transporte
	- Alimentación y hostelería
	- Mantenimiento y reparaciones
	- Otros gastos

	Responde solo con el nombre de la categoría:"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=50,
	temperature=0.3
	)

	categoria = response.choices[0].message.content.strip()
	return f" Categoría: {categoria}"
	except:
	return " Categoría: No clasificada"

	# ============= TRADUCTOR MULTIIDIOMA CON CSV TABULAR =============
	def traducir_factura_con_csv(datos_json, texto, idioma_destino, client):
	"""Traduce la factura y genera tanto texto como CSV tabular"""

	idiomas = {
	"Inglés": "English",
	"Francés": "Français",
	"Alemán": "Deutsch",
	"Italiano": "Italiano",
	"Portugués": "Português"
	}

	idioma = idiomas.get(idioma_destino, "English")

	# 1. Traducir el texto completo
	prompt_texto = f"""Traduce este resumen de factura al {idioma}. Mantén el formato y estructura:

	{texto[:2000]}

	Traducción:"""

	try:
	response_texto = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt_texto}],
	max_tokens=1000,
	temperature=0.3
	)
	texto_traducido = response_texto.choices[0].message.content
	except:
	texto_traducido = "❌ Error en la traducción del texto"

	# 2. Crear DataFrame traducido
	if not datos_json:
	return texto_traducido, None, None

	# Traducir etiquetas según el idioma
	traducciones = {
	"Inglés": {
	"seccion": "Section",
	"campo": "Field",
	"valor": "Value",
	"tipo": "Type",
	"info_general": "GENERAL INFORMATION",
	"numero_factura": "Invoice Number",
	"fecha": "Date",
	"identificador": "Identifier",
	"emisor": "ISSUER",
	"nombre": "Name",
	"nif": "Tax ID",
	"direccion": "Address",
	"cliente": "CLIENT",
	"productos": "PRODUCTS",
	"producto": "Product",
	"cantidad": "Quantity",
	"precio_unitario": "Unit Price",
	"total_producto": "Total",
	"descripcion": "Description",
	"numerico": "Numeric",
	"monetario": "Monetary",
	"totales": "TOTALS",
	"base_imponible": "Taxable Base",
	"iva": "VAT",
	"total": "TOTAL",
	"informacion": "Information"
	},
	"Francés": {
	"seccion": "Section",
	"campo": "Champ",
	"valor": "Valeur",
	"tipo": "Type",
	"info_general": "INFORMATIONS GÉNÉRALES",
	"numero_factura": "Numéro de Facture",
	"fecha": "Date",
	"identificador": "Identifiant",
	"emisor": "ÉMETTEUR",
	"nombre": "Nom",
	"nif": "NIF",
	"direccion": "Adresse",
	"cliente": "CLIENT",
	"productos": "PRODUITS",
	"producto": "Produit",
	"cantidad": "Quantité",
	"precio_unitario": "Prix Unitaire",
	"total_producto": "Total",
	"descripcion": "Description",
	"numerico": "Numérique",
	"monetario": "Monétaire",
	"totales": "TOTAUX",
	"base_imponible": "Base Imposable",
	"iva": "TVA",
	"total": "TOTAL",
	"informacion": "Information"
	},
	"Alemán": {
	"seccion": "Abschnitt",
	"campo": "Feld",
	"valor": "Wert",
	"tipo": "Typ",
	"info_general": "ALLGEMEINE INFORMATIONEN",
	"numero_factura": "Rechnungsnummer",
	"fecha": "Datum",
	"identificador": "Kennung",
	"emisor": "AUSSTELLER",
	"nombre": "Name",
	"nif": "Steuernummer",
	"direccion": "Adresse",
	"cliente": "KUNDE",
	"productos": "PRODUKTE",
	"producto": "Produkt",
	"cantidad": "Menge",
	"precio_unitario": "Stückpreis",
	"total_producto": "Gesamt",
	"descripcion": "Beschreibung",
	"numerico": "Numerisch",
	"monetario": "Monetär",
	"totales": "SUMMEN",
	"base_imponible": "Steuerbemessungsgrundlage",
	"iva": "MwSt",
	"total": "GESAMT",
	"informacion": "Information"
	},
	"Italiano": {
	"seccion": "Sezione",
	"campo": "Campo",
	"valor": "Valore",
	"tipo": "Tipo",
	"info_general": "INFORMAZIONI GENERALI",
	"numero_factura": "Numero Fattura",
	"fecha": "Data",
	"identificador": "Identificatore",
	"emisor": "EMITTENTE",
	"nombre": "Nome",
	"nif": "Partita IVA",
	"direccion": "Indirizzo",
	"cliente": "CLIENTE",
	"productos": "PRODOTTI",
	"producto": "Prodotto",
	"cantidad": "Quantità",
	"precio_unitario": "Prezzo Unitario",
	"total_producto": "Totale",
	"descripcion": "Descrizione",
	"numerico": "Numerico",
	"monetario": "Monetario",
	"totales": "TOTALI",
	"base_imponible": "Imponibile",
	"iva": "IVA",
	"total": "TOTALE",
	"informacion": "Informazione"
	},
	"Portugués": {
	"seccion": "Seção",
	"campo": "Campo",
	"valor": "Valor",
	"tipo": "Tipo",
	"info_general": "INFORMAÇÃO GERAL",
	"numero_factura": "Número da Fatura",
	"fecha": "Data",
	"identificador": "Identificador",
	"emisor": "EMISSOR",
	"nombre": "Nome",
	"nif": "NIF",
	"direccion": "Endereço",
	"cliente": "CLIENTE",
	"productos": "PRODUTOS",
	"producto": "Produto",
	"cantidad": "Quantidade",
	"precio_unitario": "Preço Unitário",
	"total_producto": "Total",
	"descripcion": "Descrição",
	"numerico": "Numérico",
	"monetario": "Monetário",
	"totales": "TOTAIS",
	"base_imponible": "Base Tributável",
	"iva": "IVA",
	"total": "TOTAL",
	"informacion": "Informação"
	}
	}

	t = traducciones.get(idioma_destino, traducciones["Inglés"])

	filas = []

	# Información general
	filas.append({
	t["seccion"]: t["info_general"],
	t["campo"]: t["numero_factura"],
	t["valor"]: datos_json.get('numero_factura', 'N/A'),
	t["tipo"]: t["identificador"]
	})
	filas.append({
	t["seccion"]: t["info_general"],
	t["campo"]: t["fecha"],
	t["valor"]: datos_json.get('fecha', 'N/A'),
	t["tipo"]: t["fecha"]
	})

	# Emisor
	if 'emisor' in datos_json:
	emisor = datos_json['emisor']
	if isinstance(emisor, dict):
	for key, value in emisor.items():
	campo_traducido = t.get(key, key.replace('_', ' ').title())
	filas.append({
	t["seccion"]: t["emisor"],
	t["campo"]: campo_traducido,
	t["valor"]: str(value),
	t["tipo"]: t["informacion"]
	})

	# Cliente
	if 'cliente' in datos_json:
	cliente = datos_json['cliente']
	if isinstance(cliente, dict):
	for key, value in cliente.items():
	campo_traducido = t.get(key, key.replace('_', ' ').title())
	filas.append({
	t["seccion"]: t["cliente"],
	t["campo"]: campo_traducido,
	t["valor"]: str(value),
	t["tipo"]: t["informacion"]
	})

	# Productos
	productos = datos_json.get('productos', datos_json.get('conceptos', datos_json.get('items', [])))
	if productos and len(productos) > 0:
	for i, prod in enumerate(productos, 1):
	filas.append({
	t["seccion"]: t["productos"],
	t["campo"]: f'{t["producto"]} {i}',
	t["valor"]: prod.get('descripcion', 'N/A'),
	t["tipo"]: t["descripcion"]
	})
	filas.append({
	t["seccion"]: t["productos"],
	t["campo"]: f'{t["cantidad"]} P{i}',
	t["valor"]: str(prod.get('cantidad', '')),
	t["tipo"]: t["numerico"]
	})
	filas.append({
	t["seccion"]: t["productos"],
	t["campo"]: f'{t["precio_unitario"]} P{i}',
	t["valor"]: f"{prod.get('precio_unitario', 0)}",
	t["tipo"]: t["monetario"]
	})
	filas.append({
	t["seccion"]: t["productos"],
	t["campo"]: f'{t["total_producto"]} P{i}',
	t["valor"]: f"{prod.get('total', 0)}",
	t["tipo"]: t["monetario"]
	})

	# Totales
	totales = datos_json.get('totales', {})
	if totales or 'base_imponible' in datos_json or 'total' in datos_json:
	base = totales.get('base_imponible', datos_json.get('base_imponible', 0))
	iva = totales.get('iva', datos_json.get('iva', 0))
	porcentaje_iva = totales.get('porcentaje_iva', datos_json.get('porcentaje_iva', 0))
	total = totales.get('total', datos_json.get('total', 0))

	filas.append({
	t["seccion"]: t["totales"],
	t["campo"]: t["base_imponible"],
	t["valor"]: f"{base}",
	t["tipo"]: t["monetario"]
	})
	filas.append({
	t["seccion"]: t["totales"],
	t["campo"]: f'{t["iva"]} ({porcentaje_iva}%)',
	t["valor"]: f"{iva}",
	t["tipo"]: t["monetario"]
	})
	filas.append({
	t["seccion"]: t["totales"],
	t["campo"]: t["total"],
	t["valor"]: f"{total}",
	t["tipo"]: t["monetario"]
	})

	df_traducido = pd.DataFrame(filas)

	# Guardar CSV
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	csv_filename = f"factura_traducida_{idioma_destino}_{timestamp}.csv"
	df_traducido.to_csv(csv_filename, index=False, encoding='utf-8-sig', sep=',')

	return texto_traducido, df_traducido, csv_filename

	# ============= DETECTOR DE FRAUDE =============
	def detectar_fraude_factura(datos_json, texto, client):
	"""Analiza la factura en busca de señales de fraude o irregularidades"""

	prompt = f"""Analiza esta factura y detecta posibles señales de fraude o irregularidades:

	DATOS JSON: {json.dumps(datos_json, indent=2)}
	TEXTO: {texto[:2000]}

	Busca:
	- Números de factura duplicados o sospechosos
	- Importes inusuales
	- Datos inconsistentes
	- Falta de información obligatoria
	- Patrones irregulares

	Responde en formato JSON:
	{{
	"nivel_riesgo": "bajo/medio/alto",
	"alertas": ["alerta1", "alerta2"],
	"recomendacion": "texto"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.2
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"nivel_riesgo": "bajo", "alertas": [], "recomendacion": "No se detectaron irregularidades evidentes"}

	# ============= PREDICCIÓN DE FECHA DE PAGO =============
	def predecir_fecha_pago(datos_json, client):
	"""Predice la mejor fecha de pago basándose en condiciones de la factura"""

	prompt = f"""Basándote en esta factura, sugiere la fecha óptima de pago:

	DATOS: {json.dumps(datos_json, indent=2)}

	Considera:
	- Fecha de emisión
	- Plazos habituales (30, 60, 90 días)
	- Descuentos por pronto pago
	- Recargos por mora

	Responde en JSON:
	{{
	"fecha_sugerida": "DD/MM/YYYY",
	"razon": "explicación breve",
	"ahorro_posible": "cantidad o N/A"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=300,
	temperature=0.3
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"fecha_sugerida": "N/A", "razon": "No se pudo calcular", "ahorro_posible": "N/A"}

	# ============= GENERADOR DE RESUMEN EJECUTIVO =============
	def generar_resumen_ejecutivo(datos_json, client):
	"""Genera un resumen ejecutivo tipo dashboard para gerencia"""

	prompt = f"""Crea un resumen ejecutivo profesional de esta factura:

	DATOS: {json.dumps(datos_json, indent=2)}

	Incluye:
	- Resumen en 2-3 líneas
	- Puntos clave financieros
	- Impacto en presupuesto
	- Acción requerida

	Formato profesional y conciso:"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.4
	)

	return response.choices[0].message.content
	except:
	return "No se pudo generar el resumen ejecutivo"

	# ============= ANÁLISIS DE DUPLICADOS =============
	def detectar_facturas_duplicadas(datos_json, client):
	"""Analiza si esta factura puede ser un duplicado"""

	prompt = f"""Analiza esta factura y determina indicadores de duplicación:

	DATOS: {json.dumps(datos_json, indent=2)}

	Busca:
	- Patrones de números de factura sospechosos
	- Fechas anómalas
	- Importes repetitivos

	Responde en JSON:
	{{
	"posible_duplicado": true/false,
	"nivel_confianza": "bajo/medio/alto",
	"indicadores": ["indicador1", "indicador2"],
	"recomendacion": "texto"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=300,
	temperature=0.2
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"posible_duplicado": False, "nivel_confianza": "bajo", "indicadores": [], "recomendacion": "No se detectaron patrones duplicados"}

	# ============= CALCULADORA DE IMPACTO PRESUPUESTARIO =============
	def calcular_impacto_presupuesto(datos_json, client):
	"""Calcula el impacto de esta factura en un presupuesto mensual promedio"""

	total = datos_json.get('totales', {}).get('total', datos_json.get('total', 0))

	prompt = f"""Analiza el impacto presupuestario de esta factura:

	Total: {total}€
	Datos: {json.dumps(datos_json, indent=2)}

	Calcula:
	- Porcentaje sobre presupuesto promedio PYME (10.000€/mes)
	- Nivel de impacto
	- Recomendaciones de planificación

	Responde en JSON:
	{{
	"impacto_porcentaje": number,
	"nivel_impacto": "bajo/medio/alto/crítico",
	"analisis": "texto",
	"recomendacion_financiera": "texto"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.3
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"impacto_porcentaje": 0, "nivel_impacto": "bajo", "analisis": "No disponible", "recomendacion_financiera": "Consulte con su contador"}

	# ============= GENERADOR DE RECORDATORIOS =============
	def generar_recordatorios_pago(datos_json, client):
	"""Genera recordatorios inteligentes de pago"""

	prompt = f"""Basándote en esta factura, genera un plan de recordatorios de pago:

	DATOS: {json.dumps(datos_json, indent=2)}

	Crea:
	- 3 recordatorios (inicial, intermedio, urgente)
	- Fechas sugeridas
	- Mensajes personalizados

	Responde en JSON:
	{{
	"recordatorios": [
	{{"tipo": "inicial", "dias_antes": number, "mensaje": "texto"}},
	{{"tipo": "intermedio", "dias_antes": number, "mensaje": "texto"}},
	{{"tipo": "urgente", "dias_antes": number, "mensaje": "texto"}}
	]
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=500,
	temperature=0.4
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"recordatorios": []}

	# ============= ANÁLISIS DE CONDICIONES DE PAGO =============
	def analizar_condiciones_pago(datos_json, texto, client):
	"""Analiza las condiciones de pago y sugiere negociaciones"""

	prompt = f"""Analiza las condiciones de pago de esta factura:

	DATOS: {json.dumps(datos_json, indent=2)}
	TEXTO: {texto[:2000]}

	Identifica:
	- Plazo de pago actual
	- Condiciones especiales
	- Oportunidades de negociación
	- Descuentos por pronto pago

	Responde en JSON:
	{{
	"plazo_actual": "texto",
	"condiciones_especiales": ["condicion1", "condicion2"],
	"oportunidades_negociacion": "texto",
	"sugerencias_mejora": "texto"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.3
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"plazo_actual": "N/A", "condiciones_especiales": [], "oportunidades_negociacion": "No detectadas", "sugerencias_mejora": "Revisar manualmente"}

	# ============= COMPARADOR CON MERCADO =============
	def comparar_precios_mercado(datos_json, client):
	"""Compara los precios de la factura con precios de mercado promedio"""

	productos = datos_json.get('productos', [])
	if not productos:
	return {"analisis": "No hay productos para comparar"}

	productos_texto = "\n".join([f"- {p.get('descripcion', 'N/A')}: {p.get('precio_unitario', 0)}€" for p in productos[:5]])

	prompt = f"""Analiza si estos precios son razonables comparados con el mercado:

	PRODUCTOS Y PRECIOS:
	{productos_texto}

	Determina:
	- ¿Los precios son competitivos?
	- ¿Hay precios excesivamente altos?
	- Recomendaciones

	Responde en JSON:
	{{
	"evaluacion_general": "competitivo/normal/elevado",
	"productos_caros": ["producto1", "producto2"],
	"ahorro_potencial": number,
	"recomendacion": "texto"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.3
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"evaluacion_general": "normal", "productos_caros": [], "ahorro_potencial": 0, "recomendacion": "Precios dentro del rango esperado"}

	# ============= VALIDADOR DE DATOS FISCALES =============
	def validar_datos_fiscales(datos_json, client):
	"""Valida que los datos fiscales sean correctos y completos"""

	prompt = f"""Valida los datos fiscales de esta factura:

	DATOS: {json.dumps(datos_json, indent=2)}

	Verifica:
	- NIF/CIF válido (formato español)
	- IVA correcto (21%, 10%, 4%)
	- Datos obligatorios presentes
	- Formato de factura legal

	Responde en JSON:
	{{
	"es_valida": true/false,
	"errores": ["error1", "error2"],
	"advertencias": ["advertencia1"],
	"nivel_cumplimiento": "completo/parcial/insuficiente"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=400,
	temperature=0.2
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"es_valida": True, "errores": [], "advertencias": [], "nivel_cumplimiento": "completo"}

	def extraer_gastos_deducibles(datos_json, texto, client):
	"""Identifica qué parte de la factura es deducible fiscalmente"""

	prompt = f"""Analiza esta factura e identifica los gastos deducibles fiscalmente en España:

	DATOS: {json.dumps(datos_json, indent=2)}
	TEXTO: {texto[:2000]}

	Responde en JSON:
	{{
	"porcentaje_deducible": number,
	"importe_deducible": number,
	"tipo_deduccion": "texto",
	"explicacion": "texto breve"
	}}"""

	try:
	response = client.chat.completions.create(
	model="Qwen/Qwen2.5-72B-Instruct",
	messages=[{"role": "user", "content": prompt}],
	max_tokens=300,
	temperature=0.3
	)

	resultado = response.choices[0].message.content
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado).strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	return json.loads(match.group(0))
	except:
	pass

	return {"porcentaje_deducible": 0, "importe_deducible": 0, "tipo_deduccion": "N/A", "explicacion": "Consulta con un asesor fiscal"}

	# ============= ANALIZAR CON LLM Y CONVERTIR A JSON =============
	def analizar_y_convertir_json(texto):
	"""El LLM lee la factura y devuelve JSON estructurado"""

	token = os.getenv("aa")
	if not token:
	return None, None, "Error: Falta configurar HF_TOKEN en Settings → Secrets"

	texto_limpio = texto[:8000]

	prompt = f"""Eres un experto en análisis de facturas. Lee esta factura y conviértela a JSON.
	TEXTO DE LA FACTURA:
	{texto_limpio}
	INSTRUCCIONES:
	1. Analiza el texto y decide qué información es importante extraer
	2. Crea un JSON estructurado con TODOS los datos que encuentres
	3. Incluye: número de factura, fecha, emisor, cliente, productos/servicios, importes
	4. Para los números: usa formato numérico puro (ejemplo: 250 no "250€")
	5. Si hay tabla de productos, extrae CADA producto con cantidad, precio y total
	FORMATO JSON (ajusta según lo que encuentres):
	{{
	"numero_factura": "string",
	"fecha": "DD/MM/YYYY",
	"emisor": {{
	"nombre": "string",
	"nif": "string",
	"direccion": "string"
	}},
	"cliente": {{
	"nombre": "string",
	"nif": "string"
	}},
	"productos": [
	{{
	"descripcion": "string",
	"cantidad": number,
	"precio_unitario": number,
	"total": number
	}}
	],
	"totales": {{
	"base_imponible": number,
	"iva": number,
	"porcentaje_iva": number,
	"total": number
	}}
	}}
	Responde SOLO con el JSON válido (sin explicaciones, sin markdown):"""

	modelos = [
	"Qwen/Qwen2.5-72B-Instruct",
	"meta-llama/Llama-3.2-3B-Instruct",
	"mistralai/Mistral-Nemo-Instruct-2407"
	]

	for modelo in modelos:
	try:
	print(f"\nProbando: {modelo}")
	client = InferenceClient(token=token)

	response = client.chat.completions.create(
	model=modelo,
	messages=[{"role": "user", "content": prompt}],
	max_tokens=2000,
	temperature=0.1
	)

	resultado = response.choices[0].message.content
	resultado = resultado.strip()
	resultado = re.sub(r'```json\s*', '', resultado)
	resultado = re.sub(r'```\s*', '', resultado)
	resultado = resultado.strip()

	match = re.search(r'\{.*\}', resultado, re.DOTALL)
	if match:
	json_str = match.group(0)
	try:
	datos_json = json.loads(json_str)
	print(f"JSON válido extraído con {modelo}")

	resumen_util = generar_resumen_util(texto_limpio, modelo, client)

	return datos_json, resumen_util, f"Procesado con {modelo}"
	except json.JSONDecodeError as e:
	print(f"JSON inválido: {str(e)[:50]}")
	continue

	except Exception as e:
	print(f"{modelo} falló: {str(e)[:100]}")
	continue

	return None, None, "Ningún modelo LLM pudo extraer el JSON. Verifica tu HF_TOKEN."

	# ============= GENERAR RESUMEN ÚTIL =============
	def generar_resumen_util(texto, modelo, client):
	"""Genera un resumen con información útil para administrativos"""

	prompt_resumen = f"""Analiza esta factura y proporciona información útil para un administrativo o usuario medio.
	TEXTO DE LA FACTURA:
	{texto[:6000]}
	Genera un resumen estructurado con:
	1. ESTADO DE PAGO: ¿Está pagada? ¿Fecha de vencimiento?
	2. INFORMACIÓN CLAVE: Datos importantes que destacar
	3. ALERTAS: Cualquier aspecto que requiera atención (vencimientos, importes altos, etc.)
	4. RESUMEN EJECUTIVO: Descripción breve y clara de la factura
	Responde en español de forma clara y profesional:"""

	try:
	response = client.chat.completions.create(
	model=modelo,
	messages=[{"role": "user", "content": prompt_resumen}],
	max_tokens=800,
	temperature=0.4
	)
	return response.choices[0].message.content
	except:
	return "No se pudo generar el resumen de información útil."

	# ============= CONVERTIR JSON A CSV TABULAR =============
	def json_a_csv(datos_json):
	"""Convierte el JSON en un DataFrame CSV con formato tabular usando comas"""

	if not datos_json:
	return None

	filas = []

	# Información general
	filas.append({
	'Sección': 'INFORMACIÓN GENERAL',
	'Campo': 'Número de Factura',
	'Valor': datos_json.get('numero_factura', 'N/A'),
	'Tipo': 'Identificador'
	})
	filas.append({
	'Sección': 'INFORMACIÓN GENERAL',
	'Campo': 'Fecha',
	'Valor': datos_json.get('fecha', 'N/A'),
	'Tipo': 'Fecha'
	})

	# Emisor
	if 'emisor' in datos_json:
	emisor = datos_json['emisor']
	if isinstance(emisor, dict):
	for key, value in emisor.items():
	filas.append({
	'Sección': 'EMISOR',
	'Campo': key.replace('_', ' ').title(),
	'Valor': str(value),
	'Tipo': 'Información'
	})

	# Cliente
	if 'cliente' in datos_json:
	cliente = datos_json['cliente']
	if isinstance(cliente, dict):
	for key, value in cliente.items():
	filas.append({
	'Sección': 'CLIENTE',
	'Campo': key.replace('_', ' ').title(),
	'Valor': str(value),
	'Tipo': 'Información'
	})

	# Productos
	productos = datos_json.get('productos', datos_json.get('conceptos', datos_json.get('items', [])))
	if productos and len(productos) > 0:
	for i, prod in enumerate(productos, 1):
	filas.append({
	'Sección': 'PRODUCTOS',
	'Campo': f'Producto {i}',
	'Valor': prod.get('descripcion', 'N/A'),
	'Tipo': 'Descripción'
	})
	filas.append({
	'Sección': 'PRODUCTOS',
	'Campo': f'Cantidad P{i}',
	'Valor': str(prod.get('cantidad', '')),
	'Tipo': 'Numérico'
	})
	filas.append({
	'Sección': 'PRODUCTOS',
	'Campo': f'Precio Unitario P{i}',
	'Valor': f"{prod.get('precio_unitario', 0)}",
	'Tipo': 'Monetario'
	})
	filas.append({
	'Sección': 'PRODUCTOS',
	'Campo': f'Total P{i}',
	'Valor': f"{prod.get('total', 0)}",
	'Tipo': 'Monetario'
	})

	# Totales
	totales = datos_json.get('totales', {})
	if totales or 'base_imponible' in datos_json or 'total' in datos_json:
	base = totales.get('base_imponible', datos_json.get('base_imponible', 0))
	iva = totales.get('iva', datos_json.get('iva', 0))
	porcentaje_iva = totales.get('porcentaje_iva', datos_json.get('porcentaje_iva', 0))
	total = totales.get('total', datos_json.get('total', 0))

	filas.append({
	'Sección': 'TOTALES',
	'Campo': 'Base Imponible',
	'Valor': f"{base}",
	'Tipo': 'Monetario'
	})
	filas.append({
	'Sección': 'TOTALES',
	'Campo': f'IVA ({porcentaje_iva}%)',
	'Valor': f"{iva}",
	'Tipo': 'Monetario'
	})
	filas.append({
	'Sección': 'TOTALES',
	'Campo': 'TOTAL',
	'Valor': f"{total}",
	'Tipo': 'Monetario'
	})

	return pd.DataFrame(filas)

	# ============= GENERAR PDF TEMPLATES =============
	def generar_pdf_clasico(csv_file, datos_json):
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	pdf_filename = f"factura_clasica_{timestamp}.pdf"
	doc = SimpleDocTemplate(pdf_filename, pagesize=A4)
	story = []
	styles = getSampleStyleSheet()

	titulo_style = ParagraphStyle('CustomTitle', parent=styles['Heading1'], fontSize=24,
	textColor=colors.HexColor('#1a1a1a'), spaceAfter=30, alignment=TA_CENTER)
	story.append(Paragraph("FACTURA", titulo_style))
	story.append(Spacer(1, 0.3*inch))

	info_data = [['Número de Factura:', datos_json.get('numero_factura', 'N/A')],
	['Fecha:', datos_json.get('fecha', 'N/A')]]
	info_table = Table(info_data, colWidths=[2inch, 4inch])
	info_table.setStyle(TableStyle([('FONTNAME', (0, 0), (-1, -1), 'Helvetica'), ('FONTSIZE', (0, 0), (-1, -1), 11)]))
	story.append(info_table)

	doc.build(story)
	return pdf_filename

	def generar_pdf_moderno(csv_file, datos_json):
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	pdf_filename = f"factura_moderna_{timestamp}.pdf"
	doc = SimpleDocTemplate(pdf_filename, pagesize=A4)
	story = []
	styles = getSampleStyleSheet()

	titulo_style = ParagraphStyle('ModernTitle', parent=styles['Heading1'], fontSize=32,
	textColor=colors.HexColor('#2196F3'), spaceAfter=10, alignment=TA_LEFT, fontName='Helvetica-Bold')
	story.append(Paragraph("FACTURA", titulo_style))

	doc.build(story)
	return pdf_filename

	def generar_pdf_elegante(csv_file, datos_json):
	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	pdf_filename = f"factura_elegante_{timestamp}.pdf"
	doc = SimpleDocTemplate(pdf_filename, pagesize=A4)
	story = []
	styles = getSampleStyleSheet()

	header_style = ParagraphStyle('ElegantHeader', parent=styles['Heading1'], fontSize=28,
	textColor=colors.HexColor('#1a237e'), spaceAfter=5, alignment=TA_CENTER, fontName='Helvetica-Bold')
	story.append(Paragraph("F A C T U R A", header_style))

	doc.build(story)
	return pdf_filename

	# ============= FUNCIÓN PRINCIPAL =============
	def procesar_factura(pdf_file):
	if pdf_file is None:
	return "", None, None, "", "", None, None, pdf_file

	print("\n--- Extrayendo texto del PDF...")
	texto = extraer_texto_pdf(pdf_file)

	if texto.startswith("Error"):
	return "", None, None, "", f"Error: {texto}", None, None, None

	texto_preview = f"{texto[:1500]}..." if len(texto) > 1500 else texto

	print("--- El LLM está analizando la factura y creando el JSON...")
	datos_json, resumen_util, mensaje = analizar_y_convertir_json(texto)

	if not datos_json:
	return texto_preview, None, None, "", mensaje, None, None, pdf_file

	print("--- Convirtiendo JSON a CSV tabular...")
	df = json_a_csv(datos_json)

	timestamp = datetime.now().strftime('%Y%m%d_%H%M%S')
	numero = datos_json.get('numero_factura', 'factura')
	numero = re.sub(r'[^\w\-]', '_', str(numero))
	csv_filename = f"{numero}_{timestamp}.csv"

	# Guardar CSV con comas como separador
	df.to_csv(csv_filename, index=False, encoding='utf-8-sig', sep=',')

	resumen_tecnico = f"""## Factura Procesada Exitosamente
	Consulta más información abajo
	---
	### Estructura JSON Generada
	```json
	{json.dumps(datos_json, indent=2, ensure_ascii=False)}
	```
	---
	### Información del Archivo CSV
	Nombre del archivo: `{csv_filename}`
	Total de filas: {len(df)}
	Formato: UTF-8 con BOM, separador: coma (,)
	---
	### Datos Principales Extraídos
	Número de factura: {datos_json.get('numero_factura', 'N/A')}
	Fecha de emisión: {datos_json.get('fecha', 'N/A')}
	Productos/Servicios: {len(datos_json.get('productos', datos_json.get('conceptos', [])))} items
	Importe total: {datos_json.get('totales', {}).get('total', datos_json.get('total', 'N/A'))} EUR
	"""

	print(f"--- CSV guardado: {csv_filename}")
	return texto_preview, df, csv_filename, resumen_tecnico, resumen_util, datos_json, csv_filename, pdf_file

	# ============= GENERAR PDF CON TEMPLATE SELECCIONADO =============
	def generar_pdf_con_template(template, csv_file, datos_json):
	if not datos_json:
	return None, "Error: Primero debes procesar una factura"

	try:
	if template == "Clásico":
	pdf_file = generar_pdf_clasico(csv_file, datos_json)
	elif template == "Moderno":
	pdf_file = generar_pdf_moderno(csv_file, datos_json)
	elif template == "Elegante":
	pdf_file = generar_pdf_elegante(csv_file, datos_json)
	else:
	return None, "Template no válido"

	return pdf_file, f"PDF generado exitosamente: {pdf_file}"
	except Exception as e:
	return None, f"Error al generar PDF: {str(e)}"

	# ============= INTERFAZ GRADIO =============
	with gr.Blocks(title="Extractor de Facturas con IA Avanzada") as demo:

	datos_json_state = gr.State()
	csv_file_state = gr.State()
	pdf_path_state = gr.State()
	texto_state = gr.State()

	gr.Markdown("""
	# FACTULAB
	### Extrae datos de facturas PDF con IA, rápido y sin complicaciones.
	""")

	gr.Markdown("---")

	with gr.Tabs():
	# ============= TAB 1: EXTRACCIÓN AUTOMÁTICA =============
	with gr.Tab("Extracción Automática"):
	with gr.Row():
	with gr.Column(scale=1):
	gr.Markdown("### Subir Factura PDF")
	pdf_input = gr.File(label="Seleccionar factura PDF", file_types=[".pdf"], type="filepath")
	btn_extraer = gr.Button(" Extraer Datos de la Factura", variant="primary", size="lg")

	# Indicador de carga silencioso
	loading_extraccion = gr.HTML(visible=False, value="""
	<div style="text-align: center; padding: 20px;">
	<div class="spinner"></div>
	<p style="margin-top: 10px; color: #2196F3; font-weight: bold;">
	Procesando tu factura...
	</p>
	</div>
	<style>
	.spinner {
	border: 3px solid #f3f3f3;
	border-top: 3px solid #2196F3;
	border-radius: 50%;
	width: 35px;
	height: 35px;
	animation: spin 1s linear infinite;
	margin: 0 auto;
	}
	@keyframes spin {
	0% { transform: rotate(0deg); }
	100% { transform: rotate(360deg); }
	}
	</style>
	""")

	gr.Markdown("---")
	gr.Markdown("### Descarga tu factura en formato CSV")
	csv_output = gr.File(label="CSV Tabular (separado por comas)")

	gr.Markdown("---")
	gr.Markdown("### Rediseña tu PDF con un template")
	template_selector = gr.Radio(
	choices=["Clásico", "Moderno", "Elegante"],
	value="Moderno",
	label="Estilo de factura"
	)
	btn_generar_pdf = gr.Button("Generar Factura PDF", variant="secondary", size="lg")
	pdf_output = gr.File(label="Descargar PDF generado")
	pdf_status = gr.Textbox(label="Estado", interactive=False, lines=2)

	with gr.Column(scale=2):
	gr.Markdown("### ")
	info_util = gr.Markdown(value="Aquí aparecerá información una vez procesada la factura")
	gr.Markdown("---")
	with gr.Tabs():
	with gr.Tab("Vista previa CSV"):
	tabla_preview = gr.DataFrame(label="Datos estructurados en formato tabular", wrap=True)
	with gr.Tab("Texto procesado de tu PDF"):
	texto_extraido = gr.Textbox(label="Texto extraído del PDF", lines=18)
	with gr.Tab("Más información"):
	resumen_tecnico = gr.Markdown(label="Estructura de datos y metadatos")

	# ============= TAB 2: ASISTENTE IA CON VOZ Y AVATAR =============
	# ============= TAB 2: ASISTENTE IA CON ANÁLISIS EMOCIONAL =============
	with gr.Tab(" Pregunta a la IA sobre tu factura"):
	gr.Markdown("""
	# Modelo base IA
	### Pregúntale cualquier cosa sobre tu factura
	""")

	with gr.Row():
	with gr.Column(scale=1):
	pregunta_ia = gr.Textbox(
	label="Tu pregunta ",
	placeholder="Ejemplo: ¿Cuál es el total de esta factura?",
	value="¿Cuál es el total de esta factura y cuándo debería pagarla?",
	lines=4
	)

	btn_consulta_ia = gr.Button("Consultar", variant="primary", size="lg")

	# Indicador de carga
	loading_ia = gr.HTML(visible=False, value="""
	<div style="text-align: center; padding: 20px;">
	<div class="spinner-ia"></div>
	<p style="margin-top: 10px; color: #9C27B0; font-weight: bold;">
	El asistente está analizando...
	</p>
	</div>
	<style>
	.spinner-ia {
	border: 3px solid #f3f3f3;
	border-top: 3px solid #9C27B0;
	border-radius: 50%;
	width: 40px;
	height: 40px;
	animation: spin 0.8s linear infinite;
	margin: 0 auto;
	}
	</style>
	""")

	gr.Markdown("---")
	gr.Markdown("#### Ejemplos de preguntas:")
	gr.Markdown("""
	- ¿Cuál es el total de la factura?
	- ¿Qué es la base imponible?
	- ¿Cuándo debo pagar esta factura?
	- ¿Hay algún descuento aplicado?
	- ¿Quién emitió esta factura?
	""")

	# Indicador de emoción


	with gr.Column(scale=2):
	gr.Markdown("### ")



	gr.Markdown("### Respuesta a tu consulta")
	resultado_ia = gr.Markdown(
	value="Haz una pregunta y el asistente te responderá aquí..."
	)

	gr.Markdown("---")
	gr.Markdown("### Lectura automática de la respuesta")

	with gr.Row():
	with gr.Column():
	audio_respuesta = gr.Audio(
	label=" Reproducir respuesta en audio",
	type="filepath",
	visible=True,
	autoplay=True
	)
	with gr.Column():
	transcripcion_output = gr.File(
	label=" Descargar Transcripción (TXT)"
	)



	# ============= TAB 3: HERRAMIENTAS IA AVANZADAS =============
	with gr.Tab("Consulta el analisis inteligente de tu factura"):
	gr.Markdown("""

	#### Verifica la información sensible
	""")

	with gr.Tabs():
	# Sub-tab 1: Análisis Financiero
	with gr.Tab(" Análisis IA"):
	with gr.Row():
	with gr.Column():
	gr.Markdown("### ")
	btn_sentimiento = gr.Button(" Riesgos", variant="primary")
	resultado_sentimiento = gr.Markdown()

	gr.Markdown("---")
	gr.Markdown("### ")
	btn_deducibles = gr.Button(" Calcular Deducciones", variant="primary")
	resultado_deducibles = gr.Markdown()

	gr.Markdown("---")
	gr.Markdown("### ")
	btn_impacto = gr.Button(" Impacto presupuestario", variant="primary")
	resultado_impacto = gr.Markdown()

	with gr.Column():
	gr.Markdown("### ")
	btn_prediccion = gr.Button(" Predicción de pago", variant="primary")
	resultado_prediccion = gr.Markdown()

	gr.Markdown("---")
	gr.Markdown("### ")
	btn_sugerencias = gr.Button(" Generar Recomendaciones", variant="primary")
	resultado_sugerencias = gr.Markdown()

	gr.Markdown("---")
	gr.Markdown("### ")
	btn_categoria = gr.Button(" Clasificar Gasto", variant="primary")
	resultado_categoria = gr.Markdown()

	# Sub-tab 2: Seguridad y Validación
	with gr.Tab(" Análisis de riesgos"):
	with gr.Row():
	with gr.Column():
	gr.Markdown("### ")
	btn_fraude = gr.Button("Irregularidades", variant="primary")
	resultado_fraude = gr.Markdown()



	gr.Markdown("---")
	gr.Markdown("### ")
	btn_validador = gr.Button(" Datos Fiscales", variant="primary")
	resultado_validador = gr.Markdown()

	with gr.Column():
	gr.Markdown("### ")
	btn_condiciones = gr.Button(" Analizar Condiciones", variant="primary")
	resultado_condiciones = gr.Markdown()

	gr.Markdown("---")
	gr.Markdown("### ")
	btn_recordatorios = gr.Button(" Generar Recordatorios de pago", variant="primary")
	resultado_recordatorios = gr.Markdown()

	gr.Markdown("---")
	gr.Markdown("### ")
	btn_ejecutivo = gr.Button(" Dashboard Básico", variant="primary")
	resultado_ejecutivo = gr.Markdown()

	# Sub-tab 3: Comparación y Mercado
	with gr.Tab(" Análisis IA de Mercado"):
	gr.Markdown("### Comparador de Precios con Mercado")
	btn_mercado = gr.Button(" Analizar", variant="primary", size="lg")
	resultado_mercado = gr.Markdown()


	# ============= TAB 4: TRADUCCIÓN MULTIIDIOMA CON TABLA =============
	with gr.Tab(" Traduce tu factura a otro idioma"):
	gr.Markdown("""
	#
	### Traduce tu factura a 5 idiomas con vista tabular y exporta a CSV
	""")

	with gr.Row():
	with gr.Column():
	gr.Markdown("### Seleccionar Idioma")
	idioma_selector = gr.Dropdown(
	choices=["Inglés", "Francés", "Alemán", "Italiano", "Portugués"],
	value="Inglés",
	label=" Selecciona un idioma"
	)
	btn_traducir = gr.Button(" Traducir Factura", variant="primary", size="lg")

	gr.Markdown("---")
	gr.Markdown("### Exportar Traducción")
	csv_traduccion_output = gr.File(label=" Descargar CSV Tabular Traducido")

	with gr.Column():
	gr.Markdown("### Vista Tabular Traducida")
	tabla_traduccion = gr.DataFrame(
	label="Factura traducida en formato tabular",
	wrap=True
	)

	gr.Markdown("---")
	gr.Markdown("### Texto Traducido")
	resultado_traduccion = gr.Textbox(
	label="Resumen en texto",
	lines=10,
	placeholder="La traducción aparecerá aquí..."
	)



	gr.Markdown("---")


	# ============= CONECTAR EVENTOS =============

	# Extracción automática
	def procesar_con_loading(pdf_file):
	if pdf_file is None:
	return "", None, None, "", "", None, None, None, gr.update(visible=False)

	yield "", None, None, "", "", None, None, None, gr.update(visible=True)
	time.sleep(0.5)
	resultado = procesar_factura(pdf_file)
	yield (*resultado, gr.update(visible=False))

	btn_extraer.click(
	fn=procesar_con_loading,
	inputs=[pdf_input],
	outputs=[texto_extraido, tabla_preview, csv_output, resumen_tecnico, info_util,
	datos_json_state, csv_file_state, pdf_path_state, loading_extraccion]
	)

	# Generar PDF
	btn_generar_pdf.click(
	fn=generar_pdf_con_template,
	inputs=[template_selector, csv_file_state, datos_json_state],
	outputs=[pdf_output, pdf_status]
	)

	def consultar_ia_con_loading(texto, pregunta):
	if not texto:
	return ("❌ Por favor, procesa una factura primero", None, None, gr.update(visible=False))

	yield ("🔄 El asistente está analizando tu pregunta...", None, None, gr.update(visible=True))
	time.sleep(0.3)

	try:
	respuesta, audio, transcripcion = asistente_ia_factura(texto, pregunta)



	audio_final = audio if (audio and os.path.exists(audio) and os.path.getsize(audio) > 100) else None

	if audio_final:
	print(f"✅ Audio disponible: {audio_final}")
	else:
	print("⚠️ Audio no disponible")
	emocion_info += "\n\n⚠️ El audio no pudo generarse, pero la respuesta está en texto."

	yield (respuesta, audio_final, transcripcion, gr.update(visible=False))

	except Exception as e:
	error_msg = f"❌ Error: {str(e)[:200]}"
	print(f"Error completo: {str(e)}")
	yield (error_msg, None, None, gr.update(visible=False))


	btn_consulta_ia.click(
	fn=consultar_ia_con_loading,
	inputs=[texto_extraido, pregunta_ia],
	outputs=[resultado_ia, audio_respuesta, transcripcion_output, loading_ia]

	)

	# Funciones de análisis avanzado
	def ejecutar_sentimiento(texto):
	if not texto:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = analizar_sentimiento_factura(texto, client)
	emoji_sentimiento = {"positivo": "✅", "neutral": "⚪", "alerta": "⚠️"}
	emoji_urgencia = {"alta": "🔴", "media": "🟡", "baja": "🟢"}
	return f"""### {emoji_sentimiento.get(resultado['sentimiento'], '⚪')} Análisis de Sentimiento

	Estado: {resultado['sentimiento'].upper()}
	Urgencia: {emoji_urgencia.get(resultado['urgencia'], '⚪')} {resultado['urgencia'].upper()}

	Razón: {resultado['razon']}

	Recomendación: {resultado['recomendacion']}"""

	def ejecutar_fraude(datos_json, texto):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = detectar_fraude_factura(datos_json, texto, client)
	nivel_color = {"bajo": "🟢", "medio": "🟡", "alto": "🔴"}
	alertas_texto = "\n".join([f"- {alerta}" for alerta in resultado.get('alertas', [])])
	return f"""### {nivel_color.get(resultado['nivel_riesgo'], '⚪')} Detección de Fraude

	Nivel de Riesgo: {resultado['nivel_riesgo'].upper()}

	Alertas Detectadas:
	{alertas_texto if alertas_texto else "- No se detectaron alertas"}

	Recomendación: {resultado['recomendacion']}"""

	def ejecutar_deducibles(datos_json, texto):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = extraer_gastos_deducibles(datos_json, texto, client)
	return f"""### 💰 Análisis de Gastos Deducibles

	Porcentaje Deducible: {resultado['porcentaje_deducible']}%
	Importe Deducible: {resultado['importe_deducible']}€
	Tipo de Deducción: {resultado['tipo_deduccion']}

	Explicación: {resultado['explicacion']}

	⚠️ Nota: Esta es una estimación. Consulta con tu asesor fiscal."""

	def ejecutar_sugerencias(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	return f"### 💡 Sugerencias Personalizadas\n\n{generar_sugerencias_ia(datos_json, client)}"

	def ejecutar_categoria(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	return f"### 🏷️ Categorización Automática\n\n{extraer_categorias_gasto(datos_json, client)}"

	def ejecutar_prediccion(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = predecir_fecha_pago(datos_json, client)
	return f"""### 📅 Predicción de Fecha de Pago Óptima

	Fecha Sugerida: {resultado['fecha_sugerida']}
	Razón: {resultado['razon']}
	Ahorro Posible: {resultado['ahorro_posible']}

	💡 Pagar en la fecha sugerida puede optimizar tu flujo de caja."""

	def ejecutar_ejecutivo(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	return f"### Resumen Ejecutivo - Dashboard\n\n{generar_resumen_ejecutivo(datos_json, client)}"

	# Traducción completa con tabla
	def ejecutar_traduccion_completa(texto, datos_json, idioma):
	if not texto:
	return "❌ Procesa una factura primero", None, None
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración", None, None
	client = InferenceClient(token=token)
	texto_traducido, df_traducido, csv_filename = traducir_factura_con_csv(datos_json, texto, idioma, client)
	return texto_traducido, df_traducido, csv_filename

	def ejecutar_duplicados(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = detectar_facturas_duplicadas(datos_json, client)
	return f"""### 🔄 Análisis de Duplicados

	¿Es posible duplicado? {'✅ SÍ' if resultado['posible_duplicado'] else '❌ NO'}
	Nivel de confianza: {resultado['nivel_confianza'].upper()}

	Indicadores:
	{chr(10).join([f"- {ind}" for ind in resultado.get('indicadores', [])]) if resultado.get('indicadores') else '- No se detectaron indicadores'}

	Recomendación: {resultado['recomendacion']}"""

	def ejecutar_impacto(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = calcular_impacto_presupuesto(datos_json, client)
	nivel_emoji = {"bajo": "🟢", "medio": "🟡", "alto": "🟠", "crítico": "🔴"}
	return f"""### 📊 Impacto Presupuestario

	Porcentaje del presupuesto: {resultado['impacto_porcentaje']}%
	Nivel de impacto: {nivel_emoji.get(resultado['nivel_impacto'], '⚪')} {resultado['nivel_impacto'].upper()}

	Análisis: {resultado['analisis']}

	Recomendación Financiera: {resultado['recomendacion_financiera']}"""

	def ejecutar_recordatorios(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = generar_recordatorios_pago(datos_json, client)
	recordatorios = resultado.get('recordatorios', [])
	texto = "### Plan de Recordatorios de Pago\n\n"
	for r in recordatorios:
	texto += f"{r.get('tipo', '').upper()} ({r.get('dias_antes', 0)} días antes):\n"
	texto += f"{r.get('mensaje', '')}\n\n"
	return texto if recordatorios else "No se pudieron generar recordatorios"

	def ejecutar_condiciones(datos_json, texto):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = analizar_condiciones_pago(datos_json, texto, client)
	return f"""### Análisis de Condiciones de Pago

	Plazo Actual: {resultado['plazo_actual']}

	Condiciones Especiales:
	{chr(10).join([f"- {c}" for c in resultado.get('condiciones_especiales', [])]) if resultado.get('condiciones_especiales') else '- No detectadas'}

	Oportunidades de Negociación: {resultado['oportunidades_negociacion']}

	Sugerencias de Mejora: {resultado['sugerencias_mejora']}"""

	def ejecutar_mercado(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = comparar_precios_mercado(datos_json, client)
	eval_emoji = {"competitivo": "✅", "normal": "⚪", "elevado": "⚠️"}
	return f"""### 💲 Comparación con Precios de Mercado

	Evaluación General: {eval_emoji.get(resultado['evaluacion_general'], '⚪')} {resultado['evaluacion_general'].upper()}

	Productos con Precios Elevados:
	{chr(10).join([f"- {p}" for p in resultado.get('productos_caros', [])]) if resultado.get('productos_caros') else '- Todos los precios son razonables'}

	Ahorro Potencial: {resultado['ahorro_potencial']}€

	Recomendación: {resultado['recomendacion']}"""

	def ejecutar_validador(datos_json):
	if not datos_json:
	return "❌ Procesa una factura primero"
	token = os.getenv("aa")
	if not token:
	return "❌ Error de configuración"
	client = InferenceClient(token=token)
	resultado = validar_datos_fiscales(datos_json, client)
	return f"""### Validación de Datos Fiscales

	¿Es válida? {'✅ SÍ' if resultado['es_valida'] else '❌ NO'}
	Nivel de Cumplimiento: {resultado['nivel_cumplimiento'].upper()}

	Errores Detectados:
	{chr(10).join([f"- ❌ {e}" for e in resultado.get('errores', [])]) if resultado.get('errores') else '- No se detectaron errores'}

	Advertencias:
	{chr(10).join([f"- ⚠️ {a}" for a in resultado.get('advertencias', [])]) if resultado.get('advertencias') else '- No hay advertencias'}"""

	# Conectar funcionalidades

	btn_impacto.click(fn=ejecutar_impacto, inputs=[datos_json_state], outputs=[resultado_impacto])
	btn_recordatorios.click(fn=ejecutar_recordatorios, inputs=[datos_json_state], outputs=[resultado_recordatorios])
	btn_condiciones.click(fn=ejecutar_condiciones, inputs=[datos_json_state, texto_extraido], outputs=[resultado_condiciones])
	btn_mercado.click(fn=ejecutar_mercado, inputs=[datos_json_state], outputs=[resultado_mercado])
	btn_validador.click(fn=ejecutar_validador, inputs=[datos_json_state], outputs=[resultado_validador])
	btn_sentimiento.click(fn=ejecutar_sentimiento, inputs=[texto_extraido], outputs=[resultado_sentimiento])
	btn_fraude.click(fn=ejecutar_fraude, inputs=[datos_json_state, texto_extraido], outputs=[resultado_fraude])
	btn_deducibles.click(fn=ejecutar_deducibles, inputs=[datos_json_state, texto_extraido], outputs=[resultado_deducibles])
	btn_sugerencias.click(fn=ejecutar_sugerencias, inputs=[datos_json_state], outputs=[resultado_sugerencias])
	btn_categoria.click(fn=ejecutar_categoria, inputs=[datos_json_state], outputs=[resultado_categoria])
	btn_prediccion.click(fn=ejecutar_prediccion, inputs=[datos_json_state], outputs=[resultado_prediccion])
	btn_ejecutivo.click(fn=ejecutar_ejecutivo, inputs=[datos_json_state], outputs=[resultado_ejecutivo])

	# Traducción con tabla
	btn_traducir.click(
	fn=ejecutar_traduccion_completa,
	inputs=[texto_extraido, datos_json_state, idioma_selector],
	outputs=[resultado_traduccion, tabla_traduccion, csv_traduccion_output]
	)

	if __name__ == "__main__":
	demo.launch()