Testpdf / app.py
Docfile's picture
Update app.py
79b1a5a verified
raw
history blame
17.6 kB
from flask import Flask, Response, request, stream_with_context
from google import genai
from google.genai import types
import os
from PIL import Image
import io
import base64
import json
import requests # Pour les requêtes HTTP vers l'API Telegram
# --- Configuration ---
GOOGLE_API_KEY = os.environ.get("GEMINI_API_KEY")
TELEGRAM_BOT_TOKEN = os.environ.get("TELEGRAM_BOT_TOKEN") # Récupérer depuis les variables d'env
TELEGRAM_CHAT_ID = os.environ.get("TELEGRAM_CHAT_ID") # Récupérer depuis les variables d'env
if not GOOGLE_API_KEY:
raise ValueError("La variable d'environnement GEMINI_API_KEY n'est pas définie.")
# Optionnel: vérifier aussi TELEGRAM_BOT_TOKEN et TELEGRAM_CHAT_ID si vous voulez forcer leur utilisation
# if not TELEGRAM_BOT_TOKEN or not TELEGRAM_CHAT_ID:
# print("Attention: Les variables d'environnement Telegram ne sont pas toutes définies. L'envoi à Telegram pourrait échouer.")
app = Flask(__name__)
try:
client = genai.GenerativeModel(
model_name="gemini-1.5-flash-latest", # Ou "gemini-1.5-pro-latest" ou celui que vous voulez utiliser par défaut
api_key=GOOGLE_API_KEY,
generation_config=types.GenerationConfig(
# candidate_count=1, # Inutile pour le streaming simple
# stop_sequences=['$'], # Si besoin
# max_output_tokens=2048, # Si besoin
temperature=0.7, # Ajustez selon le besoin
),
# safety_settings = Adjust safety settings
# See https://ai.google.dev/gemini-api/docs/safety-settings
)
except Exception as e:
print(f"Erreur lors de l'initialisation du client GenAI : {e}")
client = None # Pour éviter des erreurs si l'initialisation échoue
# --- Fonctions Utilitaires ---
def send_to_telegram(image_data, caption="Nouvelle image pour résolution"):
if not TELEGRAM_BOT_TOKEN or not TELEGRAM_CHAT_ID:
print("Envoi à Telegram désactivé (variables d'environnement manquantes).")
return False
try:
url = f"https://api.telegram.org/bot{TELEGRAM_BOT_TOKEN}/sendPhoto"
files = {'photo': ('image.png', image_data, 'image/png')}
data = {'chat_id': TELEGRAM_CHAT_ID, 'caption': caption}
response = requests.post(url, files=files, data=data, timeout=10)
if response.status_code == 200:
print("Image envoyée avec succès à Telegram.")
return True
else:
print(f"Erreur lors de l'envoi à Telegram ({response.status_code}): {response.text}")
return False
except Exception as e:
print(f"Exception lors de l'envoi à Telegram: {e}")
return False
# --- Code HTML/CSS/JS pour le Frontend ---
HTML_PAGE = """
<!DOCTYPE html>
<html lang="fr">
<head>
<meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<title>Gemini Image Solver</title>
<style>
body { font-family: 'Segoe UI', Tahoma, Geneva, Verdana, sans-serif; margin: 0; padding: 20px; background-color: #f0f2f5; color: #333; display: flex; flex-direction: column; align-items: center; }
.container { background-color: #fff; padding: 25px; border-radius: 8px; box-shadow: 0 4px 12px rgba(0,0,0,0.1); width: 100%; max-width: 700px; }
h1 { color: #1a73e8; text-align: center; margin-bottom: 25px; }
input[type="file"] { display: block; margin-bottom: 15px; padding: 10px; border: 1px solid #ddd; border-radius: 4px; width: calc(100% - 22px); }
button { background-color: #1a73e8; color: white; padding: 12px 20px; border: none; border-radius: 4px; cursor: pointer; font-size: 16px; transition: background-color 0.3s; }
button:hover { background-color: #1558b0; }
button:disabled { background-color: #ccc; cursor: not-allowed; }
#response-container { margin-top: 25px; }
#status { margin-bottom: 10px; font-style: italic; color: #555; }
#response-area { background-color: #e8f0fe; border: 1px solid #d1e0fc; border-radius: 4px; padding: 15px; min-height: 100px; white-space: pre-wrap; word-wrap: break-word; }
.copy-button { background-color: #34a853; margin-top: 10px; }
.copy-button:hover { background-color: #2a8442; }
.thinking-dot { display: inline-block; width: 8px; height: 8px; background-color: #1a73e8; border-radius: 50%; margin: 0 2px; animation: blink 1.4s infinite both; }
.thinking-dot:nth-child(2) { animation-delay: .2s; }
.thinking-dot:nth-child(3) { animation-delay: .4s; }
@keyframes blink { 0%, 80%, 100% { opacity: 0; } 40% { opacity: 1; } }
</style>
</head>
<body>
<div class="container">
<h1>Résoudre une image avec Gemini</h1>
<input type="file" id="imageUpload" accept="image/*">
<button id="solveButton">Envoyer et Résoudre</button>
<div id="response-container">
<div id="status">Prêt à recevoir une image.</div>
<h2>Réponse de Gemini:</h2>
<div id="response-area"></div>
<button id="copyButton" class="copy-button" style="display:none;">Copier la Réponse</button>
</div>
</div>
<script>
const imageUpload = document.getElementById('imageUpload');
const solveButton = document.getElementById('solveButton');
const responseArea = document.getElementById('response-area');
const statusDiv = document.getElementById('status');
const copyButton = document.getElementById('copyButton');
let fullResponse = '';
solveButton.addEventListener('click', async () => {
const file = imageUpload.files[0];
if (!file) {
statusDiv.textContent = 'Veuillez sélectionner une image.';
return;
}
solveButton.disabled = true;
responseArea.textContent = '';
fullResponse = '';
copyButton.style.display = 'none';
statusDiv.innerHTML = 'Envoi et traitement en cours <span class="thinking-dot"></span><span class="thinking-dot"></span><span class="thinking-dot"></span>';
const formData = new FormData();
formData.append('image', file);
try {
const response = await fetch('/solve', {
method: 'POST',
body: formData
});
if (!response.ok) {
const errorData = await response.json();
throw new Error(errorData.error || `Erreur serveur: ${response.status}`);
}
const reader = response.body.getReader();
const decoder = new TextDecoder();
let buffer = '';
statusDiv.textContent = 'Réception de la réponse...';
while (true) {
const { value, done } = await reader.read();
if (done) break;
buffer += decoder.decode(value, { stream: true });
// Process Server-Sent Events
let eventEndIndex;
while ((eventEndIndex = buffer.indexOf('\\n\\n')) !== -1) {
const eventString = buffer.substring(0, eventEndIndex);
buffer = buffer.substring(eventEndIndex + 2); // Length of '\n\n'
if (eventString.startsWith('data: ')) {
try {
const jsonData = JSON.parse(eventString.substring(6)); // Length of 'data: '
if (jsonData.error) {
responseArea.textContent += `ERREUR: ${jsonData.error}\\n`;
statusDiv.textContent = 'Erreur lors de la génération.';
console.error("SSE Error:", jsonData.error);
break;
}
if (jsonData.mode === 'thinking') {
statusDiv.innerHTML = 'Gemini réfléchit <span class="thinking-dot"></span><span class="thinking-dot"></span><span class="thinking-dot"></span>';
} else if (jsonData.mode === 'answering') {
statusDiv.textContent = 'Gemini répond...';
}
if (jsonData.content) {
responseArea.textContent += jsonData.content;
fullResponse += jsonData.content;
}
} catch (e) {
console.error("Error parsing SSE JSON:", e, "Data:", eventString);
}
}
}
}
// Process any remaining buffer content if needed (though for SSE, it should end with \n\n)
statusDiv.textContent = 'Terminé.';
if(fullResponse) {
copyButton.style.display = 'block';
}
} catch (error) {
console.error('Erreur:', error);
responseArea.textContent = `Erreur: ${error.message}`;
statusDiv.textContent = 'Une erreur est survenue.';
} finally {
solveButton.disabled = false;
}
});
copyButton.addEventListener('click', () => {
if (navigator.clipboard && fullResponse) {
navigator.clipboard.writeText(fullResponse)
.then(() => {
const originalText = copyButton.textContent;
copyButton.textContent = 'Copié !';
setTimeout(() => { copyButton.textContent = originalText; }, 2000);
})
.catch(err => {
console.error('Erreur de copie: ', err);
statusDiv.textContent = 'Erreur lors de la copie.';
});
} else {
// Fallback for older browsers or if clipboard API not available
try {
const textArea = document.createElement("textarea");
textArea.value = fullResponse;
document.body.appendChild(textArea);
textArea.focus();
textArea.select();
document.execCommand('copy');
document.body.removeChild(textArea);
const originalText = copyButton.textContent;
copyButton.textContent = 'Copié !';
setTimeout(() => { copyButton.textContent = originalText; }, 2000);
} catch (err) {
console.error('Fallback copy error:', err);
statusDiv.textContent = "La copie a échoué. Veuillez copier manuellement.";
}
}
});
</script>
</body>
</html>
"""
# --- Routes Flask ---
@app.route('/')
def index():
return HTML_PAGE
@app.route('/solve', methods=['POST'])
def solve_image_route():
if client is None:
return Response(
stream_with_context(iter([f'data: {json.dumps({"error": "Le client Gemini n\'est pas initialisé."})}\n\n'])),
mimetype='text/event-stream'
)
if 'image' not in request.files:
return Response(
stream_with_context(iter([f'data: {json.dumps({"error": "Aucun fichier image fourni."})}\n\n'])),
mimetype='text/event-stream'
)
file = request.files['image']
if file.filename == '':
return Response(
stream_with_context(iter([f'data: {json.dumps({"error": "Aucun fichier sélectionné."})}\n\n'])),
mimetype='text/event-stream'
)
try:
image_data = file.read()
# Pour réutiliser image_data, il faut le "rembobiner" si on le lit plusieurs fois
# ou le stocker après la première lecture.
# Envoyer l'image à Telegram (optionnel)
# Note: send_to_telegram attend des bytes, image_data est déjà en bytes.
send_to_telegram(image_data, "Image reçue pour résolution Gemini")
# Préparer l'image pour Gemini
img = Image.open(io.BytesIO(image_data))
# Assurez-vous que le format est supporté par Gemini (PNG, JPEG, WEBP, HEIC, HEIF)
if img.format not in ['PNG', 'JPEG', 'WEBP', 'HEIC', 'HEIF']:
print(f"Format d'image original {img.format} non optimal, conversion en PNG.")
output_format = "PNG"
else:
output_format = img.format
buffered = io.BytesIO()
img.save(buffered, format=output_format)
img_bytes_for_gemini = buffered.getvalue()
# Le prompt pour Gemini
prompt_parts = [
types.Part.from_data(data=img_bytes_for_gemini, mime_type=f'image/{output_format.lower()}'),
types.Part.from_text("Résous ceci. Explique clairement ta démarche en français. Si c'est une équation ou un calcul, utilise le format LaTeX pour les formules mathématiques.")
]
def generate_stream():
current_mode = 'starting'
try:
# Utilisation de generate_content avec stream=True
# Le modèle choisi est "gemini-1.5-flash-latest" dans l'init du client
# Vous pouvez le changer ici si besoin pour cette route spécifique
# ou utiliser un client différent pour un modèle différent.
response_stream = client.generate_content(
contents=prompt_parts,
stream=True,
# generation_config peut être surchargé ici si besoin
# request_options={"timeout": 600} # Optionnel: timeout pour la requête
)
for chunk in response_stream:
# La structure de 'chunk' pour 1.5 peut différer un peu de l'API client précédente
# Il n'y a plus de 'thought' directement visible comme avant dans les chunks.
# La gestion "thinking" / "answering" devient moins directe.
# On va simplifier : on envoie le contenu dès qu'il arrive.
if current_mode != "answering":
yield f'data: {json.dumps({"mode": "answering"})}\n\n'
current_mode = "answering"
if chunk.parts:
for part in chunk.parts:
if hasattr(part, 'text') and part.text:
yield f'data: {json.dumps({"content": part.text})}\n\n'
elif hasattr(chunk, 'text') and chunk.text: # Pour certains retours directs
yield f'data: {json.dumps({"content": chunk.text})}\n\n'
except types.generation_types.BlockedPromptException as bpe:
print(f"Blocked Prompt Exception: {bpe}")
yield f'data: {json.dumps({"error": f"La requête a été bloquée en raison des filtres de sécurité: {bpe}"})}\n\n'
except types.generation_types.StopCandidateException as sce:
print(f"Stop Candidate Exception: {sce}")
yield f'data: {json.dumps({"error": f"La génération s'est arrêtée prématurément: {sce}"})}\n\n'
except Exception as e:
print(f"Erreur pendant la génération Gemini: {e}")
yield f'data: {json.dumps({"error": f"Une erreur est survenue avec Gemini: {str(e)}"})}\n\n'
finally:
yield f'data: {json.dumps({"mode": "finished"})}\n\n'
return Response(
stream_with_context(generate_stream()),
mimetype='text/event-stream',
headers={
'Cache-Control': 'no-cache',
'X-Accel-Buffering': 'no', # Important pour Nginx si utilisé comme reverse proxy
'Connection': 'keep-alive'
}
)
except Exception as e:
print(f"Erreur générale dans /solve: {e}")
# Renvoyer l'erreur en SSE pour que le client puisse l'afficher
return Response(
stream_with_context(iter([f'data: {json.dumps({"error": f"Une erreur inattendue est survenue sur le serveur: {str(e)}"})}\n\n'])),
mimetype='text/event-stream'
)
if __name__ == '__main__':
# Assurez-vous que les variables d'environnement sont chargées
# par exemple, si vous utilisez un fichier .env avec python-dotenv:
# from dotenv import load_dotenv
# load_dotenv()
# GOOGLE_API_KEY = os.environ.get("GEMINI_API_KEY")
# TELEGRAM_BOT_TOKEN = os.environ.get("TELEGRAM_BOT_TOKEN")
# TELEGRAM_CHAT_ID = os.environ.get("TELEGRAM_CHAT_ID")
# (et réinitialisez le client si les clés sont chargées après l'init initiale)
# Vérification finale avant de lancer
if not GOOGLE_API_KEY:
print("ERREUR CRITIQUE: GEMINI_API_KEY n'est pas défini. L'application ne peut pas démarrer correctement.")
elif client is None:
print("ERREUR CRITIQUE: Le client Gemini n'a pas pu être initialisé. Vérifiez votre clé API et la connectivité.")
else:
print("Prêt à démarrer Flask.")
app.run(debug=True, host='0.0.0.0', port=5000)