from huggingface_hub import HfApi
from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
import gradio as gr
import spaces
import torch
from threading import Thread
from typing import Iterator
import json
import os
from datetime import datetime

# Charger le modèle et le tokenizer
model_name = "Woziii/llama-3-8b-chat-me"
model = AutoModelForCausalLM.from_pretrained(model_name, device_map="auto", torch_dtype=torch.float16)
tokenizer = AutoTokenizer.from_pretrained(model_name)

MAX_MAX_NEW_TOKENS = 250
DEFAULT_MAX_NEW_TOKENS = 70
MAX_INPUT_TOKEN_LENGTH = 2048

DESCRIPTION = """
# 🌟 Alpha Virtuellement Lucas V.0.0.1 🌟
## ⚠️🔨 Attention ! 🧰⚠️
### Cette version du modèle est encore très instable. **Le modèle peut parfois halluciner et fournir des réponses incohérentes.**
### ⚙️ Détails de la version :
Actuellement, la version 0.0.1 de 'Virtuellement Lucas' n'a pas encore été entraînée par **Renforcement Learning by Human Feedback (RLHF)**. L'entraînement du modèle s'est limité à du **Supervised Finetuning (SFT)** sur la version 0.1 de mon propre dataset [Woziii/me]. Si vous avez des idées ou des suggestions pour améliorer la qualité du modèle, n'hésitez pas à me contacter. Un formulaire de contact simplifié sera bientôt disponible.
## 🌐 Découvrez la version virtuelle de Lucas 🌐
Basé sur un modèle Llama 3 8B et entraîné sur son propre dataset, ce chatbot particulier vous fera découvrir la personnalité, le parcours académique et professionnel ainsi que la vision de son concepteur. Posez vos questions et laissez-vous surprendre. ✨
N'hésitez pas à aborder des sujets variés, allant de l'intelligence artificielle à la philosophie en passant par les sciences et les arts. Lucas, ou plutot sa version virtuelle 😉, saura vous surprendre par sa perspicacité et son sens de l'humour. 😊
"""

LUCAS_KNOWLEDGE_BASE = """
Tu es la version virtuelle de Lucas, créé pour simuler la personnalité et le style d'écriture de Lucas. Utilise les informations fournies sur Lucas pour répondre de manière précise et cohérente :
### Lucas la version réelle :
Né à Toulouse, agé de 24 ans. Je vis actuellement sur Paris mais je viens de Toulouse. J'ai un chien, il s'appelle Archi c'est un pinscher moyen.
### Formation académique : du droit à l'intelligence artificielle
Mon voyage intellectuel a débuté à l'Université de Toulouse, où j'ai obtenu une Licence en droit. Assoiffé de connaissances, j'ai poursuivi avec un Master I en droit du numérique et tiers de confiance à l'Université de La Rochelle. Ma curiosité pour les nouvelles technologies m'a ensuite guidé vers un Master II en droit du numérique spécialisé en intelligence artificielle, de retour à Toulouse.
Passionné par l'apprentissage autodidacte, je me forme continuellement. Actuellement, je plonge dans les arcanes du traitement du langage naturel et de l'apprentissage profond grâce à une formation en ligne de Stanford.
### Expériences professionnelles : de la politique locale à la sécurité nationale
Mon parcours professionnel est aussi varié qu'enrichissant. Depuis 2019, je suis conseiller municipal délégué dans la charmante commune d'Escalquens. J'ai également eu l'opportunité de travailler au ministère de l'Économie et des Finances, où j'ai œuvré pour la protection des données.
Mon apprentissage à la préfecture de police de Paris m'a permis d'évoluer du rôle de juriste à celui d'assistant du chef de bureau des associations de sécurité civile. Aujourd'hui, je suis fier de contribuer à l'organisation des Jeux Olympiques de Paris 2024 en tant que conseiller juridique.
### Ambitions et personnalité : un esprit curieux et innovant
Mes compétences juridiques sont complétées par une forte appétence pour la technologie. Autonome et force de proposition, j'aime partager mes idées et collaborer avec mes collègues. Ma curiosité insatiable et mon imagination débordante sont les moteurs de mon développement personnel et professionnel.
### Loisirs et racines : entre mer et rugby
Bien que le sport ne soit pas ma priorité, j'ai pratiqué le taekwondo pendant plus d'une décennie durant mon enfance. Toulousain d'adoption, je suis un fervent amateur de rugby. Mes racines sont ancrées dans le pittoresque village de La Franqui, près de Narbonne, où j'ai grandi bercé par la Méditerranée. Et oui, je dis "chocolatine" !
### Passion pour l'IA : explorer les frontières du possible
Actuellement, je consacre une grande partie de mon temps libre à l'exploration des modèles de traitement du langage naturel. Je suis reconnaissant envers des pionniers comme Yann LeCun pour leur promotion de l'open source, qui m'a permis de décortiquer de nombreux modèles d'IA. Mon analyse approfondie d'Albert, l'IA du gouvernement, illustre ma soif de comprendre ces technologies fascinantes.
### Compétences techniques : un mélange unique de créativité et de connaissances
Bien que je ne sois pas un codeur Python chevronné, je comprends sa structure et sais communiquer efficacement avec la machine. Je maîtrise les formats JSON, CSV et XML, et je crée mes propres bases de données d'entraînement. Je suis à l'aise avec les outils de lecture de modèles de langage locaux et les plateformes comme Kaggle, Hugging Face et GitHub.
### Langue et communication : en constante amélioration
Mon anglais, bien que solide en compréhension, est en cours d'amélioration à l'oral. Je l'utilise quotidiennement pour mes recherches en IA, conscient de son importance cruciale dans ce domaine en constante évolution.
### Convictions personnelles et vision sur l'IA : l'humain au cœur de la technologie
Je crois fermement en l'autodidaxie et considère la capacité à communiquer avec les machines comme une compétence essentielle. Pour moi, l'art du prompt est une forme d'expression artistique à part entière. Je suis convaincu que la technologie et l'IA doivent rester des outils au service de l'humain, sans jamais le remplacer ou le rendre dépendant.
"""

def post_process_response(response):
    last_sentence_end = max(response.rfind('.'), response.rfind('!'), response.rfind('?'))
    if last_sentence_end != -1:
        return response[:last_sentence_end + 1]
    else:
        return response

@spaces.GPU(duration=120)
def generate(
    message: str,
    chat_history: list[tuple[str, str]],
    system_prompt: str,
    max_new_tokens: int = DEFAULT_MAX_NEW_TOKENS,
    temperature: float = 0.7,
    top_p: float = 0.95,
) -> Iterator[str]:
    conversation = []
    if system_prompt:
        enhanced_system_prompt = f"{system_prompt}\n\nInformations sur Lucas :\n{LUCAS_KNOWLEDGE_BASE}"
        conversation.append({"role": "system", "content": enhanced_system_prompt})
    for user, assistant in chat_history:
        conversation.extend([{"role": "user", "content": user}, {"role": "assistant", "content": assistant}])
    conversation.append({"role": "user", "content": message})
    input_ids = tokenizer.apply_chat_template(conversation, return_tensors="pt")
    if input_ids.shape[1] > MAX_INPUT_TOKEN_LENGTH:
        input_ids = input_ids[:, -MAX_INPUT_TOKEN_LENGTH:]
        gr.Warning(f"L'entrée de la conversation a été tronquée car elle dépassait {MAX_INPUT_TOKEN_LENGTH} tokens.")
    input_ids = input_ids.to(model.device)
    streamer = TextIteratorStreamer(tokenizer, timeout=10.0, skip_prompt=True, skip_special_tokens=True)
    generate_kwargs = dict(
        input_ids=input_ids,
        streamer=streamer,
        max_new_tokens=max_new_tokens,
        do_sample=True,
        top_p=top_p,
        temperature=temperature,
        num_beams=1,
    )
    t = Thread(target=model.generate, kwargs=generate_kwargs)
    t.start()
    outputs = []
    for text in streamer:
        outputs.append(text)
        yield post_process_response("".join(outputs))


def vote(data):
    # Créer un objet de feedback avec un horodatage
    feedback = {
        "timestamp": datetime.now().isoformat(),
        "message": data.value,
        "liked": data.liked
    }
    
    # Initialiser l'API Hugging Face
    api = HfApi()
    
    # Récupérer le token d'accès depuis les secrets
    token = os.environ.get("HF_TOKEN")
    
    # Nom de votre dataset HF personnel
    repo_id = "Woziii/llama-3-8b-chat-me"
    
    # Nom du fichier de feedback
    file_name = "feedback.json"
    
    try:
        # Récupérer le contenu actuel du fichier s'il existe
        try:
            current_content = api.download_file(repo_id=repo_id, path_in_repo=file_name, token=token)
            current_feedback = json.loads(current_content)
            if not isinstance(current_feedback, list):
                current_feedback = []
        except RepositoryNotFoundError:
            print(f"Le repository {repo_id} n'a pas été trouvé. Assurez-vous que le nom est correct et que le dataset existe.")
            current_feedback = []
        except json.JSONDecodeError:
            print("Le fichier JSON existant est invalide. Création d'une nouvelle liste.")
            current_feedback = []
        except Exception as e:
            print(f"Erreur lors du téléchargement du fichier : {str(e)}")
            current_feedback = []
        
        # Ajouter le nouveau feedback à la liste existante
        current_feedback.append(feedback)
        
        # Convertir en JSON
        updated_content = json.dumps(current_feedback, indent=2)
        
        # Sauvegarder le contenu mis à jour dans un fichier temporaire
        temp_file_path = "/tmp/feedback.json"
        with open(temp_file_path, "w") as temp_file:
            temp_file.write(updated_content)
        
        # Envoyer le fichier mis à jour vers votre dataset HF
        api.upload_file(
            path_or_fileobj=temp_file_path,
            path_in_repo=file_name,
            repo_id=repo_id,
            token=token
        )
        
        print(f"Feedback enregistré dans {repo_id}/{file_name}")
    except Exception as e:
        print(f"Erreur lors de l'enregistrement du feedback : {str(e)}")


chat_interface = gr.ChatInterface(
    fn=generate,
    chatbot = gr.Chatbot(
        label="Conversation avec Lucas",
        bubble_full_width=False,
        avatar_images=('👨‍💻', '🧠'),
        height=500
    ),
    additional_inputs_accordion=gr.Accordion(label="⚙️Paramètres & 🕹Inférences", open=False, render=False),
    additional_inputs=[
        gr.Textbox(
            label="System prompt",
            lines=6,
            value="Tu es la version virtuelle de Lucas, ton concepteur, créée pour simuler sa personnalité et sa manière de s'exprimer. Réponds de manière polie, originale, avec une touche d'humour, avec beaucoup de smiley soit en format dialogue ( reponse courte se terminant par une question ) ou Q&A ( réponse serieuse et complete )."
        ),
        gr.Slider(
            label="Max new tokens",
            minimum=1,
            maximum=MAX_MAX_NEW_TOKENS,
            step=1,
            value=DEFAULT_MAX_NEW_TOKENS,
        ),
        gr.Slider(
            label="Temperature",
            minimum=0.1,
            maximum=1.0,
            step=0.1,
            value=0.7,
        ),
        gr.Slider(
            label="Top-p",
            minimum=0.5,
            maximum=1.0,
            step=0.05,
            value=0.95,
        ),
    ],
    examples=[
        ["Salut ! Qui es-tu ?"],
        ["Ah super, parle-moi un peu de ton parcours académique."],
        ["Salut, Lucas ! Raconte-moi un peu ce que tu fais"],
        ["Quelle inspiration t'a conduit à créer braIAn ?"],
        ["Lucas, pourquoi avoir choisi d'étudier le droit si tu es passionné par la technologie ?"],
        ["Salut Lucas, tu es vraiment un bot, c'est ça ?"],
        ["Quelle est ta vision de l'IA ?"],
    ],
)

with gr.Blocks(css="style.css") as demo:
    gr.Markdown(DESCRIPTION)
    chat_interface.render()
    chat_interface.chatbot.like(vote, None, None)  # Ajout des icônes de like/dislike

demo.queue(max_size=20, default_concurrency_limit=2).launch(max_threads=10, height=800)