Spaces:

jawill
/

RAG_SyS

Sleeping

App Files Files Community

jwphantom commited on 12 days ago

Commit

99ebde5

•

1 Parent(s): 1f7103f

remove evaluation route

Browse files

Files changed (3) hide show

app/api/evaluation.py +0 -243
app/api/test.py +0 -62
main.py +1 -3

app/api/evaluation.py DELETED Viewed

@@ -1,243 +0,0 @@
-import json
-import os
-from langchain_openai import ChatOpenAI
-import numpy as np
-import math
-import time
-import csv
-from fastapi import APIRouter, HTTPException
-from typing import List
-from dotenv import load_dotenv
-import nltk
-from datetime import datetime
-# nltk.download("punkt")
-# from nltk.tokenize import word_tokenize
-# Spécifier un répertoire de données pour NLTK
-nltk_data_path = os.path.join(os.path.expanduser("~"), "nltk_data")
-os.makedirs(nltk_data_path, exist_ok=True)
-nltk.data.path.append(nltk_data_path)
-# Télécharger les données de NLTK
-nltk.download("punkt", download_dir=nltk_data_path)
-from nltk.tokenize import word_tokenize
-from langchain_google_genai import ChatGoogleGenerativeAI
-from langchain_community.embeddings import GPT4AllEmbeddings
-from langchain.memory import ConversationBufferMemory
-from app.schema.question_eval import Question as SchemaQuestionEval
-from app.schema.question_eval import ResponseEvaluation as SchemaResponseEval
-from app.utils.complex_input import (
-    generate_prompt,
-)  # Ensure this is correctly implemented
-load_dotenv(".env")
-router = APIRouter()
-llm = ChatOpenAI(model="gpt-3.5-turbo-0125", temperature=0.2).bind(logprobs=True)
-def init_embedding():
-    return GPT4AllEmbeddings(model_name="all-MiniLM-L6-v2.gguf2.f16.gguf")
-def cosine_similarity(vec1, vec2):
-    dot_product = np.dot(vec1, vec2)
-    norm_vec1 = np.linalg.norm(vec1)
-    norm_vec2 = np.linalg.norm(vec2)
-    return dot_product / (norm_vec1 * norm_vec2)
-def fraction_to_float(fraction_str):
-    try:
-        return float(fraction_str)
-    except ValueError:
-        num, denom = map(int, fraction_str.split("/"))
-        return num / denom
-def calculate_ttr(texts: List[str], question_idx: int) -> float:
-    print(
-        f"Calcul TTR question : {question_idx + 1} .... veuillez patienter ça calcule"
-    )
-    all_tokens = []
-    unique_tokens = set()
-    for text in texts:
-        tokens = word_tokenize(text.lower())
-        all_tokens.extend(tokens)
-        unique_tokens.update(tokens)
-    if len(all_tokens) == 0:
-        ttr = 0
-    else:
-        ttr = len(unique_tokens) / len(all_tokens)
-    print(f"Result TTR question : {question_idx + 1} .... {ttr}")
-    return ttr
-def calculate_metrics_from_log_probs(log_probs: List[float], question_idx: int):
-    print(
-        f"Calcul Entropie et Perplexité question : {question_idx + 1} .... veuillez patienter ça calcule"
-    )
-    total_log_prob = sum(log_probs)
-    total_tokens = len(log_probs)
-    moyenne_log_probs = total_log_prob / total_tokens
-    entropy = -moyenne_log_probs
-    perplexity = math.exp(entropy)
-    print(f"Result Entropie question : {question_idx + 1} .... {entropy}")
-    print(f"Result Perplexité question : {question_idx + 1} .... {perplexity}")
-    return {"entropy": entropy, "perplexity": perplexity}
-def evaluate_response(
-    generated_response, reference_responses, embedding, question_idx: int
-):
-    print(
-        f"Calcul Similarité question : {question_idx + 1} .... veuillez patienter ça calcule"
-    )
-    gen_vec = embedding.embed_query(generated_response)
-    similarities = []
-    for response in reference_responses:
-        ref_vec = embedding.embed_query(response)
-        similarity = cosine_similarity(gen_vec, ref_vec)
-        similarities.append(similarity)
-    print(f"Result Similarité question : {question_idx + 1} .... {similarities[0]}")
-    return similarities
-@router.post("/evaluate-responses")
-async def evaluate_responses():
-    results = {}
-    embedding = init_embedding()
-    with open("data.json", "r") as f:
-        questions = json.load(f)
-    # Initialiser le fichier JSON avec une structure de base
-    with open("results.json", "w") as f:
-        json.dump({category: [] for category in questions.keys()}, f, indent=4)
-    for category, questions_list in questions.items():
-        start_time_category = time.time()
-        perplexity_total = 0
-        for idx, question in enumerate(questions_list):
-            memory = ConversationBufferMemory(
-                memory_key="history", input_key="question"
-            )
-            schema_question = SchemaQuestionEval(
-                prompt=question["prompt"], answer_correct=question["answer_correct"]
-            )
-            start_time = time.time()
-            generated_response = generate_prompt(
-                schema_question.prompt, "QR3.pdf", "user", memory
-            )
-            end_time = time.time()
-            generation_time = end_time - start_time
-            similarity = evaluate_response(
-                generated_response.content,
-                [schema_question.answer_correct],
-                embedding,
-                idx,
-            )
-            response_metadata = generated_response.response_metadata["logprobs"][
-                "content"
-            ]
-            log_probs = [token_info["logprob"] for token_info in response_metadata]
-            metrics = calculate_metrics_from_log_probs(log_probs, idx)
-            ttr = calculate_ttr([generated_response.content], idx)
-            evaluation = {
-                "prompt": schema_question.prompt,
-                "answer_correct": schema_question.answer_correct,
-                "answer_generated": generated_response.content,
-                "ttr": ttr,
-                "cosine_similarity": similarity[0],
-                "entropy": metrics["entropy"],
-                "perplexity": metrics["perplexity"],
-                "generation_time": generation_time,
-            }
-            perplexity_total += metrics["perplexity"]
-            # Écrire le résultat individuel dans le fichier JSON
-            with open("results.json", "r+") as f:
-                data = json.load(f)
-                data[category].append(evaluation)
-                f.seek(0)
-                json.dump(data, f, ensure_ascii=False, indent=4)
-                f.truncate()
-            time.sleep(3)
-        category_perplexity = perplexity_total / len(questions_list)
-        # Ajouter la perplexité de la catégorie
-        with open("results.json", "r+") as f:
-            data = json.load(f)
-            data[category].append({"category_perplexity": category_perplexity})
-            f.seek(0)
-            json.dump(data, f, ensure_ascii=False, indent=4)
-            f.truncate()
-        end_time_category = time.time()
-        category_duration = end_time_category - start_time_category
-        print(f"Category '{category}' processed in {category_duration:.2f} seconds")
-        results[category] = data[category]
-    return results
-@router.post("/read-and-analyze-results")
-def read_and_analyze_results():
-    analysis = []
-    with open("results.csv", "r") as csvfile:
-        reader = csv.DictReader(csvfile)
-        for row in reader:
-            perplexity = float(row["perplexity"])
-            if not math.isfinite(perplexity):
-                perplexity = "undefined"
-            analysis.append(
-                {
-                    "category": row["category"],
-                    "prompt": row["prompt"],
-                    "correct_answer": row["answer_correct"],
-                    "generated_answer": row["answer_generated"],
-                    "cosine_similarity": float(row["cosine_similarity"]),
-                    "entropy": (
-                        float(row["entropy"])
-                        if math.isfinite(float(row["entropy"]))
-                        else "undefined"
-                    ),
-                    "perplexity": (
-                        float(row["perplexity"])
-                        if math.isfinite(float(row["perplexity"]))
-                        else "undefined"
-                    ),
-                    "generation_time": float(row["generation_time"]),
-                }
-            )
-    return analysis

app/api/test.py DELETED Viewed

@@ -1,62 +0,0 @@
-import google.generativeai as genai
-import os
-from langchain_google_genai import ChatGoogleGenerativeAI
-import math
-import time
-genai.configure(api_key=os.environ["GEMINI_API_KEY"])
-modelGemini = genai.GenerativeModel("gemini-1.5-pro")
-llm = ChatGoogleGenerativeAI(model="gemini-pro", temperature=0.2, top_p=0.2)
-phrases_test = [
-    "Le chat mange une souris.",
-    "Je vais au cinéma ce soir.",
-    "L'avion décolle à 10h30.",
-]
-def fraction_to_float(fraction_str):
-    try:
-        return float(fraction_str)
-    except ValueError:
-        num, denom = map(int, fraction_str.split("/"))
-        return num / denom
-def calculer_perplexite(phrases):
-    log_probs_totales = 0
-    total_tokens = 0
-    for phrase in phrases:
-        ids = llm.get_token_ids(phrase)
-        total_tokens += len(ids)
-        log_probs_phrase = 0
-        for i in range(len(ids)):
-            contexte = ids[:i]
-            token_actuel = ids[i]
-            result = llm.invoke(
-                f"Quelle est la probabilité du token {token_actuel} après la séquence {contexte}? Répondez uniquement par un nombre ou une fraction."
-            )
-            proba = fraction_to_float(result.content)
-            print(f"Token: {token_actuel}, Probabilité: {proba}")
-            log_probs_phrase += math.log(proba) if proba > 0 else float("-inf")
-            # Ajouter un délai de 2 secondes
-            time.sleep(4)
-        log_probs_totales += log_probs_phrase
-    moyenne_log_probs = log_probs_totales / total_tokens
-    perplexite = math.exp(-moyenne_log_probs)
-    return perplexite
-perplexite = calculer_perplexite(phrases_test)
-print(f"La perplexité du modèle est : {perplexite}")

main.py CHANGED Viewed

@@ -1,5 +1,5 @@
 from fastapi import FastAPI
-from app.api import chat, evaluation
 from fastapi.middleware.cors import CORSMiddleware
@@ -19,8 +19,6 @@ origins = [
 app = FastAPI()
 app.include_router(chat.router, prefix="/api/chat", tags=["chat"])
-app.include_router(evaluation.router, prefix="/api/evaluation", tags=["evaluation"])
 app.add_middleware(
     CORSMiddleware,

 from fastapi import FastAPI
+from app.api import chat
 from fastapi.middleware.cors import CORSMiddleware
 app = FastAPI()
 app.include_router(chat.router, prefix="/api/chat", tags=["chat"])
 app.add_middleware(
     CORSMiddleware,