# import pandas as pd # import streamlit as st # from transformers import pipeline # from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score # # Charger le modèle pré-entraîné # classifier_model = "morit/french_xlm_xnli" import pandas as pd import streamlit as st from transformers import pipeline from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score # Charger le modèle pré-entraîné classifier_model = "morit/french_xlm_xnli" classifier = pipeline("zero-shot-classification", model=classifier_model) # Charger les données depuis le fichier CSV df = pd.read_csv("fic.csv", sep=";") # Récupérer les commentaires en liste comments = df["text"].tolist() # Afficher l'entête st.header("Analyse de Texte") # Créer une selectbox pour choisir un commentaire selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments) # Afficher le commentaire sélectionné dans l'input text text = st.text_area('Entrer le texte à analyser', value=selected_comment) # Labels candidats pour la classification candidate_labels = [1, 0] # Modèle de phrase pour la formation de l'hypothèse hypothesis_template = "Cet exemple est un {}." # Ajouter un bouton pour déclencher l'analyse if st.button("Analyser le texte"): if text and candidate_labels: result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template) if result['labels'][0] == 1: st.info(f"Résultat: commentaire positif avec une confiance de {result['scores'][0]*100:.2f}%") if result['labels'][0] == 0: st.info(f"Résultat: commentaire négatif avec une confiance de {result['scores'][0]*100:.2f}%") else: st.write("Veuillez entrer du texte pour l'analyse.") # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche) inputs = df["text"].tolist() true_labels = df["label"].tolist() predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template) predicted_labels = [result['labels'][0] for result in predictions] accuracy = accuracy_score(true_labels, predicted_labels) precision = precision_score(true_labels, predicted_labels, average='binary') recall = recall_score(true_labels, predicted_labels, average='binary') f1 = f1_score(true_labels, predicted_labels, average='binary') balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels) # Afficher les métriques sous forme de tableau st.header("Métriques de Performance") st.subheader("Elles sont evaluées sur des données labelisés") metrics_df = pd.DataFrame({ "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"], "Valeur": [accuracy, precision, recall, f1, balanced_accuracy] }) st.table(metrics_df) st.markdown("Accuracy:L e ratio d'instances correctement predites surle ratio total") st.markdown("Precision:Pourcentage de bonnes predictions positives sur le nombre de positifs") st.markdown("Rappel:Pourcentage de bonnes predictions positives sur le total") st.markdown("f1-score:Moyenne de la precision et du rappel") st.markdown("Balanced-Accuracy:Moyenne des taux de vrais positifs pour chaque classe")