Spaces:

ahmadouna
/

dev_NLP

Sleeping

App Files Files Community

ahmadouna commited on Jan 12

Commit

027912a

•

1 Parent(s): 13516a4

Update app.py

Browse files

Files changed (1) hide show

app.py +76 -16

app.py CHANGED Viewed

@@ -1,14 +1,76 @@
 import pandas as pd
 import streamlit as st
 from transformers import pipeline
-from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
 # Charger le modèle pré-entraîné
 classifier_model = "morit/french_xlm_xnli"
 classifier = pipeline("zero-shot-classification", model=classifier_model)
 # Charger les données depuis le fichier CSV
-df = pd.read_csv("fic.csv",sep=";")
 # Récupérer les commentaires en liste
 comments = df["text"].tolist()
@@ -30,32 +92,30 @@ hypothesis_template = "Cet exemple est un commentaire {}."
 # Exécuter la classification seulement si du texte est entré
 if text and candidate_labels:
     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
-    #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
-    if result['labels'][0]==1:
-        st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
     else:
-        st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
 else:
     st.write("Veuillez entrer du texte pour l'analyse.")
-# Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
 if text and candidate_labels:
     inputs = df["text"].tolist()
     true_labels = df["label"].tolist()
     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
     predicted_labels = [result['labels'][0] for result in predictions]
-    accuracy = accuracy_score(true_labels, predicted_labels)
-    precision = precision_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
-    recall = recall_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
-    f1 = f1_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
-    balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
     # Afficher les métriques sous forme de tableau
     st.header("Métriques de Performance")
     metrics_df = pd.DataFrame({
-        "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
-        "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
     })
     st.table(metrics_df)

+# import pandas as pd
+# import streamlit as st
+# from transformers import pipeline
+# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
+# # Charger le modèle pré-entraîné
+# classifier_model = "morit/french_xlm_xnli"
+# classifier = pipeline("zero-shot-classification", model=classifier_model)
+# # Charger les données depuis le fichier CSV
+# df = pd.read_csv("fic.csv",sep=";")
+# # Récupérer les commentaires en liste
+# comments = df["text"].tolist()
+# # Afficher l'entête
+# st.header("Analyse de Texte")
+# # Créer une selectbox pour choisir un commentaire
+# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
+# # Afficher le commentaire sélectionné dans l'input text
+# text = st.text_area('Entrer le texte à analyser', value=selected_comment)
+# # Labels candidats pour la classification
+# candidate_labels = [0, 1]
+# # Modèle de phrase pour la formation de l'hypothèse
+# hypothesis_template = "Cet exemple est un commentaire {}."
+# # Exécuter la classification seulement si du texte est entré
+# if text and candidate_labels:
+#     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
+#     #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
+#     if result['labels'][0]==1:
+#         st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
+#     else:
+#         st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
+# else:
+#     st.write("Veuillez entrer du texte pour l'analyse.")
+# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
+# if text and candidate_labels:
+#     inputs = df["text"].tolist()
+#     true_labels = df["label"].tolist()
+#     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
+#     predicted_labels = [result['labels'][0] for result in predictions]
+#     accuracy = accuracy_score(true_labels, predicted_labels)
+#     precision = precision_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
+#     recall = recall_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
+#     f1 = f1_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
+#     balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
+#     # Afficher les métriques sous forme de tableau
+#     st.header("Métriques de Performance")
+#     metrics_df = pd.DataFrame({
+#         "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
+#         "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
+#     })
+#     st.table(metrics_df)
 import pandas as pd
 import streamlit as st
 from transformers import pipeline
+from datasets import load_metric
 # Charger le modèle pré-entraîné
 classifier_model = "morit/french_xlm_xnli"
 classifier = pipeline("zero-shot-classification", model=classifier_model)
 # Charger les données depuis le fichier CSV
+df = pd.read_csv("fic.csv", sep=";")
 # Récupérer les commentaires en liste
 comments = df["text"].tolist()
 # Exécuter la classification seulement si du texte est entré
 if text and candidate_labels:
     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
+    if result['labels'][0] == 1:
+        st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%")
     else:
+        st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%")
 else:
     st.write("Veuillez entrer du texte pour l'analyse.")
+# Utiliser les métriques de Hugging Face
 if text and candidate_labels:
     inputs = df["text"].tolist()
     true_labels = df["label"].tolist()
     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
     predicted_labels = [result['labels'][0] for result in predictions]
+    # Calculer les métriques de performance
+    metrics = load_metric("precision", "accuracy", "recall", "f1", "roc_auc")
+    metrics.add_batch(predictions=predicted_labels, references=true_labels)
+    results = metrics.compute()
     # Afficher les métriques sous forme de tableau
     st.header("Métriques de Performance")
     metrics_df = pd.DataFrame({
+        "Métrique": ["Precision", "Accuracy", "Recall", "F1 Score", "ROC-AUC Score"],
+        "Valeur": [results["precision"], results["accuracy"], results["recall"], results["f1"], results["roc_auc"]]
     })
     st.table(metrics_df)