Spaces:

ahmadouna
/

dev_NLP

Sleeping

App Files Files Community

ahmadouna commited on Jan 12, 2024

Commit

321bca5

verified ·

1 Parent(s): e2e2e22

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -99

app.py CHANGED Viewed

@@ -1,76 +1,14 @@
-# import pandas as pd
-# import streamlit as st
-# from transformers import pipeline
-# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
-# # Charger le modèle pré-entraîné
-# classifier_model = "morit/french_xlm_xnli"
-# classifier = pipeline("zero-shot-classification", model=classifier_model)
-# # Charger les données depuis le fichier CSV
-# df = pd.read_csv("fic.csv",sep=";")
-# # Récupérer les commentaires en liste
-# comments = df["text"].tolist()
-# # Afficher l'entête
-# st.header("Analyse de Texte")
-# # Créer une selectbox pour choisir un commentaire
-# selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)
-# # Afficher le commentaire sélectionné dans l'input text
-# text = st.text_area('Entrer le texte à analyser', value=selected_comment)
-# # Labels candidats pour la classification
-# candidate_labels = [0, 1]
-# # Modèle de phrase pour la formation de l'hypothèse
-# hypothesis_template = "Cet exemple est un commentaire {}."
-# # Exécuter la classification seulement si du texte est entré
-# if text and candidate_labels:
-#     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
-#     #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
-#     if result['labels'][0]==1:
-#         st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
-#     else:
-#         st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
-# else:
-#     st.write("Veuillez entrer du texte pour l'analyse.")
-# # Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
-# if text and candidate_labels:
-#     inputs = df["text"].tolist()
-#     true_labels = df["label"].tolist()
-#     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
-#     predicted_labels = [result['labels'][0] for result in predictions]
-#     accuracy = accuracy_score(true_labels, predicted_labels)
-#     precision = precision_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
-#     recall = recall_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
-#     f1 = f1_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
-#     balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
-#     # Afficher les métriques sous forme de tableau
-#     st.header("Métriques de Performance")
-#     metrics_df = pd.DataFrame({
-#         "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
-#         "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
-#     })
-#     st.table(metrics_df)
 import pandas as pd
 import streamlit as st
 from transformers import pipeline
-from datasets import load_metric
 # Charger le modèle pré-entraîné
 classifier_model = "morit/french_xlm_xnli"
 classifier = pipeline("zero-shot-classification", model=classifier_model)
 # Charger les données depuis le fichier CSV
-df = pd.read_csv("fic.csv", sep=";")
 # Récupérer les commentaires en liste
 comments = df["text"].tolist()
@@ -92,52 +30,33 @@ hypothesis_template = "Cet exemple est un commentaire {}."
 # Exécuter la classification seulement si du texte est entré
 if text and candidate_labels:
     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
-    if result['labels'][0] == 1:
-        st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0] * 100:.2f}%")
     else:
-        st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0] * 100:.2f}%")
 else:
     st.write("Veuillez entrer du texte pour l'analyse.")
-# Utiliser les métriques de Hugging Face
 if text and candidate_labels:
     inputs = df["text"].tolist()
     true_labels = df["label"].tolist()
     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
     predicted_labels = [result['labels'][0] for result in predictions]
-    # Déclarer un tableau pour stocker les métriques
-    metrics_table = []
-    # Calculer les métriques une par une et les ajouter au tableau
-    precision = load_metric("precision")
-    precision.add_batch(predictions=predicted_labels, references=true_labels)
-    precision_result = precision.compute()
-    metrics_table.append(("Precision", precision_result))
-    accuracy = load_metric("accuracy")
-    accuracy.add_batch(predictions=predicted_labels, references=true_labels)
-    accuracy_result = accuracy.compute()
-    metrics_table.append(("Accuracy", accuracy_result))
-    recall = load_metric("recall")
-    recall.add_batch(predictions=predicted_labels, references=true_labels)
-    recall_result = recall.compute()
-    metrics_table.append(("Recall", recall_result))
-    f1 = load_metric("f1")
-    f1.add_batch(predictions=predicted_labels, references=true_labels)
-    f1_result = f1.compute()
-    metrics_table.append(("F1 Score", f1_result))
-    roc_auc = load_metric("roc_auc")
-    roc_auc.add_batch(predictions=predicted_labels, references=true_labels)
-    roc_auc_result = roc_auc.compute()
-    metrics_table.append(("ROC-AUC Score", roc_auc_result))
     # Afficher les métriques sous forme de tableau
     st.header("Métriques de Performance")
-    metrics_df = pd.DataFrame(metrics_table, columns=["Métrique", "Valeur"])
     st.table(metrics_df)

 import pandas as pd
 import streamlit as st
 from transformers import pipeline
+from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score
 # Charger le modèle pré-entraîné
 classifier_model = "morit/french_xlm_xnli"
 classifier = pipeline("zero-shot-classification", model=classifier_model)
 # Charger les données depuis le fichier CSV
+df = pd.read_csv("fic.csv",sep=";")
 # Récupérer les commentaires en liste
 comments = df["text"].tolist()
 # Exécuter la classification seulement si du texte est entré
 if text and candidate_labels:
     result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)
+    #st.info(f"Résultat: {result['labels'][0]} avec une confiance de {result['scores'][0]*100:.2f}%")
+    if result['labels'][0]==1:
+        st.info(f"Résultat: commentaire positive avec une confiance de {result['scores'][0]*100:.2f}%")
     else:
+        st.info(f"Résultat: commentaire negative avec une confiance de {result['scores'][0]*100:.2f}%")
 else:
     st.write("Veuillez entrer du texte pour l'analyse.")
+# Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
 if text and candidate_labels:
     inputs = df["text"].tolist()
     true_labels = df["label"].tolist()
     predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
     predicted_labels = [result['labels'][0] for result in predictions]
+    accuracy = accuracy_score(true_labels, predicted_labels)
+    precision = precision_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
+    recall = recall_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
+    f1 = f1_score(true_labels, predicted_labels, average='binary')  # Si votre tâche est binaire
+    balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)
     # Afficher les métriques sous forme de tableau
     st.header("Métriques de Performance")
+    metrics_df = pd.DataFrame({
+        "Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
+        "Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
+    })
     st.table(metrics_df)