Spaces:

ahmadouna
/

nlp_test

Sleeping

App Files Files Community

nlp_test / app.py

ahmadouna

Update app.py

2ea0661 verified 6 months ago

raw history blame

No virus

3.39 kB

	# import pandas as pd
	# import streamlit as st
	# from transformers import pipeline
	# from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score

	# # Charger le modèle pré-entraîné
	# classifier_model = "morit/french_xlm_xnli"
	import pandas as pd
	import streamlit as st
	from transformers import pipeline
	from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, balanced_accuracy_score

	# Charger le modèle pré-entraîné
	classifier_model = "morit/french_xlm_xnli"
	classifier = pipeline("zero-shot-classification", model=classifier_model)

	# Charger les données depuis le fichier CSV
	df = pd.read_csv("fic.csv", sep=";")
	# Récupérer les commentaires en liste
	comments = df["text"].tolist()

	# Afficher l'entête
	st.header("Analyse de Texte")

	# Créer une selectbox pour choisir un commentaire
	selected_comment = st.selectbox("Veuillez sélectionner un commentaire", comments)

	# Afficher le commentaire sélectionné dans l'input text
	text = st.text_area('Entrer le texte à analyser', value=selected_comment)

	# Labels candidats pour la classification
	candidate_labels = [1, 0]

	# Modèle de phrase pour la formation de l'hypothèse
	hypothesis_template = "Cet exemple est un {}."

	# Ajouter un bouton pour déclencher l'analyse
	if st.button("Analyser le texte"):
	if text and candidate_labels:
	result = classifier(text, candidate_labels, hypothesis_template=hypothesis_template)

	if result['labels'][0] == 1:
	st.info(f"Résultat: commentaire positif avec une confiance de {result['scores'][0]*100:.2f}%")
	if result['labels'][0] == 0:
	st.info(f"Résultat: commentaire négatif avec une confiance de {result['scores'][0]*100:.2f}%")
	else:
	st.write("Veuillez entrer du texte pour l'analyse.")

	# Calculer les métriques de performance (vous devez ajuster ces lignes selon votre tâche)
	inputs = df["text"].tolist()
	true_labels = df["label"].tolist()
	predictions = classifier(inputs, candidate_labels, hypothesis_template=hypothesis_template)
	predicted_labels = [result['labels'][0] for result in predictions]

	accuracy = accuracy_score(true_labels, predicted_labels)
	precision = precision_score(true_labels, predicted_labels, average='binary')
	recall = recall_score(true_labels, predicted_labels, average='binary')
	f1 = f1_score(true_labels, predicted_labels, average='binary')
	balanced_accuracy = balanced_accuracy_score(true_labels, predicted_labels)

	# Afficher les métriques sous forme de tableau
	st.header("Métriques de Performance")
	st.subheader("Elles sont evaluées sur des données labelisés")
	metrics_df = pd.DataFrame({
	"Métrique": ["Accuracy", "Precision", "Recall", "F1-score", "Balanced Accuracy"],
	"Valeur": [accuracy, precision, recall, f1, balanced_accuracy]
	})
	st.table(metrics_df)
	st.markdown("Accuracy:L e ratio d'instances correctement predites surle ratio total")
	st.markdown("Precision:Pourcentage de bonnes predictions positives sur le nombre de positifs")
	st.markdown("Rappel:Pourcentage de bonnes predictions positives sur le total")
	st.markdown("f1-score:Moyenne de la precision et du rappel")
	st.markdown("Balanced-Accuracy:Moyenne des taux de vrais positifs pour chaque classe")