Spaces:
Running
Running
bourdoiscatie
commited on
Commit
•
234613a
1
Parent(s):
3bfad63
Update app.py
Browse files
app.py
CHANGED
@@ -17,11 +17,11 @@ st.sidebar.image(image, caption=None, width=None, use_column_width=None, clamp=F
|
|
17 |
@st.cache_resource
|
18 |
def load_model(version,text):
|
19 |
if version == "version base":
|
20 |
-
ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_3entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_3entities',
|
21 |
result = ner(text)
|
22 |
return result
|
23 |
else:
|
24 |
-
ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_4entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_4entities', aggregation_strategy="
|
25 |
result = ner(text)
|
26 |
return result
|
27 |
|
@@ -71,6 +71,24 @@ if option == "Exemple":
|
|
71 |
text = st.text_area("Votre texte", value="Assurés de disputer l'Euro 2024 en Allemagne l'été prochain (du 14 juin au 14 juillet) depuis leur victoire aux Pays-Bas, les Bleus ont fait le nécessaire pour avoir des certitudes. Avec six victoires en six matchs officiels et un seul but encaissé, Didier Deschamps a consolidé les acquis de la dernière Coupe du monde. Les joueurs clés sont connus : Kylian Mbappé, Aurélien Tchouameni, Antoine Griezmann, Ibrahima Konaté ou encore Mike Maignan.",height=175)
|
72 |
if text:
|
73 |
to_print = load_model(version,text)
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
74 |
display = color_annotation(to_print,text)
|
75 |
list_to_display = [] # pour pouvoir afficher la couleur, on doit passer les mots à colorier de str en tuple
|
76 |
for i in range(len(display.split('","'))):
|
|
|
17 |
@st.cache_resource
|
18 |
def load_model(version,text):
|
19 |
if version == "version base":
|
20 |
+
ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_3entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_3entities', aggregation_strategy="simple")
|
21 |
result = ner(text)
|
22 |
return result
|
23 |
else:
|
24 |
+
ner = pipeline('token-classification', model='bourdoiscatie/camembert-base-frenchNER_4entities', tokenizer='bourdoiscatie/camembert-base-frenchNER_4entities', aggregation_strategy="simple")
|
25 |
result = ner(text)
|
26 |
return result
|
27 |
|
|
|
71 |
text = st.text_area("Votre texte", value="Assurés de disputer l'Euro 2024 en Allemagne l'été prochain (du 14 juin au 14 juillet) depuis leur victoire aux Pays-Bas, les Bleus ont fait le nécessaire pour avoir des certitudes. Avec six victoires en six matchs officiels et un seul but encaissé, Didier Deschamps a consolidé les acquis de la dernière Coupe du monde. Les joueurs clés sont connus : Kylian Mbappé, Aurélien Tchouameni, Antoine Griezmann, Ibrahima Konaté ou encore Mike Maignan.",height=175)
|
72 |
if text:
|
73 |
to_print = load_model(version,text)
|
74 |
+
|
75 |
+
dict_to_del = []
|
76 |
+
for i in range(len(to_print)-1):
|
77 |
+
if to_print[i]["end"] == to_print[i+1]["start"]:
|
78 |
+
to_print[i+1]["word"] = to_print[i]["word"]+to_print[i+1]["word"]
|
79 |
+
to_print[i+1]["score"] = (to_print[i]["score"]+to_print[i+1]["score"])/2
|
80 |
+
to_print[i+1]["start"] = to_print[i]["start"]
|
81 |
+
dict_to_del.append(i)
|
82 |
+
to_print = [j for i, j in enumerate(to_print) if i not in dict_to_del]
|
83 |
+
dict_to_del = []
|
84 |
+
for i in range(len(to_print)-1):
|
85 |
+
if (to_print[i]["end"] == to_print[i+1]["start"]-1):
|
86 |
+
to_print[i+1]["word"] = to_print[i]["word"]+" "+to_print[i+1]["word"]
|
87 |
+
to_print[i+1]["score"] = (to_print[i]["score"]+to_print[i+1]["score"])/2
|
88 |
+
to_print[i+1]["start"] = to_print[i]["start"]
|
89 |
+
dict_to_del.append(i)
|
90 |
+
to_print = [j for i, j in enumerate(to_print) if i not in dict_to_del]
|
91 |
+
|
92 |
display = color_annotation(to_print,text)
|
93 |
list_to_display = [] # pour pouvoir afficher la couleur, on doit passer les mots à colorier de str en tuple
|
94 |
for i in range(len(display.split('","'))):
|