Update README.md
Browse files
README.md
CHANGED
@@ -953,67 +953,19 @@ from transformers import pipeline
|
|
953 |
ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-base-4entities', tokenizer='CATIE-AQ/NERmembert-base-4entities', aggregation_strategy="simple")
|
954 |
|
955 |
results = ner(
|
956 |
-
"
|
957 |
)
|
958 |
|
959 |
print(results)
|
960 |
```
|
961 |
```python
|
962 |
-
[
|
963 |
-
|
964 |
-
|
965 |
-
|
966 |
-
|
967 |
-
|
968 |
-
|
969 |
-
'word': 'Allemagne',
|
970 |
-
'start': 35,
|
971 |
-
'end': 44},
|
972 |
-
{'entity_group': 'LOC',
|
973 |
-
'score': 0.8612850904464722,
|
974 |
-
'word': 'Pays-Bas',
|
975 |
-
'start': 112,
|
976 |
-
'end': 120},
|
977 |
-
{'entity_group': 'ORG',
|
978 |
-
'score': 0.8148028254508972,
|
979 |
-
'word': 'les Bleus',
|
980 |
-
'start': 122,
|
981 |
-
'end': 131},
|
982 |
-
{'entity_group': 'PER',
|
983 |
-
'score': 0.9994482398033142,
|
984 |
-
'word': 'Didier Deschamps',
|
985 |
-
'start': 250,
|
986 |
-
'end': 266},
|
987 |
-
{'entity_group': 'MISC',
|
988 |
-
'score': 0.84807388484478,
|
989 |
-
'word': 'dernière Coupe du monde',
|
990 |
-
'start': 296,
|
991 |
-
'end': 319},
|
992 |
-
{'entity_group': 'PER',
|
993 |
-
'score': 0.9996860176324844,
|
994 |
-
'word': 'Kylian Mbappé',
|
995 |
-
'start': 352,
|
996 |
-
'end': 365},
|
997 |
-
{'entity_group': 'PER',
|
998 |
-
'score': 0.9996881932020187,
|
999 |
-
'word': 'Aurélien Tchouameni',
|
1000 |
-
'start': 367,
|
1001 |
-
'end': 386},
|
1002 |
-
{'entity_group': 'PER',
|
1003 |
-
'score': 0.9996924996376038,
|
1004 |
-
'word': 'Antoine Griezmann',
|
1005 |
-
'start': 388,
|
1006 |
-
'end': 405},
|
1007 |
-
{'entity_group': 'PER',
|
1008 |
-
'score': 0.9996860027313232,
|
1009 |
-
'word': 'Ibrahima Konaté',
|
1010 |
-
'start': 407,
|
1011 |
-
'end': 422},
|
1012 |
-
{'entity_group': 'PER',
|
1013 |
-
'score': 0.9996623992919922,
|
1014 |
-
'word': 'Mike Maignan',
|
1015 |
-
'start': 433,
|
1016 |
-
'end': 445}]
|
1017 |
```
|
1018 |
|
1019 |
### Try it through Space
|
|
|
953 |
ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-base-4entities', tokenizer='CATIE-AQ/NERmembert-base-4entities', aggregation_strategy="simple")
|
954 |
|
955 |
results = ner(
|
956 |
+
"Le français est une langue indo-européenne de la famille des langues romanes dont les locuteurs sont appelés francophones. Elle est parfois surnommée la langue de Molière, d'après l'auteur des Fourberies de Scapin. Le français est parlé, en 2023, sur tous les continents par environ 321 millions de personnes : 235 millions l'emploient quotidiennement et 90 millions en sont des locuteurs natifs. En 2018, 80 millions d'élèves et étudiants s'instruisent en français dans le monde. Selon l'Organisation internationale de la francophonie (OIF), il pourrait y avoir 700 millions de francophones sur Terre en 2050."
|
957 |
)
|
958 |
|
959 |
print(results)
|
960 |
```
|
961 |
```python
|
962 |
+
[
|
963 |
+
{'entity_group': 'MISC', 'score': 0.5237489, 'word': 'Molière', 'start': 163, 'end': 170},
|
964 |
+
{'entity_group': 'MISC', 'score': 0.94582415, 'word': 'Fourberies de Scapin', 'start': 193, 'end': 213},
|
965 |
+
{'entity_group': 'ORG', 'score': 0.99834096, 'word': 'Organisation internationale de la francophonie', 'start': 490, 'end': 536},
|
966 |
+
{'entity_group': 'ORG', 'score': 0.99768853, 'word': 'OIF', 'start': 538, 'end': 541},
|
967 |
+
{'entity_group': 'LOC', 'score': 0.9438753, 'word': 'Terre', 'start': 597, 'end': 602}
|
968 |
+
]
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
969 |
```
|
970 |
|
971 |
### Try it through Space
|