bourdoiscatie commited on
Commit
102ab1f
·
verified ·
1 Parent(s): 7a581c3

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +8 -56
README.md CHANGED
@@ -953,67 +953,19 @@ from transformers import pipeline
953
  ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-base-4entities', tokenizer='CATIE-AQ/NERmembert-base-4entities', aggregation_strategy="simple")
954
 
955
  results = ner(
956
- "Assurés de disputer l'Euro 2024 en Allemagne l'été prochain (du 14 juin au 14 juillet) depuis leur victoire aux Pays-Bas, les Bleus ont fait le nécessaire pour avoir des certitudes. Avec six victoires en six matchs officiels et un seul but encaissé, Didier Deschamps a consolidé les acquis de la dernière Coupe du monde. Les joueurs clés sont connus : Kylian Mbappé, Aurélien Tchouameni, Antoine Griezmann, Ibrahima Konaté ou encore Mike Maignan."
957
  )
958
 
959
  print(results)
960
  ```
961
  ```python
962
- [{'entity_group': 'MISC',
963
- 'score': 0.9404951632022858,
964
- 'word': 'Euro 2024',
965
- 'start': 22,
966
- 'end': 31},
967
- {'entity_group': 'LOC',
968
- 'score': 0.96980727,
969
- 'word': 'Allemagne',
970
- 'start': 35,
971
- 'end': 44},
972
- {'entity_group': 'LOC',
973
- 'score': 0.8612850904464722,
974
- 'word': 'Pays-Bas',
975
- 'start': 112,
976
- 'end': 120},
977
- {'entity_group': 'ORG',
978
- 'score': 0.8148028254508972,
979
- 'word': 'les Bleus',
980
- 'start': 122,
981
- 'end': 131},
982
- {'entity_group': 'PER',
983
- 'score': 0.9994482398033142,
984
- 'word': 'Didier Deschamps',
985
- 'start': 250,
986
- 'end': 266},
987
- {'entity_group': 'MISC',
988
- 'score': 0.84807388484478,
989
- 'word': 'dernière Coupe du monde',
990
- 'start': 296,
991
- 'end': 319},
992
- {'entity_group': 'PER',
993
- 'score': 0.9996860176324844,
994
- 'word': 'Kylian Mbappé',
995
- 'start': 352,
996
- 'end': 365},
997
- {'entity_group': 'PER',
998
- 'score': 0.9996881932020187,
999
- 'word': 'Aurélien Tchouameni',
1000
- 'start': 367,
1001
- 'end': 386},
1002
- {'entity_group': 'PER',
1003
- 'score': 0.9996924996376038,
1004
- 'word': 'Antoine Griezmann',
1005
- 'start': 388,
1006
- 'end': 405},
1007
- {'entity_group': 'PER',
1008
- 'score': 0.9996860027313232,
1009
- 'word': 'Ibrahima Konaté',
1010
- 'start': 407,
1011
- 'end': 422},
1012
- {'entity_group': 'PER',
1013
- 'score': 0.9996623992919922,
1014
- 'word': 'Mike Maignan',
1015
- 'start': 433,
1016
- 'end': 445}]
1017
  ```
1018
 
1019
  ### Try it through Space
 
953
  ner = pipeline('token-classification', model='CATIE-AQ/NERmembert-base-4entities', tokenizer='CATIE-AQ/NERmembert-base-4entities', aggregation_strategy="simple")
954
 
955
  results = ner(
956
+ "Le français est une langue indo-européenne de la famille des langues romanes dont les locuteurs sont appelés francophones. Elle est parfois surnommée la langue de Molière, d'après l'auteur des Fourberies de Scapin. Le français est parlé, en 2023, sur tous les continents par environ 321 millions de personnes : 235 millions l'emploient quotidiennement et 90 millions en sont des locuteurs natifs. En 2018, 80 millions d'élèves et étudiants s'instruisent en français dans le monde. Selon l'Organisation internationale de la francophonie (OIF), il pourrait y avoir 700 millions de francophones sur Terre en 2050."
957
  )
958
 
959
  print(results)
960
  ```
961
  ```python
962
+ [
963
+ {'entity_group': 'MISC', 'score': 0.5237489, 'word': 'Molière', 'start': 163, 'end': 170},
964
+ {'entity_group': 'MISC', 'score': 0.94582415, 'word': 'Fourberies de Scapin', 'start': 193, 'end': 213},
965
+ {'entity_group': 'ORG', 'score': 0.99834096, 'word': 'Organisation internationale de la francophonie', 'start': 490, 'end': 536},
966
+ {'entity_group': 'ORG', 'score': 0.99768853, 'word': 'OIF', 'start': 538, 'end': 541},
967
+ {'entity_group': 'LOC', 'score': 0.9438753, 'word': 'Terre', 'start': 597, 'end': 602}
968
+ ]
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
969
  ```
970
 
971
  ### Try it through Space