czuk commited on
Commit
9247735
1 Parent(s): f053986

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +27 -1
README.md CHANGED
@@ -21,4 +21,30 @@ widget:
21
  - text: "ru:Великобританию"
22
  - text: "sl:evropske komisije"
23
  - text: "uk:Європейського агентства лікарських засобів"
24
- ---
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
21
  - text: "ru:Великобританию"
22
  - text: "sl:evropske komisije"
23
  - text: "uk:Європейського агентства лікарських засобів"
24
+ ---
25
+
26
+ # Model description
27
+
28
+ This is a baseline model for named entity **lemmatization** trained on the single-out topic split of the
29
+ [SlavicNER corpus](https://github.com/SlavicNLP/SlavicNER).
30
+
31
+
32
+ # Usage
33
+
34
+ You can use this model directly with a pipeline for text2text generation:
35
+
36
+ ```python
37
+ from transformers import pipeline
38
+
39
+ model_name = "SlavicNLP/slavicner-lemma-single-out-large"
40
+ pipe = pipeline("text2text-generation", model_name)
41
+
42
+ texts = ["pl:Polsce", "cs:Velké Británii", "bg:българите", "ru:Великобританию", "sl:evropske komisije",
43
+ "uk:Європейського агентства лікарських засобів"]
44
+
45
+ outputs = pipe(texts)
46
+
47
+ lemmas = [o['generated_text'] for o in outputs]
48
+ print(lemmas)
49
+ # ['Polska', 'Velká Británie', 'българи', 'Великобритания', 'evropska komisija', 'Європейське агентство лікарських засобів']
50
+ ```