Update spacy pipeline to 3.5.2

Browse files

Files changed (13) hide show

README.md +30 -30
config.cfg +33 -46
experimental_arc_labeler/model +2 -2
experimental_arc_predicter/model +2 -2
hu_core_news_trf_xl-any-py3-none-any.whl +2 -2
meta.json +197 -212
morphologizer/model +1 -1
ner/model +2 -2
senter/model +1 -1
tagger/model +1 -1
trainable_lemmatizer/model +2 -2
transformer/model +2 -2
vocab/strings.json +2 -2

README.md CHANGED Viewed

@@ -14,72 +14,72 @@ model-index:
     metrics:
     - name: NER Precision
       type: precision
-      value: 0.9202821869
     - name: NER Recall
       type: recall
-      value: 0.9173699015
     - name: NER F Score
       type: f_score
-      value: 0.9188237366
   - task:
       name: TAG
       type: token-classification
     metrics:
     - name: TAG (XPOS) Accuracy
       type: accuracy
-      value: 0.9823402728
   - task:
       name: POS
       type: token-classification
     metrics:
     - name: POS (UPOS) Accuracy
       type: accuracy
-      value: 0.981670256
   - task:
       name: MORPH
       type: token-classification
     metrics:
     - name: Morph (UFeats) Accuracy
       type: accuracy
-      value: 0.9739172051
   - task:
       name: LEMMA
       type: token-classification
     metrics:
     - name: Lemma Accuracy
       type: accuracy
-      value: 0.9899531145
   - task:
       name: UNLABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Unlabeled Attachment Score (UAS)
       type: f_score
-      value: 0.9080729291
   - task:
       name: LABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Labeled Attachment Score (LAS)
       type: f_score
-      value: 0.8665901043
   - task:
       name: SENTS
       type: token-classification
     metrics:
     - name: Sentences F-Score
       type: f_score
-      value: 0.9833887043
 ---
 Hungarian transformer pipeline (XLM-RoBERTa) for HuSpaCy. Components: transformer, senter, tagger, morphologizer, lemmatizer, parser, ner
 | Feature | Description |
 | --- | --- |
 | **Name** | `hu_core_news_trf_xl` |
-| **Version** | `3.5.1` |
 | **spaCy** | `>=3.5.0,<3.6.0` |
-| **Default Pipeline** | `transformer`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `lemma_smoother`, `experimental_arc_predicter`, `experimental_arc_labeler`, `ner` |
-| **Components** | `transformer`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `lemma_smoother`, `experimental_arc_predicter`, `experimental_arc_labeler`, `ner` |
 | **Vectors** | 0 keys, 0 unique vectors (0 dimensions) |
 | **Sources** | [UD Hungarian Szeged](https://universaldependencies.org/treebanks/hu_szeged/index.html) (Richárd Farkas, Katalin Simkó, Zsolt Szántó, Viktor Varga, Veronika Vincze (MTA-SZTE Research Group on Artificial Intelligence))<br />[NYTK-NerKor Corpus](https://github.com/nytud/NYTK-NerKor) (Eszter Simon, Noémi Vadász (Department of Language Technology and Applied Linguistics))<br />[hunNERwiki](http://hlt.sztaki.hu/resources/hunnerwiki.html) (Eszter Simon, Dávid Márk Nemeskey (HLT Group, Budapest University of Technology and Economics))<br />[Szeged NER Corpus](https://rgai.inf.u-szeged.hu/node/130) (György Szarvas, Richárd Farkas, László Felföldi, András Kocsor, János Csirik (MTA-SZTE Research Group on Artificial Intelligence))<br />[huBERT base model (cased)](https://huggingface.co/SZTAKI-HLT/hubert-base-cc) (Dávid Márk Nemeskey (SZTAKI-HLT)) |
 | **License** | `cc-by-sa-4.0` |
@@ -108,20 +108,20 @@ Hungarian transformer pipeline (XLM-RoBERTa) for HuSpaCy. Components: transforme
 | `TOKEN_P` | 99.86 |
 | `TOKEN_R` | 99.93 |
 | `TOKEN_F` | 99.89 |
-| `SENTS_P` | 97.80 |
-| `SENTS_R` | 98.89 |
-| `SENTS_F` | 98.34 |
-| `TAG_ACC` | 98.23 |
-| `POS_ACC` | 98.17 |
-| `MORPH_ACC` | 97.39 |
-| `MORPH_MICRO_P` | 99.16 |
-| `MORPH_MICRO_R` | 98.68 |
-| `MORPH_MICRO_F` | 98.92 |
-| `LEMMA_ACC` | 99.00 |
-| `BOUND_DEP_LAS` | 86.78 |
-| `BOUND_DEP_UAS` | 90.95 |
-| `DEP_UAS` | 90.81 |
-| `DEP_LAS` | 86.66 |
-| `ENTS_P` | 92.03 |
-| `ENTS_R` | 91.74 |
-| `ENTS_F` | 91.88 |

     metrics:
     - name: NER Precision
       type: precision
+      value: 0.9149982438
     - name: NER Recall
       type: recall
+      value: 0.9159634318
     - name: NER F Score
       type: f_score
+      value: 0.9154805834
   - task:
       name: TAG
       type: token-classification
     metrics:
     - name: TAG (XPOS) Accuracy
       type: accuracy
+      value: 0.981431853
   - task:
       name: POS
       type: token-classification
     metrics:
     - name: POS (UPOS) Accuracy
       type: accuracy
+      value: 0.980474732
   - task:
       name: MORPH
       type: token-classification
     metrics:
     - name: Morph (UFeats) Accuracy
       type: accuracy
+      value: 0.9659264931
   - task:
       name: LEMMA
       type: token-classification
     metrics:
     - name: Lemma Accuracy
       type: accuracy
+      value: 0.9894746914
   - task:
       name: UNLABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Unlabeled Attachment Score (UAS)
       type: f_score
+      value: 0.9112312772
   - task:
       name: LABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Labeled Attachment Score (LAS)
       type: f_score
+      value: 0.868695569
   - task:
       name: SENTS
       type: token-classification
     metrics:
     - name: Sentences F-Score
       type: f_score
+      value: 0.9933184855
 ---
 Hungarian transformer pipeline (XLM-RoBERTa) for HuSpaCy. Components: transformer, senter, tagger, morphologizer, lemmatizer, parser, ner
 | Feature | Description |
 | --- | --- |
 | **Name** | `hu_core_news_trf_xl` |
+| **Version** | `3.5.2` |
 | **spaCy** | `>=3.5.0,<3.6.0` |
+| **Default Pipeline** | `transformer`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `experimental_arc_predicter`, `experimental_arc_labeler`, `ner` |
+| **Components** | `transformer`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `experimental_arc_predicter`, `experimental_arc_labeler`, `ner` |
 | **Vectors** | 0 keys, 0 unique vectors (0 dimensions) |
 | **Sources** | [UD Hungarian Szeged](https://universaldependencies.org/treebanks/hu_szeged/index.html) (Richárd Farkas, Katalin Simkó, Zsolt Szántó, Viktor Varga, Veronika Vincze (MTA-SZTE Research Group on Artificial Intelligence))<br />[NYTK-NerKor Corpus](https://github.com/nytud/NYTK-NerKor) (Eszter Simon, Noémi Vadász (Department of Language Technology and Applied Linguistics))<br />[hunNERwiki](http://hlt.sztaki.hu/resources/hunnerwiki.html) (Eszter Simon, Dávid Márk Nemeskey (HLT Group, Budapest University of Technology and Economics))<br />[Szeged NER Corpus](https://rgai.inf.u-szeged.hu/node/130) (György Szarvas, Richárd Farkas, László Felföldi, András Kocsor, János Csirik (MTA-SZTE Research Group on Artificial Intelligence))<br />[huBERT base model (cased)](https://huggingface.co/SZTAKI-HLT/hubert-base-cc) (Dávid Márk Nemeskey (SZTAKI-HLT)) |
 | **License** | `cc-by-sa-4.0` |
 | `TOKEN_P` | 99.86 |
 | `TOKEN_R` | 99.93 |
 | `TOKEN_F` | 99.89 |
+| `SENTS_P` | 99.33 |
+| `SENTS_R` | 99.33 |
+| `SENTS_F` | 99.33 |
+| `TAG_ACC` | 98.14 |
+| `POS_ACC` | 98.05 |
+| `MORPH_ACC` | 96.59 |
+| `MORPH_MICRO_P` | 98.78 |
+| `MORPH_MICRO_R` | 98.36 |
+| `MORPH_MICRO_F` | 98.57 |
+| `LEMMA_ACC` | 98.95 |
+| `BOUND_DEP_LAS` | 86.89 |
+| `BOUND_DEP_UAS` | 91.16 |
+| `DEP_UAS` | 91.12 |
+| `DEP_LAS` | 86.87 |
+| `ENTS_P` | 91.50 |
+| `ENTS_R` | 91.60 |
+| `ENTS_F` | 91.55 |

config.cfg CHANGED Viewed

@@ -1,8 +1,8 @@
 [paths]
-tagger_model = "models/hu_core_news_trf_xl-tagger-3.5.0/model-best"
-parser_model = "models/hu_core_news_trf_xl-parser-3.5.0/model-best"
-ner_model = "models/hu_core_news_trf_xl-ner-3.5.0/model-best"
-lemmatizer_lookups = "models/hu_core_news_trf_xl-lookup-lemmatizer-3.5.0"
 train = null
 dev = null
 vectors = null
@@ -14,7 +14,7 @@ gpu_allocator = null
 [nlp]
 lang = "hu"
-pipeline = ["transformer","senter","tagger","morphologizer","lookup_lemmatizer","trainable_lemmatizer","lemma_smoother","experimental_arc_predicter","experimental_arc_labeler","ner"]
 tokenizer = {"@tokenizers":"spacy.Tokenizer.v1"}
 disabled = []
 before_creation = null
@@ -30,30 +30,17 @@ scorer = {"@scorers":"spacy-experimental.biaffine_parser_scorer.v1"}
 [components.experimental_arc_labeler.model]
 @architectures = "spacy-experimental.Bilinear.v1"
-hidden_width = 128
-mixed_precision = false
 nO = null
 dropout = 0.1
 grad_scaler = null
 [components.experimental_arc_labeler.model.tok2vec]
-@architectures = "spacy-transformers.Tok2VecTransformer.v3"
-name = "xlm-roberta-large"
-mixed_precision = false
-pooling = {"@layers":"reduce_mean.v1"}
 grad_factor = 1.0
-[components.experimental_arc_labeler.model.tok2vec.get_spans]
-@span_getters = "spacy-transformers.strided_spans.v1"
-window = 128
-stride = 96
-[components.experimental_arc_labeler.model.tok2vec.grad_scaler_config]
-[components.experimental_arc_labeler.model.tok2vec.tokenizer_config]
-use_fast = true
-[components.experimental_arc_labeler.model.tok2vec.transformer_config]
 [components.experimental_arc_predicter]
 factory = "experimental_arc_predicter"
@@ -61,33 +48,17 @@ scorer = {"@scorers":"spacy-experimental.biaffine_parser_scorer.v1"}
 [components.experimental_arc_predicter.model]
 @architectures = "spacy-experimental.PairwiseBilinear.v1"
-hidden_width = 256
 nO = 1
 mixed_precision = false
 dropout = 0.1
 grad_scaler = null
 [components.experimental_arc_predicter.model.tok2vec]
-@architectures = "spacy-transformers.Tok2VecTransformer.v3"
-name = "xlm-roberta-large"
-mixed_precision = false
-pooling = {"@layers":"reduce_mean.v1"}
 grad_factor = 1.0
-[components.experimental_arc_predicter.model.tok2vec.get_spans]
-@span_getters = "spacy-transformers.strided_spans.v1"
-window = 128
-stride = 96
-[components.experimental_arc_predicter.model.tok2vec.grad_scaler_config]
-[components.experimental_arc_predicter.model.tok2vec.tokenizer_config]
-use_fast = true
-[components.experimental_arc_predicter.model.tok2vec.transformer_config]
-[components.lemma_smoother]
-factory = "hu.lemma_smoother"
 [components.lookup_lemmatizer]
 factory = "hu.lookup_lemmatizer"
@@ -145,6 +116,7 @@ stride = 96
 [components.ner.model.tok2vec.tokenizer_config]
 use_fast = true
 [components.ner.model.tok2vec.transformer_config]
@@ -193,10 +165,24 @@ top_k = 3
 nO = null
 [components.trainable_lemmatizer.model.tok2vec]
-@architectures = "spacy-transformers.TransformerListener.v1"
-grad_factor = 1.0
-upstream = "transformer"
 pooling = {"@layers":"reduce_mean.v1"}
 [components.transformer]
 factory = "transformer"
@@ -217,6 +203,7 @@ stride = 96
 [components.transformer.model.tokenizer_config]
 use_fast = true
 [components.transformer.model.transformer_config]

 [paths]
+tagger_model = "models/hu_core_news_trf_xl-tagger-3.5.2/model-best"
+parser_model = "models/hu_core_news_trf_xl-parser-3.5.2/model-best"
+ner_model = "models/hu_core_news_trf_xl-ner-3.5.2/model-best"
+lemmatizer_lookups = "models/hu_core_news_trf_xl-lookup-lemmatizer-3.5.2"
 train = null
 dev = null
 vectors = null
 [nlp]
 lang = "hu"
+pipeline = ["transformer","senter","tagger","morphologizer","lookup_lemmatizer","trainable_lemmatizer","experimental_arc_predicter","experimental_arc_labeler","ner"]
 tokenizer = {"@tokenizers":"spacy.Tokenizer.v1"}
 disabled = []
 before_creation = null
 [components.experimental_arc_labeler.model]
 @architectures = "spacy-experimental.Bilinear.v1"
+hidden_width = 256
+mixed_precision = true
 nO = null
 dropout = 0.1
 grad_scaler = null
 [components.experimental_arc_labeler.model.tok2vec]
+@architectures = "spacy-transformers.TransformerListener.v1"
 grad_factor = 1.0
+upstream = "transformer"
+pooling = {"@layers":"reduce_mean.v1"}
 [components.experimental_arc_predicter]
 factory = "experimental_arc_predicter"
 [components.experimental_arc_predicter.model]
 @architectures = "spacy-experimental.PairwiseBilinear.v1"
+hidden_width = 64
 nO = 1
 mixed_precision = false
 dropout = 0.1
 grad_scaler = null
 [components.experimental_arc_predicter.model.tok2vec]
+@architectures = "spacy-transformers.TransformerListener.v1"
 grad_factor = 1.0
+upstream = "transformer"
+pooling = {"@layers":"reduce_mean.v1"}
 [components.lookup_lemmatizer]
 factory = "hu.lookup_lemmatizer"
 [components.ner.model.tok2vec.tokenizer_config]
 use_fast = true
+model_max_length = 512
 [components.ner.model.tok2vec.transformer_config]
 nO = null
 [components.trainable_lemmatizer.model.tok2vec]
+@architectures = "spacy-transformers.Tok2VecTransformer.v3"
+name = "xlm-roberta-large"
+mixed_precision = false
 pooling = {"@layers":"reduce_mean.v1"}
+grad_factor = 1.0
+[components.trainable_lemmatizer.model.tok2vec.get_spans]
+@span_getters = "spacy-transformers.strided_spans.v1"
+window = 128
+stride = 96
+[components.trainable_lemmatizer.model.tok2vec.grad_scaler_config]
+[components.trainable_lemmatizer.model.tok2vec.tokenizer_config]
+use_fast = true
+model_max_length = 512
+[components.trainable_lemmatizer.model.tok2vec.transformer_config]
 [components.transformer]
 factory = "transformer"
 [components.transformer.model.tokenizer_config]
 use_fast = true
+model_max_length = 512
 [components.transformer.model.transformer_config]

experimental_arc_labeler/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d415fbe4fdcaf6ddf0fa5099ddd349b4b7a22dd45256582537910a3d435260da
-size 2258260957

 version https://git-lfs.github.com/spec/v1
+oid sha256:0bf1868928fadb86fd9e90fbd673123607dee68de5d4e02b850ff1174cb5a0f3
+size 15471467

experimental_arc_predicter/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c5f20dbd745f69e3a6b5f5eb83e61ed1ee11e17b47cc156f8402433dde49b0bc
-size 2256232061

 version https://git-lfs.github.com/spec/v1
+oid sha256:f531352a043e651736606e9d3cc586f3d6b79e99eb93b3b3c7c462b4df38e6dd
+size 544264

hu_core_news_trf_xl-any-py3-none-any.whl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:15deb669afc3207337ab8984afbed83f3cccd63cee37d4ae046107850169cb63
-size 7379980360

 version https://git-lfs.github.com/spec/v1
+oid sha256:19947bd67ef18028f02151c47d1106343afad88fffb7ae322727443f1dd21025
+size 5554448736

meta.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "lang":"hu",
   "name":"core_news_trf_xl",
-  "version":"3.5.1",
   "description":"Hungarian transformer pipeline (XLM-RoBERTa) for HuSpaCy. Components: transformer, senter, tagger, morphologizer, lemmatizer, parser, ner",
   "author":"SzegedAI, MILAB",
   "email":"gyorgy@orosz.link",
@@ -1187,9 +1187,6 @@
     ],
     "lookup_lemmatizer":[
-    ],
-    "lemma_smoother":[
     ],
     "experimental_arc_predicter":[
@@ -1261,7 +1258,6 @@
     "morphologizer",
     "lookup_lemmatizer",
     "trainable_lemmatizer",
-    "lemma_smoother",
     "experimental_arc_predicter",
     "experimental_arc_labeler",
     "ner"
@@ -1273,7 +1269,6 @@
     "morphologizer",
     "lookup_lemmatizer",
     "trainable_lemmatizer",
-    "lemma_smoother",
     "experimental_arc_predicter",
     "experimental_arc_labeler",
     "ner"
@@ -1286,297 +1281,292 @@
     "token_p":0.998565417,
     "token_r":0.9993300153,
     "token_f":0.9989475698,
-    "sents_p":0.9779735683,
-    "sents_r":0.9888641425,
-    "sents_f":0.9833887043,
-    "tag_acc":0.9823402728,
-    "pos_acc":0.981670256,
-    "morph_acc":0.9739172051,
-    "morph_micro_p":0.9915792201,
-    "morph_micro_r":0.9867640739,
-    "morph_micro_f":0.9891657871,
     "morph_per_feat":{
       "Definite":{
-        "p":0.9902052239,
-        "r":0.9906672888,
-        "f":0.9904362025
       },
       "PronType":{
-        "p":0.991708126,
-        "r":0.9900662252,
-        "f":0.9908864954
       },
       "Case":{
-        "p":0.995030809,
-        "r":0.9891325825,
-        "f":0.9920729291
       },
       "Degree":{
-        "p":0.9793103448,
-        "r":0.9450915141,
-        "f":0.9618966977
       },
       "Number":{
-        "p":0.996970207,
-        "r":0.9926261103,
-        "f":0.9947934162
       },
       "Mood":{
-        "p":0.9911209767,
-        "r":0.9900221729,
-        "f":0.9905712701
       },
       "Person":{
-        "p":0.9900990099,
-        "r":0.9868421053,
-        "f":0.9884678748
       },
       "Tense":{
-        "p":0.9988901221,
-        "r":0.9944751381,
-        "f":0.9966777409
       },
       "VerbForm":{
-        "p":0.9854014599,
-        "r":0.9743384122,
-        "f":0.9798387097
       },
       "Voice":{
-        "p":0.9866939611,
         "r":0.9856850716,
-        "f":0.9861892583
       },
       "Number[psor]":{
-        "p":0.9943181818,
-        "r":0.9971509972,
-        "f":0.9957325747
       },
       "Person[psor]":{
-        "p":0.9928977273,
-        "r":0.997146933,
-        "f":0.9950177936
       },
       "NumType":{
-        "p":0.9776674938,
-        "r":0.9609756098,
-        "f":0.9692496925
       },
       "Reflex":{
-        "p":1.0,
-        "r":0.75,
-        "f":0.8571428571
-      },
-      "Reflexive":{
-        "p":0.0,
-        "r":0.0,
-        "f":0.0
       },
       "Aspect":{
         "p":1.0,
         "r":0.25,
         "f":0.4
       },
-      "NumType[sem]":{
-        "p":0.0,
-        "r":0.0,
-        "f":0.0
       },
       "Number[psed]":{
         "p":1.0,
-        "r":0.5555555556,
-        "f":0.7142857143
-      },
-      "Poss":{
-        "p":1.0,
-        "r":1.0,
-        "f":1.0
       }
     },
-    "lemma_acc":0.9899531145,
-    "bound_dep_las":0.8677780972,
-    "bound_dep_uas":0.9094567404,
-    "dep_uas":0.9080729291,
-    "dep_las":0.8665901043,
     "dep_las_per_type":{
       "415":{
-        "p":0.9248826291,
-        "r":0.9410828025,
-        "f":0.9329123915
       },
       "7411097074813287689":{
-        "p":0.9019920319,
-        "r":0.9255928046,
-        "f":0.9136400323
       },
       "429":{
-        "p":0.9110764431,
-        "r":0.9125,
-        "f":0.9117876659
       },
       "15861261214731031920":{
-        "p":0.7163461538,
-        "r":0.7303921569,
-        "f":0.7233009709
       },
       "991268021520064439":{
-        "p":0.8756302521,
-        "r":0.8830508475,
-        "f":0.8793248945
       },
       "435":{
-        "p":0.9028156222,
-        "r":0.8946894689,
-        "f":0.8987341772
       },
       "434":{
-        "p":0.953539823,
-        "r":0.9685393258,
-        "f":0.9609810479
       },
       "8206900633647566924":{
-        "p":0.8923395445,
-        "r":0.9599109131,
-        "f":0.9248927039
       },
       "407":{
-        "p":0.8443496802,
         "r":0.8336842105,
-        "f":0.8389830508
       },
       "410":{
-        "p":0.75,
-        "r":0.7625,
-        "f":0.7561983471
       },
       "445":{
-        "p":0.8609226594,
-        "r":0.8580121704,
-        "f":0.8594649509
       },
       "400":{
-        "p":0.8571428571,
-        "r":0.8842105263,
-        "f":0.8704663212
       },
       "17772752594865228322":{
-        "p":0.9669811321,
         "r":0.9579439252,
-        "f":0.9624413146
       },
       "403":{
-        "p":0.6413043478,
-        "r":0.6276595745,
-        "f":0.6344086022
       },
       "399":{
-        "p":0.6132075472,
-        "r":0.6632653061,
-        "f":0.637254902
       },
       "3143985677199705895":{
-        "p":0.784,
-        "r":0.852173913,
-        "f":0.8166666667
       },
       "9241468201421778905":{
-        "p":0.5789473684,
-        "r":0.6666666667,
-        "f":0.6197183099
       },
       "423":{
-        "p":0.9496855346,
-        "r":0.9556962025,
-        "f":0.952681388
       },
       "13543738850102096385":{
-        "p":0.9541284404,
-        "r":0.9541284404,
-        "f":0.9541284404
       },
       "10901028881100056900":{
-        "p":0.7352941176,
-        "r":0.78125,
-        "f":0.7575757576
       },
       "411":{
-        "p":0.8648648649,
-        "r":0.7804878049,
-        "f":0.8205128205
       },
       "12549387360942434255":{
-        "p":0.5897435897,
-        "r":0.575,
-        "f":0.582278481
       },
       "303601073839818384":{
         "p":0.5,
-        "r":0.125,
-        "f":0.2
       },
       "8884235091647096537":{
-        "p":0.0,
-        "r":0.0,
-        "f":0.0
       },
       "2249809950233855422":{
-        "p":0.7222222222,
-        "r":0.8125,
-        "f":0.7647058824
       },
       "422":{
-        "p":0.4,
-        "r":0.6666666667,
-        "f":0.5
       },
       "8110129090154140942":{
-        "p":0.9536082474,
-        "r":0.943877551,
-        "f":0.9487179487
       },
       "412":{
-        "p":0.6896551724,
-        "r":0.5405405405,
-        "f":0.6060606061
       },
       "436":{
-        "p":0.3928571429,
-        "r":0.1506849315,
-        "f":0.2178217822
       },
       "450":{
-        "p":0.9473684211,
         "r":0.972972973,
-        "f":0.96
       },
       "12837356684637874264":{
-        "p":0.765625,
-        "r":0.5268817204,
-        "f":0.6242038217
       },
       "451":{
-        "p":0.5915492958,
-        "r":0.5833333333,
-        "f":0.5874125874
       },
       "7349492218059511525":{
-        "p":0.5714285714,
-        "r":0.4,
-        "f":0.4705882353
       },
       "426":{
-        "p":0.625,
         "r":0.4545454545,
-        "f":0.5263157895
       },
       "405":{
-        "p":0.9166666667,
-        "r":0.9166666667,
-        "f":0.9166666667
       },
       "17865338459503383721":{
         "p":1.0,
-        "r":0.3333333333,
-        "f":0.5
       },
       "17311980334327143026":{
         "p":0.0,
@@ -1584,14 +1574,9 @@
         "f":0.0
       },
       "7037928807040764755":{
-        "p":0.975,
-        "r":0.975,
-        "f":0.975
-      },
-      "408":{
-        "p":0.1428571429,
-        "r":0.0769230769,
-        "f":0.1
       },
       "11190527879068114961":{
         "p":0.0,
@@ -1599,24 +1584,24 @@
         "f":0.0
       },
       "3350290345017230236":{
-        "p":0.1666666667,
-        "r":0.0833333333,
-        "f":0.1111111111
-      },
-      "10069665988847657778":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "17473201795025412735":{
-        "p":1.0,
         "r":0.1666666667,
-        "f":0.2857142857
       },
       "6522094215780122214":{
-        "p":0.8,
         "r":1.0,
-        "f":0.8888888889
       },
       "203073658115086772":{
         "p":0.0,
@@ -1624,32 +1609,32 @@
         "f":0.0
       }
     },
-    "ents_p":0.9202821869,
-    "ents_r":0.9173699015,
-    "ents_f":0.9188237366,
     "ents_per_type":{
       "ORG":{
-        "p":0.9381395349,
-        "r":0.9350950394,
-        "f":0.9366148131
       },
       "PER":{
-        "p":0.9494888755,
-        "r":0.9432497013,
-        "f":0.9463590051
       },
       "LOC":{
-        "p":0.9285091543,
-        "r":0.9244791667,
-        "f":0.9264897782
       },
       "MISC":{
-        "p":0.7845070423,
-        "r":0.790070922,
-        "f":0.7872791519
       }
     },
-    "speed":1581.862775048
   },
   "sources":[
     {

 {
   "lang":"hu",
   "name":"core_news_trf_xl",
+  "version":"3.5.2",
   "description":"Hungarian transformer pipeline (XLM-RoBERTa) for HuSpaCy. Components: transformer, senter, tagger, morphologizer, lemmatizer, parser, ner",
   "author":"SzegedAI, MILAB",
   "email":"gyorgy@orosz.link",
     ],
     "lookup_lemmatizer":[
     ],
     "experimental_arc_predicter":[
     "morphologizer",
     "lookup_lemmatizer",
     "trainable_lemmatizer",
     "experimental_arc_predicter",
     "experimental_arc_labeler",
     "ner"
     "morphologizer",
     "lookup_lemmatizer",
     "trainable_lemmatizer",
     "experimental_arc_predicter",
     "experimental_arc_labeler",
     "ner"
     "token_p":0.998565417,
     "token_r":0.9993300153,
     "token_f":0.9989475698,
+    "sents_p":0.9933184855,
+    "sents_r":0.9933184855,
+    "sents_f":0.9933184855,
+    "tag_acc":0.981431853,
+    "pos_acc":0.980474732,
+    "morph_acc":0.9659264931,
+    "morph_micro_p":0.9877869843,
+    "morph_micro_r":0.9836269875,
+    "morph_micro_f":0.9857025968,
     "morph_per_feat":{
       "Definite":{
+        "p":0.9865491651,
+        "r":0.9925338311,
+        "f":0.9895324494
       },
       "PronType":{
+        "p":0.9889258029,
+        "r":0.9856512141,
+        "f":0.9872857933
       },
       "Case":{
+        "p":0.9928486293,
+        "r":0.9875518672,
+        "f":0.9901931649
       },
       "Degree":{
+        "p":0.9625212947,
+        "r":0.9400998336,
+        "f":0.9511784512
       },
       "Number":{
+        "p":0.99545684,
+        "r":0.9914529915,
+        "f":0.9934508816
       },
       "Mood":{
+        "p":0.9834254144,
+        "r":0.9866962306,
+        "f":0.9850581074
       },
       "Person":{
+        "p":0.9851239669,
+        "r":0.9802631579,
+        "f":0.9826875515
       },
       "Tense":{
+        "p":0.9889624724,
+        "r":0.9900552486,
+        "f":0.9895085588
       },
       "VerbForm":{
+        "p":0.9813614263,
+        "r":0.9711307137,
+        "f":0.9762192664
       },
       "Voice":{
+        "p":0.9826707441,
         "r":0.9856850716,
+        "f":0.9841755998
       },
       "Number[psor]":{
+        "p":0.9885057471,
+        "r":0.9800569801,
+        "f":0.9842632332
       },
       "Person[psor]":{
+        "p":0.9899425287,
+        "r":0.9828815977,
+        "f":0.9863994273
       },
       "NumType":{
+        "p":0.934939759,
+        "r":0.9463414634,
+        "f":0.9406060606
       },
       "Reflex":{
+        "p":0.875,
+        "r":0.875,
+        "f":0.875
       },
       "Aspect":{
         "p":1.0,
         "r":0.25,
         "f":0.4
       },
+      "Poss":{
+        "p":0.75,
+        "r":1.0,
+        "f":0.8571428571
       },
       "Number[psed]":{
         "p":1.0,
+        "r":0.3333333333,
+        "f":0.5
       }
     },
+    "lemma_acc":0.9894746914,
+    "bound_dep_las":0.8688869748,
+    "bound_dep_uas":0.9115704852,
+    "dep_uas":0.9112312772,
+    "dep_las":0.868695569,
     "dep_las_per_type":{
       "415":{
+        "p":0.9375494071,
+        "r":0.9442675159,
+        "f":0.9408964697
       },
       "7411097074813287689":{
+        "p":0.9214113873,
+        "r":0.9394930499,
+        "f":0.9303643725
       },
       "429":{
+        "p":0.9213836478,
+        "r":0.915625,
+        "f":0.9184952978
       },
       "15861261214731031920":{
+        "p":0.7578125,
+        "r":0.7132352941,
+        "f":0.7348484848
       },
       "991268021520064439":{
+        "p":0.8987993139,
+        "r":0.8881355932,
+        "f":0.8934356351
       },
       "435":{
+        "p":0.8863636364,
+        "r":0.9126912691,
+        "f":0.8993348115
       },
       "434":{
+        "p":0.9516483516,
+        "r":0.9730337079,
+        "f":0.9622222222
       },
       "8206900633647566924":{
+        "p":0.853515625,
+        "r":0.9732739421,
+        "f":0.9094693028
       },
       "407":{
+        "p":0.8267223382,
         "r":0.8336842105,
+        "f":0.8301886792
       },
       "410":{
+        "p":0.7733050847,
+        "r":0.7604166667,
+        "f":0.7668067227
       },
       "445":{
+        "p":0.8590694538,
+        "r":0.861392833,
+        "f":0.8602295746
       },
       "400":{
+        "p":0.8453608247,
+        "r":0.8631578947,
+        "f":0.8541666667
       },
       "17772752594865228322":{
+        "p":0.9534883721,
         "r":0.9579439252,
+        "f":0.9557109557
       },
       "403":{
+        "p":0.5909090909,
+        "r":0.5531914894,
+        "f":0.5714285714
       },
       "399":{
+        "p":0.5247524752,
+        "r":0.5408163265,
+        "f":0.5326633166
       },
       "3143985677199705895":{
+        "p":0.7807692308,
+        "r":0.8826086957,
+        "f":0.8285714286
       },
       "9241468201421778905":{
+        "p":0.4146341463,
+        "r":0.5151515152,
+        "f":0.4594594595
       },
       "423":{
+        "p":0.949044586,
+        "r":0.9430379747,
+        "f":0.946031746
       },
       "13543738850102096385":{
+        "p":0.9633027523,
+        "r":0.9633027523,
+        "f":0.9633027523
       },
       "10901028881100056900":{
+        "p":0.8275862069,
+        "r":0.75,
+        "f":0.7868852459
       },
       "411":{
+        "p":0.8461538462,
+        "r":0.8048780488,
+        "f":0.825
       },
       "12549387360942434255":{
+        "p":0.4857142857,
+        "r":0.425,
+        "f":0.4533333333
       },
       "303601073839818384":{
         "p":0.5,
+        "r":0.375,
+        "f":0.4285714286
       },
       "8884235091647096537":{
+        "p":0.5,
+        "r":0.1666666667,
+        "f":0.25
       },
       "2249809950233855422":{
+        "p":0.5357142857,
+        "r":0.46875,
+        "f":0.5
       },
       "422":{
+        "p":0.4137931034,
+        "r":0.8,
+        "f":0.5454545455
+      },
+      "408":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "8110129090154140942":{
+        "p":0.9896907216,
+        "r":0.9795918367,
+        "f":0.9846153846
       },
       "412":{
+        "p":0.5714285714,
+        "r":0.4324324324,
+        "f":0.4923076923
       },
       "436":{
+        "p":0.3125,
+        "r":0.0684931507,
+        "f":0.1123595506
       },
       "450":{
+        "p":0.9350649351,
         "r":0.972972973,
+        "f":0.9536423841
       },
       "12837356684637874264":{
+        "p":0.7564102564,
+        "r":0.6344086022,
+        "f":0.6900584795
       },
       "451":{
+        "p":0.578125,
+        "r":0.5138888889,
+        "f":0.5441176471
       },
       "7349492218059511525":{
+        "p":0.8,
+        "r":0.8,
+        "f":0.8
       },
       "426":{
+        "p":0.7142857143,
         "r":0.4545454545,
+        "f":0.5555555556
       },
       "405":{
+        "p":0.9090909091,
+        "r":0.8333333333,
+        "f":0.8695652174
       },
       "17865338459503383721":{
         "p":1.0,
+        "r":0.1666666667,
+        "f":0.2857142857
       },
       "17311980334327143026":{
         "p":0.0,
         "f":0.0
       },
       "7037928807040764755":{
+        "p":1.0,
+        "r":1.0,
+        "f":1.0
       },
       "11190527879068114961":{
         "p":0.0,
         "f":0.0
       },
       "3350290345017230236":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "17473201795025412735":{
+        "p":0.2,
         "r":0.1666666667,
+        "f":0.1818181818
+      },
+      "10069665988847657778":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "6522094215780122214":{
+        "p":1.0,
         "r":1.0,
+        "f":1.0
       },
       "203073658115086772":{
         "p":0.0,
         "f":0.0
       }
     },
+    "ents_p":0.9149982438,
+    "ents_r":0.9159634318,
+    "ents_f":0.9154805834,
     "ents_per_type":{
       "ORG":{
+        "p":0.9283402681,
+        "r":0.9309225777,
+        "f":0.9296296296
       },
       "PER":{
+        "p":0.9412114014,
+        "r":0.9468339307,
+        "f":0.9440142942
       },
       "LOC":{
+        "p":0.9278887924,
+        "r":0.9270833333,
+        "f":0.927485888
       },
       "MISC":{
+        "p":0.7887931034,
+        "r":0.7787234043,
+        "f":0.7837259101
       }
     },
+    "speed":2317.5573317177
   },
   "sources":[
     {

morphologizer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:abc78750b871c4dcba7fc69138f751747147f384ef1932c7903405d857cdbf1b
 size 4695153

 version https://git-lfs.github.com/spec/v1
+oid sha256:ca1bd4d8c5e2185843bd553a592a8b6a1816862b6a13db0cf9515671bce3aa9f
 size 4695153

ner/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:67ea241f24bface3c6bd3484e9a45e03825d3cdac9b56e3d7d4b4587241aba7a
-size 2254213831

 version https://git-lfs.github.com/spec/v1
+oid sha256:cd4c145ddf367e2cf83cd534fef01c8b5da2c90c2f0c08a8e527ecb48970e95e
+size 2262217095

senter/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:36c2c139648af12aa8b8de12dbd710958e6ff770273491f1567217a3b933314d
 size 8840

 version https://git-lfs.github.com/spec/v1
+oid sha256:b06e9dfcc8aa4dff4b4b00bba830a8445b911edf8a163b37f586fe964c82cc41
 size 8840

tagger/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d44433d7e6042d0141a311830ee505fded269037c14e759091925bd7be1b8763
 size 70342

 version https://git-lfs.github.com/spec/v1
+oid sha256:2ca5c947cb64d16c48c71878b60742843cdd6137dcbf4f2d8cb594afd9a0dc7f
 size 70342

trainable_lemmatizer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6f143786db9d209fb1c906d068ffb49a0a5e851bca711e3c1d7cbd2524b62154
-size 16470353

 version https://git-lfs.github.com/spec/v1
+oid sha256:c5d9f7bb1af0b65dd2976ca7eaadafb4deca10f54acb6099b2978321f5419ef1
+size 2278339716

transformer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8a9424952a25dd8baa52bbd1931dd605a46b08b2c71dc092eda66bcb1ad5090f
-size 2253866087

 version https://git-lfs.github.com/spec/v1
+oid sha256:90d1425b78999a38e46c706823582badec4518aa2d9a271a240035605c9b8793
+size 2261869351

vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a2441f7028cc80abc31b949efc629df97d2ad46310bfbb7debd601f09c61857b
-size 6393242

 version https://git-lfs.github.com/spec/v1
+oid sha256:b83edc14b03d35ed1c7b3e3b4c4bbcc82ccac1a32a30f2b5302fb6706f57b2c4
+size 6393481