Update spacy pipeline to 3.6.0

Browse files

Files changed (15) hide show

README.md +28 -28
config.cfg +6 -4
hu_core_news_lg-any-py3-none-any.whl +2 -2
meta.json +187 -193
morphologizer/cfg +1 -0
morphologizer/model +1 -1
ner/model +1 -1
parser/model +1 -1
senter/model +1 -1
tagger/cfg +1 -0
tagger/model +1 -1
tok2vec/model +1 -1
trainable_lemmatizer/model +1 -1
vocab/strings.json +2 -2
vocab/vectors.cfg +2 -1

README.md CHANGED Viewed

@@ -14,74 +14,74 @@ model-index:
     metrics:
     - name: NER Precision
       type: precision
-      value: 0.8625558534
     - name: NER Recall
       type: recall
-      value: 0.8484528833
     - name: NER F Score
       type: f_score
-      value: 0.8554462466
   - task:
       name: TAG
       type: token-classification
     metrics:
     - name: TAG (XPOS) Accuracy
       type: accuracy
-      value: 0.9631543688
   - task:
       name: POS
       type: token-classification
     metrics:
     - name: POS (UPOS) Accuracy
       type: accuracy
-      value: 0.9651641305
   - task:
       name: MORPH
       type: token-classification
     metrics:
     - name: Morph (UFeats) Accuracy
       type: accuracy
-      value: 0.9281270935
   - task:
       name: LEMMA
       type: token-classification
     metrics:
     - name: Lemma Accuracy
       type: accuracy
-      value: 0.9750263133
   - task:
       name: UNLABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Unlabeled Attachment Score (UAS)
       type: f_score
-      value: 0.8058213942
   - task:
       name: LABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Labeled Attachment Score (LAS)
       type: f_score
-      value: 0.7387315968
   - task:
       name: SENTS
       type: token-classification
     metrics:
     - name: Sentences F-Score
       type: f_score
-      value: 0.9753914989
 ---
 Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morphologizer, lemmatizer, parser, ner
 | Feature | Description |
 | --- | --- |
 | **Name** | `hu_core_news_lg` |
-| **Version** | `3.5.2` |
-| **spaCy** | `>=3.5.0,<3.6.0` |
 | **Default Pipeline** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Components** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Vectors** | -1 keys, 200000 unique vectors (300 dimensions) |
-| **Sources** | [UD Hungarian Szeged](https://universaldependencies.org/treebanks/hu_szeged/index.html) (Richárd Farkas, Katalin Simkó, Zsolt Szántó, Viktor Varga, Veronika Vincze (MTA-SZTE Research Group on Artificial Intelligence))<br />[NYTK-NerKor Corpus](https://github.com/nytud/NYTK-NerKor) (Eszter Simon, Noémi Vadász (Department of Language Technology and Applied Linguistics))<br />[hunNERwiki](http://hlt.sztaki.hu/resources/hunnerwiki.html) (Eszter Simon, Dávid Márk Nemeskey (HLT Group, Budapest University of Technology and Economics))<br />[Szeged NER Corpus](https://rgai.inf.u-szeged.hu/node/130) (György Szarvas, Richárd Farkas, László Felföldi, András Kocsor, János Csirik (MTA-SZTE Research Group on Artificial Intelligence))<br />[Webcorpuswiki word2vec model](https://github.com/oroszgy/hunlp-resources/releases/tag/webcorpuswiki_word2vec_v0.1) (György Orosz) |
 | **License** | `cc-by-sa-4.0` |
 | **Author** | [SzegedAI, MILAB](https://github.com/huspacy/huspacy) |
@@ -108,18 +108,18 @@ Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morpholog
 | `TOKEN_P` | 99.86 |
 | `TOKEN_R` | 99.93 |
 | `TOKEN_F` | 99.89 |
-| `SENTS_P` | 97.98 |
-| `SENTS_R` | 97.10 |
-| `SENTS_F` | 97.54 |
-| `TAG_ACC` | 96.32 |
-| `POS_ACC` | 96.52 |
-| `MORPH_ACC` | 92.81 |
-| `MORPH_MICRO_P` | 96.62 |
-| `MORPH_MICRO_R` | 95.86 |
-| `MORPH_MICRO_F` | 96.24 |
-| `LEMMA_ACC` | 97.50 |
-| `DEP_UAS` | 80.58 |
-| `DEP_LAS` | 73.87 |
-| `ENTS_P` | 86.26 |
-| `ENTS_R` | 84.85 |
-| `ENTS_F` | 85.54 |

     metrics:
     - name: NER Precision
       type: precision
+      value: 0.8636042403
     - name: NER Recall
       type: recall
+      value: 0.8593530239
     - name: NER F Score
       type: f_score
+      value: 0.8614733874
   - task:
       name: TAG
       type: token-classification
     metrics:
     - name: TAG (XPOS) Accuracy
       type: accuracy
+      value: 0.964256663
   - task:
       name: POS
       type: token-classification
     metrics:
     - name: POS (UPOS) Accuracy
       type: accuracy
+      value: 0.9640652663
   - task:
       name: MORPH
       type: token-classification
     metrics:
     - name: Morph (UFeats) Accuracy
       type: accuracy
+      value: 0.9316681022
   - task:
       name: LEMMA
       type: token-classification
     metrics:
     - name: Lemma Accuracy
       type: accuracy
+      value: 0.9736867285
   - task:
       name: UNLABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Unlabeled Attachment Score (UAS)
       type: f_score
+      value: 0.8163795538
   - task:
       name: LABELED_DEPENDENCIES
       type: token-classification
     metrics:
     - name: Labeled Attachment Score (LAS)
       type: f_score
+      value: 0.7454391415
   - task:
       name: SENTS
       type: token-classification
     metrics:
     - name: Sentences F-Score
       type: f_score
+      value: 0.9776286353
 ---
 Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morphologizer, lemmatizer, parser, ner
 | Feature | Description |
 | --- | --- |
 | **Name** | `hu_core_news_lg` |
+| **Version** | `3.6.0` |
+| **spaCy** | `>=3.6.0,<3.7.0` |
 | **Default Pipeline** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Components** | `tok2vec`, `senter`, `tagger`, `morphologizer`, `lookup_lemmatizer`, `trainable_lemmatizer`, `parser`, `ner` |
 | **Vectors** | -1 keys, 200000 unique vectors (300 dimensions) |
+| **Sources** | [UD Hungarian Szeged](https://universaldependencies.org/treebanks/hu_szeged/index.html) (Richárd Farkas, Katalin Simkó, Zsolt Szántó, Viktor Varga, Veronika Vincze (MTA-SZTE Research Group on Artificial Intelligence))<br />[NYTK-NerKor Corpus](https://github.com/nytud/NYTK-NerKor) (Eszter Simon, Noémi Vadász (Department of Language Technology and Applied Linguistics))<br />[Szeged NER Corpus](https://rgai.inf.u-szeged.hu/node/130) (György Szarvas, Richárd Farkas, László Felföldi, András Kocsor, János Csirik (MTA-SZTE Research Group on Artificial Intelligence))<br />[Hungarian lg Floret vectors](https://huggingface.co/huspacy/hu_vectors_web_lg) (Szeged AI) |
 | **License** | `cc-by-sa-4.0` |
 | **Author** | [SzegedAI, MILAB](https://github.com/huspacy/huspacy) |
 | `TOKEN_P` | 99.86 |
 | `TOKEN_R` | 99.93 |
 | `TOKEN_F` | 99.89 |
+| `SENTS_P` | 98.20 |
+| `SENTS_R` | 97.33 |
+| `SENTS_F` | 97.76 |
+| `TAG_ACC` | 96.43 |
+| `POS_ACC` | 96.41 |
+| `MORPH_ACC` | 93.17 |
+| `MORPH_MICRO_P` | 96.48 |
+| `MORPH_MICRO_R` | 95.78 |
+| `MORPH_MICRO_F` | 96.13 |
+| `LEMMA_ACC` | 97.37 |
+| `DEP_UAS` | 81.64 |
+| `DEP_LAS` | 74.54 |
+| `ENTS_P` | 86.36 |
+| `ENTS_R` | 85.94 |
+| `ENTS_F` | 86.15 |

config.cfg CHANGED Viewed

@@ -1,8 +1,8 @@
 [paths]
-parser_model = "models/hu_core_news_lg-parser-3.5.2/model-best"
-ner_model = "models/hu_core_news_lg-ner-3.5.2/model-best"
-lemmatizer_lookups = "models/hu_core_news_lg-lookup-lemmatizer-3.5.2"
-tagger_model = "models/hu_core_news_lg-tagger-3.5.2/model-best"
 train = null
 dev = null
 vectors = null
@@ -32,6 +32,7 @@ source = ${paths.lemmatizer_lookups}
 [components.morphologizer]
 factory = "morphologizer"
 extend = false
 overwrite = true
 scorer = {"@scorers":"spacy.morphologizer_scorer.v1"}
@@ -118,6 +119,7 @@ upstream = "*"
 [components.tagger]
 factory = "tagger"
 neg_prefix = "!"
 overwrite = false
 scorer = {"@scorers":"spacy.tagger_scorer.v1"}

 [paths]
+parser_model = "models/hu_core_news_lg-parser-3.6.0/model-best"
+ner_model = "models/hu_core_news_lg-ner-3.6.0/model-best"
+lemmatizer_lookups = "models/hu_core_news_lg-lookup-lemmatizer-3.6.0"
+tagger_model = "models/hu_core_news_lg-tagger-3.6.0/model-best"
 train = null
 dev = null
 vectors = null
 [components.morphologizer]
 factory = "morphologizer"
 extend = false
+label_smoothing = 0.0
 overwrite = true
 scorer = {"@scorers":"spacy.morphologizer_scorer.v1"}
 [components.tagger]
 factory = "tagger"
+label_smoothing = 0.0
 neg_prefix = "!"
 overwrite = false
 scorer = {"@scorers":"spacy.tagger_scorer.v1"}

hu_core_news_lg-any-py3-none-any.whl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:770c036d6223475a79c96dff245a193f4c9df56c8951fd5c1d7c0be59032124b
-size 401397054

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f18cfe459ea0cbdccee0dcb624defd4cc23459940d4ef1803e6a24fb0f76d6d
+size 401395351

meta.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
   "lang":"hu",
   "name":"core_news_lg",
-  "version":"3.5.2",
   "description":"Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morphologizer, lemmatizer, parser, ner",
   "author":"SzegedAI, MILAB",
   "email":"gyorgy@orosz.link",
   "url":"https://github.com/huspacy/huspacy",
   "license":"cc-by-sa-4.0",
-  "spacy_version":">=3.5.0,<3.6.0",
-  "spacy_git_version":"Unknown",
   "vectors":{
     "width":300,
     "vectors":200000,
@@ -1268,85 +1268,90 @@
     "token_p":0.998565417,
     "token_r":0.9993300153,
     "token_f":0.9989475698,
-    "sents_p":0.9797752809,
-    "sents_r":0.9710467706,
-    "sents_f":0.9753914989,
-    "tag_acc":0.9631543688,
-    "pos_acc":0.9651641305,
-    "morph_acc":0.9281270935,
-    "morph_micro_p":0.9661729037,
-    "morph_micro_r":0.9586162441,
-    "morph_micro_f":0.9623797403,
     "morph_per_feat":{
       "Definite":{
-        "p":0.9589416058,
-        "r":0.9808679421,
-        "f":0.9697808535
       },
       "PronType":{
-        "p":0.9690778575,
-        "r":0.9685430464,
-        "f":0.9688103781
       },
       "Case":{
-        "p":0.9735523943,
-        "r":0.9600869393,
-        "f":0.9667727815
       },
       "Degree":{
-        "p":0.9171075838,
-        "r":0.8652246256,
-        "f":0.8904109589
       },
       "Number":{
-        "p":0.9839418526,
-        "r":0.9755320932,
-        "f":0.9797189262
       },
       "Mood":{
-        "p":0.9307359307,
-        "r":0.9534368071,
-        "f":0.9419496166
       },
       "Person":{
-        "p":0.9507389163,
-        "r":0.9523026316,
-        "f":0.9515201315
       },
       "Tense":{
-        "p":0.961038961,
-        "r":0.9812154696,
-        "f":0.9710224166
       },
       "VerbForm":{
-        "p":0.9555555556,
-        "r":0.9310344828,
-        "f":0.9431356621
       },
       "Voice":{
-        "p":0.96,
-        "r":0.981595092,
-        "f":0.970677452
       },
       "Number[psor]":{
-        "p":0.9733333333,
-        "r":0.9358974359,
-        "f":0.954248366
       },
       "Person[psor]":{
-        "p":0.9777777778,
-        "r":0.9415121255,
-        "f":0.9593023256
       },
       "NumType":{
-        "p":0.9331683168,
-        "r":0.9195121951,
-        "f":0.9262899263
       },
       "Reflex":{
         "p":1.0,
-        "r":0.75,
-        "f":0.8571428571
       },
       "Aspect":{
         "p":0.0,
@@ -1357,121 +1362,116 @@
         "p":0.0,
         "r":0.0,
         "f":0.0
-      },
-      "Poss":{
-        "p":1.0,
-        "r":1.0,
-        "f":1.0
       }
     },
-    "lemma_acc":0.9750263133,
-    "dep_uas":0.8058213942,
-    "dep_las":0.7387315968,
     "dep_las_per_type":{
       "det":{
-        "p":0.8639562158,
-        "r":0.8797770701,
-        "f":0.8717948718
       },
       "amod:att":{
-        "p":0.8263565891,
-        "r":0.8716271464,
-        "f":0.8483883804
       },
       "nsubj":{
-        "p":0.7944444444,
-        "r":0.6703125,
-        "f":0.7271186441
       },
       "advmod:mode":{
-        "p":0.5974025974,
-        "r":0.5637254902,
-        "f":0.580075662
       },
       "nmod:att":{
-        "p":0.8021390374,
-        "r":0.7627118644,
-        "f":0.7819287576
       },
       "obl":{
-        "p":0.7427055703,
-        "r":0.7560756076,
-        "f":0.7493309545
       },
       "obj":{
-        "p":0.8490153173,
-        "r":0.8719101124,
-        "f":0.8603104213
       },
       "root":{
-        "p":0.7617977528,
-        "r":0.7550111359,
-        "f":0.7583892617
       },
       "cc":{
-        "p":0.6495726496,
-        "r":0.64,
-        "f":0.6447507953
       },
       "conj":{
-        "p":0.4672489083,
-        "r":0.4458333333,
-        "f":0.4562899787
       },
       "advmod":{
-        "p":0.8333333333,
-        "r":0.8421052632,
-        "f":0.8376963351
       },
       "flat:name":{
-        "p":0.865470852,
-        "r":0.9018691589,
-        "f":0.8832951945
       },
       "appos":{
-        "p":0.5357142857,
-        "r":0.3191489362,
-        "f":0.4
       },
       "advcl":{
-        "p":0.2459016393,
-        "r":0.306122449,
-        "f":0.2727272727
       },
       "advmod:tlocy":{
-        "p":0.7323943662,
-        "r":0.6782608696,
-        "f":0.7042889391
       },
       "ccomp:obj":{
-        "p":0.2258064516,
-        "r":0.2121212121,
-        "f":0.21875
       },
       "mark":{
-        "p":0.8108108108,
-        "r":0.7594936709,
-        "f":0.7843137255
       },
       "compound:preverb":{
-        "p":0.9142857143,
-        "r":0.880733945,
-        "f":0.8971962617
       },
       "advmod:locy":{
-        "p":0.9230769231,
-        "r":0.375,
-        "f":0.5333333333
       },
       "cop":{
-        "p":0.7142857143,
-        "r":0.7317073171,
-        "f":0.7228915663
       },
       "nmod:obl":{
-        "p":0.25,
-        "r":0.075,
-        "f":0.1153846154
       },
       "advmod:to":{
         "p":0.0,
@@ -1479,54 +1479,54 @@
         "f":0.0
       },
       "obj:lvc":{
-        "p":0.3333333333,
-        "r":0.0833333333,
-        "f":0.1333333333
       },
       "ccomp:obl":{
-        "p":0.3111111111,
-        "r":0.4375,
-        "f":0.3636363636
       },
-      "iobj":{
-        "p":0.3846153846,
-        "r":0.3333333333,
-        "f":0.3571428571
       },
       "csubj":{
-        "p":0.4583333333,
-        "r":0.2972972973,
-        "f":0.3606557377
       },
       "parataxis":{
-        "p":0.2051282051,
-        "r":0.1095890411,
-        "f":0.1428571429
       },
       "dep":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
-      "case":{
-        "p":0.9090909091,
-        "r":0.9183673469,
-        "f":0.9137055838
-      },
-      "xcomp":{
-        "p":0.7948717949,
-        "r":0.8378378378,
-        "f":0.8157894737
-      },
-      "nummod":{
-        "p":0.5421686747,
-        "r":0.4838709677,
-        "f":0.5113636364
-      },
       "acl":{
-        "p":0.4561403509,
-        "r":0.3611111111,
-        "f":0.4031007752
       },
       "advmod:tto":{
         "p":0.6666666667,
@@ -1534,14 +1534,14 @@
         "f":0.3076923077
       },
       "nmod":{
-        "p":0.25,
         "r":0.0909090909,
-        "f":0.1333333333
       },
       "aux":{
-        "p":0.875,
-        "r":0.5833333333,
-        "f":0.7
       },
       "advmod:tfrom":{
         "p":0.0,
@@ -1554,9 +1554,9 @@
         "f":0.0
       },
       "compound":{
-        "p":0.9736842105,
-        "r":0.925,
-        "f":0.9487179487
       },
       "obl:lvc":{
         "p":0.0,
@@ -1584,9 +1584,9 @@
         "f":0.0
       },
       "advmod:que":{
-        "p":1.0,
-        "r":0.25,
-        "f":0.4
       },
       "ccomp:pred":{
         "p":0.0,
@@ -1594,32 +1594,32 @@
         "f":0.0
       }
     },
-    "ents_p":0.8625558534,
-    "ents_r":0.8484528833,
-    "ents_f":0.8554462466,
     "ents_per_type":{
       "ORG":{
-        "p":0.8912839738,
-        "r":0.8817802503,
-        "f":0.8865066418
       },
       "PER":{
-        "p":0.8894202032,
-        "r":0.8888888889,
-        "f":0.8891544667
       },
       "LOC":{
-        "p":0.8619173263,
         "r":0.8506944444,
-        "f":0.8562691131
       },
       "MISC":{
-        "p":0.7004608295,
-        "r":0.6468085106,
-        "f":0.6725663717
       }
     },
-    "speed":869.7495281146
   },
   "sources":[
     {
@@ -1634,12 +1634,6 @@
       "license":"CC BY-SA 4.0",
       "author":"Eszter Simon, No\u00e9mi Vad\u00e1sz (Department of Language Technology and Applied Linguistics)"
     },
-    {
-      "name":"hunNERwiki",
-      "url":"http://hlt.sztaki.hu/resources/hunnerwiki.html",
-      "license":"CC-BY-SA-3.0",
-      "author":"Eszter Simon, D\u00e1vid M\u00e1rk Nemeskey (HLT Group, Budapest University of Technology and Economics)"
-    },
     {
       "name":"Szeged NER Corpus",
       "url":"https://rgai.inf.u-szeged.hu/node/130",
@@ -1647,10 +1641,10 @@
       "author":"Gy\u00f6rgy Szarvas, Rich\u00e1rd Farkas, L\u00e1szl\u00f3 Felf\u00f6ldi, Andr\u00e1s Kocsor, J\u00e1nos Csirik (MTA-SZTE Research Group on Artificial Intelligence)"
     },
     {
-      "name":"Webcorpuswiki word2vec model",
-      "url":"https://github.com/oroszgy/hunlp-resources/releases/tag/webcorpuswiki_word2vec_v0.1",
       "license":"CC-BY-SA-4.0",
-      "author":"Gy\u00f6rgy Orosz"
     }
   ],
   "requirements":[

 {
   "lang":"hu",
   "name":"core_news_lg",
+  "version":"3.6.0",
   "description":"Core Hungarian model for HuSpaCy. Components: tok2vec, senter, tagger, morphologizer, lemmatizer, parser, ner",
   "author":"SzegedAI, MILAB",
   "email":"gyorgy@orosz.link",
   "url":"https://github.com/huspacy/huspacy",
   "license":"cc-by-sa-4.0",
+  "spacy_version":">=3.6.0,<3.7.0",
+  "spacy_git_version":"6fc153a26",
   "vectors":{
     "width":300,
     "vectors":200000,
     "token_p":0.998565417,
     "token_r":0.9993300153,
     "token_f":0.9989475698,
+    "sents_p":0.9820224719,
+    "sents_r":0.9732739421,
+    "sents_f":0.9776286353,
+    "tag_acc":0.964256663,
+    "pos_acc":0.9640652663,
+    "morph_acc":0.9316681022,
+    "morph_micro_p":0.9648484848,
+    "morph_micro_r":0.9577997422,
+    "morph_micro_f":0.9613111926,
     "morph_per_feat":{
       "Definite":{
+        "p":0.9579908676,
+        "r":0.9790013999,
+        "f":0.9683821832
       },
       "PronType":{
+        "p":0.9712707182,
+        "r":0.9701986755,
+        "f":0.9707344009
       },
       "Case":{
+        "p":0.9725835501,
+        "r":0.9602845287,
+        "f":0.9663949095
       },
       "Degree":{
+        "p":0.9126637555,
+        "r":0.8693843594,
+        "f":0.8904985087
       },
       "Number":{
+        "p":0.9851351351,
+        "r":0.9773755656,
+        "f":0.9812400101
       },
       "Mood":{
+        "p":0.9326818675,
+        "r":0.9523281596,
+        "f":0.942402633
       },
       "Person":{
+        "p":0.9488026424,
+        "r":0.9449013158,
+        "f":0.9468479604
       },
       "Tense":{
+        "p":0.9543973941,
+        "r":0.9712707182,
+        "f":0.9627601314
       },
       "VerbForm":{
+        "p":0.950166113,
+        "r":0.9174017642,
+        "f":0.933496532
       },
       "Voice":{
+        "p":0.9508525577,
+        "r":0.9693251534,
+        "f":0.96
       },
       "Number[psor]":{
+        "p":0.9708029197,
+        "r":0.9472934473,
+        "f":0.9589041096
       },
       "Person[psor]":{
+        "p":0.9722627737,
+        "r":0.9500713267,
+        "f":0.961038961
       },
       "NumType":{
+        "p":0.9305210918,
+        "r":0.9146341463,
+        "f":0.9225092251
+      },
+      "Poss":{
+        "p":0.75,
+        "r":1.0,
+        "f":0.8571428571
       },
       "Reflex":{
         "p":1.0,
+        "r":0.875,
+        "f":0.9333333333
       },
       "Aspect":{
         "p":0.0,
         "p":0.0,
         "r":0.0,
         "f":0.0
       }
     },
+    "lemma_acc":0.9736867285,
+    "dep_uas":0.8163795538,
+    "dep_las":0.7454391415,
     "dep_las_per_type":{
       "det":{
+        "p":0.8554125662,
+        "r":0.8996815287,
+        "f":0.8769887466
       },
       "amod:att":{
+        "p":0.8253968254,
+        "r":0.8503679477,
+        "f":0.8376963351
       },
       "nsubj":{
+        "p":0.7557755776,
+        "r":0.715625,
+        "f":0.735152488
       },
       "advmod:mode":{
+        "p":0.6124031008,
+        "r":0.5808823529,
+        "f":0.5962264151
       },
       "nmod:att":{
+        "p":0.8036697248,
+        "r":0.7423728814,
+        "f":0.7718061674
       },
       "obl":{
+        "p":0.7622005324,
+        "r":0.7731773177,
+        "f":0.7676496872
       },
       "obj":{
+        "p":0.842920354,
+        "r":0.8561797753,
+        "f":0.8494983278
       },
       "root":{
+        "p":0.806741573,
+        "r":0.7995545657,
+        "f":0.8031319911
       },
       "cc":{
+        "p":0.6993318486,
+        "r":0.6610526316,
+        "f":0.6796536797
       },
       "conj":{
+        "p":0.5103448276,
+        "r":0.4625,
+        "f":0.4852459016
       },
       "advmod":{
+        "p":0.7572815534,
+        "r":0.8210526316,
+        "f":0.7878787879
       },
       "flat:name":{
+        "p":0.7791164659,
+        "r":0.9065420561,
+        "f":0.838012959
       },
       "appos":{
+        "p":0.4426229508,
+        "r":0.2872340426,
+        "f":0.3483870968
       },
       "advcl":{
+        "p":0.3186813187,
+        "r":0.2959183673,
+        "f":0.3068783069
       },
       "advmod:tlocy":{
+        "p":0.7327586207,
+        "r":0.7391304348,
+        "f":0.7359307359
       },
       "ccomp:obj":{
+        "p":0.2105263158,
+        "r":0.3636363636,
+        "f":0.2666666667
       },
       "mark":{
+        "p":0.7701863354,
+        "r":0.7848101266,
+        "f":0.7774294671
       },
       "compound:preverb":{
+        "p":0.9026548673,
+        "r":0.9357798165,
+        "f":0.9189189189
       },
       "advmod:locy":{
+        "p":0.652173913,
+        "r":0.46875,
+        "f":0.5454545455
       },
       "cop":{
+        "p":0.6666666667,
+        "r":0.6829268293,
+        "f":0.6746987952
       },
       "nmod:obl":{
+        "p":0.2962962963,
+        "r":0.2,
+        "f":0.2388059701
       },
       "advmod:to":{
         "p":0.0,
         "f":0.0
       },
       "obj:lvc":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "ccomp:obl":{
+        "p":0.3684210526,
+        "r":0.21875,
+        "f":0.2745098039
       },
+      "case":{
+        "p":0.9468085106,
+        "r":0.9081632653,
+        "f":0.9270833333
       },
       "csubj":{
+        "p":0.4375,
+        "r":0.1891891892,
+        "f":0.2641509434
       },
       "parataxis":{
+        "p":0.1612903226,
+        "r":0.0684931507,
+        "f":0.0961538462
+      },
+      "xcomp":{
+        "p":0.8472222222,
+        "r":0.8243243243,
+        "f":0.8356164384
+      },
+      "nummod":{
+        "p":0.6111111111,
+        "r":0.4731182796,
+        "f":0.5333333333
       },
       "dep":{
         "p":0.0,
         "r":0.0,
         "f":0.0
       },
       "acl":{
+        "p":0.3043478261,
+        "r":0.2916666667,
+        "f":0.2978723404
+      },
+      "iobj":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "advmod:tto":{
         "p":0.6666666667,
         "f":0.3076923077
       },
       "nmod":{
+        "p":0.1666666667,
         "r":0.0909090909,
+        "f":0.1176470588
       },
       "aux":{
+        "p":1.0,
+        "r":0.6666666667,
+        "f":0.8
       },
       "advmod:tfrom":{
         "p":0.0,
         "f":0.0
       },
       "compound":{
+        "p":0.8666666667,
+        "r":0.975,
+        "f":0.9176470588
       },
       "obl:lvc":{
         "p":0.0,
         "f":0.0
       },
       "advmod:que":{
+        "p":0.0,
+        "r":0.0,
+        "f":0.0
       },
       "ccomp:pred":{
         "p":0.0,
         "f":0.0
       }
     },
+    "ents_p":0.8636042403,
+    "ents_r":0.8593530239,
+    "ents_f":0.8614733874,
     "ents_per_type":{
       "ORG":{
+        "p":0.8953974895,
+        "r":0.892906815,
+        "f":0.8941504178
       },
       "PER":{
+        "p":0.8699830413,
+        "r":0.9193548387,
+        "f":0.8939878013
       },
       "LOC":{
+        "p":0.8781362007,
         "r":0.8506944444,
+        "f":0.8641975309
       },
       "MISC":{
+        "p":0.7099358974,
+        "r":0.6283687943,
+        "f":0.6666666667
       }
     },
+    "speed":901.0325291331
   },
   "sources":[
     {
       "license":"CC BY-SA 4.0",
       "author":"Eszter Simon, No\u00e9mi Vad\u00e1sz (Department of Language Technology and Applied Linguistics)"
     },
     {
       "name":"Szeged NER Corpus",
       "url":"https://rgai.inf.u-szeged.hu/node/130",
       "author":"Gy\u00f6rgy Szarvas, Rich\u00e1rd Farkas, L\u00e1szl\u00f3 Felf\u00f6ldi, Andr\u00e1s Kocsor, J\u00e1nos Csirik (MTA-SZTE Research Group on Artificial Intelligence)"
     },
     {
+      "name":"Hungarian lg Floret vectors",
+      "url":"https://huggingface.co/huspacy/hu_vectors_web_lg",
       "license":"CC-BY-SA-4.0",
+      "author":"Szeged AI"
     }
   ],
   "requirements":[

morphologizer/cfg CHANGED Viewed

@@ -1,5 +1,6 @@
 {
   "extend":false,
   "labels_morph":{
     "Definite=Def|POS=DET|PronType=Art":"Definite=Def|PronType=Art",
     "Case=Ine|Number=Sing|POS=NOUN":"Case=Ine|Number=Sing",

 {
   "extend":false,
+  "label_smoothing":0.0,
   "labels_morph":{
     "Definite=Def|POS=DET|PronType=Art":"Definite=Def|PronType=Art",
     "Case=Ine|Number=Sing|POS=NOUN":"Case=Ine|Number=Sing",

morphologizer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:81dd0c7d95f61db5a02b45252a60262bd43f82cfddf57926cc4f51fc711e2e87
 size 1379030

 version https://git-lfs.github.com/spec/v1
+oid sha256:19646b3038a0758c374f45ec4672ed54cdc468fbeacbad4d3b9075092a5c8529
 size 1379030

ner/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:67053f5ddd197bbe6da50d1c3d6dc7f16fbea7972fb9ce2c6cc098d583f085a4
 size 56989063

 version https://git-lfs.github.com/spec/v1
+oid sha256:0a2ea09876719885709fb906c812cbfcc4ed4549056b415d6ab627f3811dbaa1
 size 56989063

parser/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5069eb5a7525340710678346a2d99a2d85995cccba9421cb37ad6799241f697d
 size 26010735

 version https://git-lfs.github.com/spec/v1
+oid sha256:3c9faebc55d312e2e1b98b2b118e47145563123f788c619cf3c6301c7ddd31e0
 size 26010735

senter/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bf184bac777da8b0bcbe134f241efe0c178723d4bcf170dc914e82fda3029e5f
 size 2845

 version https://git-lfs.github.com/spec/v1
+oid sha256:f028f27d316a6a9d513f27769200316f1d691a112a4b16253592dbd10789158d
 size 2845

tagger/cfg CHANGED Viewed

@@ -1,4 +1,5 @@
 {
   "labels":[
     "ADJ",
     "ADP",

 {
+  "label_smoothing":0.0,
   "labels":[
     "ADJ",
     "ADP",

tagger/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e7ba90d7dd109b57031df893dc0c918ddb54fb9594a3c7f67fa60d0170c18bf6
 size 20905

 version https://git-lfs.github.com/spec/v1
+oid sha256:5343a2575e4e3f902f4753fd6a6b8bc61258b2d83f47d57baba684f1b71084e3
 size 20905

tok2vec/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1a8d6df82fe78e90f71b04506b779522c126239fc1c3c96870cb8d9741575ad2
 size 56806299

 version https://git-lfs.github.com/spec/v1
+oid sha256:55093574bbfc26486020ca0de33e8e1e92f6f58ea68e58b086d20eb79fa55ac5
 size 56806299

trainable_lemmatizer/model CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2437c4135a099927993ed593d33d38563cc3ca389b42c6c1e8278945b61ea3c3
 size 61643136

 version https://git-lfs.github.com/spec/v1
+oid sha256:9b88a18f7e6e0950d64532696fbeb0da25566cc4a4c2a6370bd333b26980377d
 size 61643136

vocab/strings.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:c40d7446c11ac590183dda3c5e311b20ef1c4b76f691884a30db78453b3789db
-size 6402547

 version https://git-lfs.github.com/spec/v1
+oid sha256:578a7114ebd95230499087da9ca620a5ddfb83a4d47155461531e1871435a3a6
+size 6402680

vocab/vectors.cfg CHANGED Viewed

@@ -5,5 +5,6 @@
   "hash_count":2,
   "hash_seed":2166136261,
   "bow":"<",
-  "eow":">"
 }

   "hash_count":2,
   "hash_seed":2166136261,
   "bow":"<",
+  "eow":">",
+  "attr":65
 }