lenu_HU / README.md
aarimond's picture
Update README.md
a8a3b5c verified
metadata
widget:
  - text: NL-Consult Tanácsadó Korlátolt Felelősségű Társaság
  - text: D-Tag Analytics Zártkörűen Működő Részvénytársaság
  - text: Felis Magántőkealap
  - text: MMV Magyar Magánvasút Zártkörűen Működő Részvénytársaság
  - text: MEDIKER Bt
  - text: Keller Tibor Bizalmi Vagyonkezelő által kezelt vagyon
  - text: Kreatív Bázis Alapítvány
  - text: '"METEOR" Természetbarátok Turista Egyesülete'
  - text: DR. VINCZE GERGELY ÜGYVÉDI IRODA
  - text: Vonyarcvashegy Nagyközség Önkormányzata
  - text: Gryffindor Trust
  - text: PannErgy Nyilvánosan Működő Részvénytársaság
  - text: Bizalmi vagyonkezeléssel kezelt vagyon Wessely Vilmos
  - text: Taurus Országos Önkéntes Kölcsönös Nyugdíjpénztár
  - text: Dunamelléki Református Egyházkerület Ráday Gyűjteménye
  - text: Nyugdíj-kiegészítés Közérdekű Nyugdíjas Szövetkezet
  - text: ALTEO Munkavállalói Résztulajdonosi Program Szervezete
  - text: Széchenyi úti 92 lakásos OTP Társasház
  - text: Honvédelmi Minisztérium
  - text: >-
      Eventus Üzleti, Művészeti Szakgimnázium, Technikum, Gimnázium, Szakképző
      Iskola, Alapfokú Művészeti Iskola és Kollégium
  - text: VDSZ Gyógyszergyári Szakszervezete
  - text: Magyar Agrár-, Élelmiszergazdasági és Vidékfejlesztési Kamara
  - text: Budapest Országos Kötelező Magánnyugdíjpénztár
  - text: Dr. Orell Zsolt Végrehajtói Irodája
  - text: CEU Ingatlankezelő SE Zártkörűen Működő Európai Részvénytársaság
  - text: MIX Erdőbirtokossági Társulat
  - text: KARO" Ingatlanhasznosító és Üzemeltető Közkereseti Társaság
  - text: >-
      GEA Food Solutions International B.V. Convenience Food Systems
      International Magyarország Fióktelep
model-index:
  - name: Sociovestix/lenu_HU
    results:
      - task:
          type: text-classification
          name: Text Classification
        dataset:
          name: lenu
          type: Sociovestix/lenu
          config: HU
          split: test
          revision: f4d57b8d77a49ec5c62d899c9a213d23cd9f9428
        metrics:
          - type: f1
            value: 0.9239952248308795
            name: f1
          - type: f1
            value: 0.6535313553034507
            name: f1 macro
            args:
              average: macro

LENU - Legal Entity Name Understanding for Hungary

A Bert (multilingual uncased) model fine-tuned on hungarian legal entity names (jurisdiction HU) from the Global Legal Entity Identifier (LEI) System with the goal to detect Entity Legal Form (ELF) Codes.



in collaboration with



Model Description

The model has been created as part of a collaboration of the Global Legal Entity Identifier Foundation (GLEIF) and Sociovestix Labs with the goal to explore how Machine Learning can support in detecting the ELF Code solely based on an entity's legal name and legal jurisdiction. See also the open source python library lenu, which supports in this task.

The model has been trained on the dataset lenu, with a focus on hungarian legal entities and ELF Codes within the Jurisdiction "HU".

  • Developed by: GLEIF and Sociovestix Labs
  • License: Creative Commons (CC0) license
  • Finetuned from model [optional]: bert-base-multilingual-uncased
  • Resources for more information: Press Release

Uses

An entity's legal form is a crucial component when verifying and screening organizational identity. The wide variety of entity legal forms that exist within and between jurisdictions, however, has made it difficult for large organizations to capture legal form as structured data. The Jurisdiction specific models of lenu, trained on entities from GLEIF’s Legal Entity Identifier (LEI) database of over two million records, will allow banks, investment firms, corporations, governments, and other large organizations to retrospectively analyze their master data, extract the legal form from the unstructured text of the legal name and uniformly apply an ELF code to each entity type, according to the ISO 20275 standard.

Licensing Information

This model, which is trained on LEI data, is available under Creative Commons (CC0) license. See gleif.org/en/about/open-data.

Recommendations

Users should always consider the score of the suggested ELF Codes. For low score values it may be necessary to manually review the affected entities.