fragata's picture
Update README.md
f0ad425
|
raw
history blame
967 Bytes
metadata
language:
  - hu
tags:
  - OCR cleaning
license: apache-2.0
widget:
  - text: 'trans: Bálvándy szokott kedves modoraval mulattata Dorothea ;rófnőt.'

mT5 OCR cleaning model

For further models, scripts and details, see or our demo site.

  • Pretrained model used: mT5-base
  • Prefix: "trans: "

Limitations

  • max_source_length = 256
  • max_target_length = 256

Citation

If you use this model, please cite the following paper:


@inproceedings {laki-ocr,
    title = {OCR hibák javítása neurális technológiák segítségével},
    booktitle = {XVIII. Magyar Számítógépes Nyelvészeti Konferencia},
    year = {2022},
    publisher = {Szegedi Tudományegyetem, Informatikai Intézet},
    address = {Szeged, Magyarország},
    author = {Laki, László and and Kőrös, Ádám and Ligeti-Nagy, Noémi and and Nyéki, Bence and Vadász, Noémi and Yang, Zijian Győző and Váradi Tamás},
    pages = {417--430}
}