README.md · priyank-m/m_OCR at 89d9aa43eea8448e1f7ece7b05f0e57882f9674f

metadata

language:
  - en
  - zh
tags:
  - Image-to-Text
  - OCR
  - Image-Captioning
datasets:
  - priyank-m/text_recognition_en_zh_clean
metrics:
  - cer

Multilingual OCR (mOCR) is a VisionEncoderDecoder model based on the concept of TrOCR for English and Chinese document text-recognition. It uses a pre-trained Vision encoder and a pre-trained Language model as decoder.

Encoder model used: facebook/vit-mae-large

Decoder model used: xlm-roberta-base