README.md · HeNLP/LongHeRo at d4ae5f6aa735f4067b007292177d24f72d5b2433

metadata

language:
  - he
pipeline_tag: fill-mask
datasets:
  - HeNLP/HeDC4

Hebrew Language Model for Long Documents

State-of-the-art Longformer language model for Hebrew.

How to use

from transformers import AutoModelForMaskedLM, AutoTokenizer

tokenizer = AutoTokenizer.from_pretrained('HeNLP/LongHeRo')
model = AutoModelForMaskedLM.from_pretrained('HeNLP/LongHeRo')

Citing

If you use LongHeRo in your research, please cite HeRo: RoBERTa and Longformer Hebrew Language Models.

@article{shalumov2023hero,
      title={HeRo: RoBERTa and Longformer Hebrew Language Models}, 
      author={Vitaly Shalumov and Harel Haskey},
      year={2023},
      journal={arXiv:2304.11077},
}