Приправник-157 — Модерн БЕРТ модел за обраду текста на српском језку-ћирилици, пре свега у области законодавства.

- Векторизује речи, или допуњава недостајуће речи у тексту
- Модерн БЕРТ, обучаван од нуле на ћириличним текстовима на српском језику са фокусом на специјални корпус од 500 милиона речи из контекста права, законодавства и културе и историје Србије
- Поред скупова наведених у метаподацима, модел је обучаван и на грађи Правно-информационог система Србије коју је за потребе обучавања приредило ЈП Службени Гласник.
Употреба
>>> from transformers import pipeline
>>> unmasker = pipeline('fill-mask', model='procesaur/pripravnik157')
>>> unmasker("Kada bi čovek znao gde će pasti on bi<mask>.")
>>>
Истраживање jе спроведено уз подршку Фода за иновациону делатност Републике Србије у оквиру програма GOVTECH, решење #53096, ДигиТекс
Рачунарске ресурсе за обучавање обезбедила је Национална платформа за вештачку интелигенцију Србије

- Downloads last month
- 1,178