Problem with lemmatization

#1
by parmenides2 - opened

Dear creators of the SpaCy tagger for Ukrainian! Laurence Anthony integrated your model into TagAnt. I've tried to use it for lemmatization and that's what I found: this SpaCy tagger couldn't lemmatize Ukrainian words, but only do it with Russian words.

Check this little text

Text in Ukrainian (without lemmatization):

Не зважаючи на усі негаразди, проблеми, домашні клопоти, а у нас їх чимало(Чим заплатити за оренду кімнати- авансу ще ж немає? Чим заплатити комуналку - зарплати ще не було? Як допомогти мамі оплатити квартплату, бо мама- пенсіонерка і не може працювати, так як доглядає своїх стареньких батьків? Як жити і не нервуватись, якщо у тебе хронічне захворювання і по закону

Text in Ukrainian (with lemmatization; succesfully lemmatized words in scary quotes):

не зважаючи на усі негаразди , проблеми , домашні клопоти , а у "мы" їх чимало(чим заплатити за оренду кімнати- авансу ще ж немає ? чим заплатити комуналку - зарплати ще не було ? як допомогти мамі оплатити "квартплата" , бо мама- пенсіонерка і не може працювати , так як доглядає своїх "старенький" батьків ? як жити і не нервуватись , якщо у тебе хронічне захворювання і по закону

Is there a way to fix the lemmatization for this SpaCy Tagger for Ukrainian?

Thank you very much in advance! Слава Україні!

Sign up or log in to comment