|
from ukrainian_tts.formatter import preprocess_text |
|
import pytest |
|
|
|
|
|
@pytest.mark.parametrize( |
|
"text,expected", |
|
[ |
|
("Quality of life update", "кваліті оф ліфе юпдате"), |
|
("Він украв 20000000 $", "він украв двадцять мільйонів доларів"), |
|
("Він украв 20000000", "він украв двадцять мільйонів"), |
|
("Він украв 1 $", "він украв один долар"), |
|
("Він украв 2 $", "він украв два долари"), |
|
("Він украв 2 ₴", "він украв дві гривні"), |
|
( |
|
"111 000 000 000 доларів державного боргу.", |
|
"сто одинадцять мільярдів доларів державного боргу.", |
|
), |
|
( |
|
"11100000001 доларів державного боргу.", |
|
"одинадцять мільярдів сто мільйонів один доларів державного боргу.", |
|
), |
|
( |
|
"10000$, 15000 корупціонерів", |
|
"десять тисяч доларів, п'ятнадцять тисяч корупціонерів", |
|
), |
|
( |
|
"10000 $, 15000 корупціонерів", |
|
"десять тисяч доларів, п'ятнадцять тисяч корупціонерів", |
|
), |
|
( |
|
"$10000, 15000 корупціонерів", |
|
"десять тисяч доларів, п'ятнадцять тисяч корупціонерів", |
|
), |
|
( |
|
"10000$ у еквіваленті борщових заправок", |
|
"десять тисяч доларів у еквіваленті борщових заправок", |
|
), |
|
("10-30-40-50-5-9-5", "десять-тридцять-сорок-п'ятдесят-п'ять-дев'ять-п'ять"), |
|
], |
|
) |
|
def test_formatter(text, expected): |
|
assert preprocess_text(text) == expected |
|
|
|
|
|
|
|
|
|
|
|
|
|
@pytest.mark.parametrize( |
|
"text,expected", |
|
[ |
|
|
|
( |
|
"2 $, 15000 корупціонерів", |
|
"два доларів, п'ятнадцять тисяч корупціонерів", |
|
), |
|
|
|
|
|
|
|
("це 19-річне вино.", "це дев'ятнадцять-річне вино."), |
|
], |
|
) |
|
def test_planned_formatter_issues(text, expected): |
|
assert preprocess_text(text) == expected |
|
|