Spaces:
Sleeping
Sleeping
VladGeekPro commited on
Commit ·
9fee5c7
1
Parent(s): 9fa4ecb
LessDataTest
Browse files- app.py +62 -62
- extractors/user_extractor.py +0 -1
app.py
CHANGED
|
@@ -74,68 +74,68 @@ TEST_PHRASES = [
|
|
| 74 |
"Сегодня оплатил в телемаркет Крикова 655,80 лей",
|
| 75 |
"Вчера был в такуме на 425,7 лей",
|
| 76 |
"Сегодня купил в tagaer на 285,40 лей",
|
| 77 |
-
"Вчера оплатил в Supraten 1200,50 лень",
|
| 78 |
-
"Сегодня был в стоматологии о фамилии на 455,90 лень",
|
| 79 |
-
"Я на следующей неделе заказал в стартур билеты на 855,60 лень",
|
| 80 |
-
"Сегодня опл
|
| 81 |
-
"Вчера купил в Samurai на 325,40 лей",
|
| 82 |
-
"Сегодня был в Salomer на 185,50 lei",
|
| 83 |
-
"Вчера купил vragob na 655,80 lei",
|
| 84 |
-
"Сегодня купил в primul discounter на 425,03 лей",
|
| 85 |
-
"Вчера оплатил Premier Energy 985,90 lei",
|
| 86 |
-
"Сегодня заказали в пицце 9 на 285,60 лей",
|
| 87 |
-
"На прошлой неделе ходили в piața centrală, купили на 455,7 lei",
|
| 88 |
-
"Сегодня купил в peon farm на 325,40 лей",
|
| 89 |
-
"Вчера Wallach купила в Peach Girl на 755,50 лей",
|
| 90 |
-
"Через 2 дня купил в Pandashop на 895,80 лей",
|
| 91 |
-
"Pazavchora był vivația i kupil na 185,30 lei",
|
| 92 |
-
"Сегодня оплатил в oldcom 655,90 лей",
|
| 93 |
-
"Вчера купил рыбу в Ocean Fish на 280 lei",
|
| 94 |
-
"Сегодня купил в номер 1 на 420 лей",
|
| 95 |
-
"вчера воля купила в nanu market на 250 lei",
|
| 96 |
-
"Сегодня купил в Mozza на 380 lei",
|
| 97 |
-
"Вчера оплатил moldpressa 90 lei",
|
| 98 |
-
"Сегодня заплатил в Moldova-Presa 180 lei",
|
| 99 |
-
"Вчера платил MoldovaGaz 1250 lei",
|
| 100 |
-
"Сегодня был в modus vivendi, я ставил 420 lei",
|
| 101 |
-
"Вчера купил в Micov na 150 lei",
|
| 102 |
-
"Сегодня оплатил в метрах 890,13 лей",
|
| 103 |
-
"Вчера купил в Мерси на 210 lei",
|
| 104 |
-
"Сегодня заплатил в Megapolis 680 lei",
|
| 105 |
-
"Вчера Оля купила лекарство в Medical Market на 340 лей",
|
| 106 |
-
"Сегодня оплатил в максимум 450 lei",
|
| 107 |
-
"Вчера купил десерт в maestro delice на 120 lei",
|
| 108 |
-
"Сегодня оплатил в maestro 750 lei",
|
| 109 |
-
"вчера оля купила в local на 190 лей",
|
| 110 |
-
"Сегодня был в Linelo 115 и купил на 280 лей",
|
| 111 |
-
"Вчера купил продукты в Linel на 420,55 лей",
|
| 112 |
-
"Сегодня оплатил vats 320 lei",
|
| 113 |
-
"Вчера Олечка была в Kiss Beauty Salon на 450 lei",
|
| 114 |
-
"Сегодня купил кебаб в кебаб на 150 лей",
|
| 115 |
-
"Вчера Оля была в Кауфленд и потратила 890,15 лей",
|
| 116 |
-
"Сегодня купил в cat shop на 650 lei",
|
| 117 |
-
"Вчера вечером был выкатан суши на 300 восьятлей",
|
| 118 |
-
"Оля вчера заказала в Joom на 1200 lei",
|
| 119 |
-
"Сегодня купили рассаду в Ярди Маркет на 280 лей",
|
| 120 |
-
"Вчера Влад оплатил в uiti credit 950 lei",
|
| 121 |
-
"Сегодня оплатил в U.T. Credit очередной платеж 1800 лей",
|
| 122 |
-
"Вчера заказал в iherb витамина на 420 лей",
|
| 123 |
-
"На прошлой неделе покупали в Ярмареку на 950,13 лей",
|
| 124 |
-
"Оля вчера была в Хипократис и оставила 650 lei",
|
| 125 |
-
"Сегодня я купил витамины в herb на 180 лей",
|
| 126 |
-
"Вчера купил хлеб в Граньер на 70 лей",
|
| 127 |
-
"Сегодня ходил в Global Store за техникой на 2100 лей",
|
| 128 |
-
"Вчера я оплатил интернет в Giganet 450,35 лей",
|
| 129 |
-
"Сегодня Оля купила хлеб Франзелуца на 80 петлей",
|
| 130 |
-
"вчера купил рыбу в эфилете на 420 лей",
|
| 131 |
-
"На прошлой неделе заплатил в Fidesco 1300 lei",
|
| 132 |
-
"Сегодня Влад был в Феличи и купил сыр на 95 лей",
|
| 133 |
-
"Вчера вечером купили fast food на 180 lei",
|
| 134 |
-
"Олечка вчера купила лекарство фармачия Familia на 240 лей",
|
| 135 |
-
"Я сегодня утром оплатил Eurotelicom 310 lei",
|
| 136 |
-
"Вчера Владислав оплатил энергоком 560 lei",
|
| 137 |
-
"Сегодня оплатил в Елика 420 лей",
|
| 138 |
-
"На следующей неделе в субботу хочу зайти в дёйнер-кебаб",
|
| 139 |
]
|
| 140 |
|
| 141 |
|
|
|
|
| 74 |
"Сегодня оплатил в телемаркет Крикова 655,80 лей",
|
| 75 |
"Вчера был в такуме на 425,7 лей",
|
| 76 |
"Сегодня купил в tagaer на 285,40 лей",
|
| 77 |
+
# "Вчера оплатил в Supraten 1200,50 лень",
|
| 78 |
+
# "Сегодня был в стоматологии о фамилии на 455,90 лень",
|
| 79 |
+
# "Я на следующей неделе заказал в стартур билеты на 855,60 лень",
|
| 80 |
+
# "Сегодня опл��тил в Sankos 245,70 лей",
|
| 81 |
+
# "Вчера купил в Samurai на 325,40 лей",
|
| 82 |
+
# "Сегодня был в Salomer на 185,50 lei",
|
| 83 |
+
# "Вчера купил vragob na 655,80 lei",
|
| 84 |
+
# "Сегодня купил в primul discounter на 425,03 лей",
|
| 85 |
+
# "Вчера оплатил Premier Energy 985,90 lei",
|
| 86 |
+
# "Сегодня заказали в пицце 9 на 285,60 лей",
|
| 87 |
+
# "На прошлой неделе ходили в piața centrală, купили на 455,7 lei",
|
| 88 |
+
# "Сегодня купил в peon farm на 325,40 лей",
|
| 89 |
+
# "Вчера Wallach купила в Peach Girl на 755,50 лей",
|
| 90 |
+
# "Через 2 дня купил в Pandashop на 895,80 лей",
|
| 91 |
+
# "Pazavchora był vivația i kupil na 185,30 lei",
|
| 92 |
+
# "Сегодня оплатил в oldcom 655,90 лей",
|
| 93 |
+
# "Вчера купил рыбу в Ocean Fish на 280 lei",
|
| 94 |
+
# "Сегодня купил в номер 1 на 420 лей",
|
| 95 |
+
# "вчера воля купила в nanu market на 250 lei",
|
| 96 |
+
# "Сегодня купил в Mozza на 380 lei",
|
| 97 |
+
# "Вчера оплатил moldpressa 90 lei",
|
| 98 |
+
# "Сегодня заплатил в Moldova-Presa 180 lei",
|
| 99 |
+
# "Вчера платил MoldovaGaz 1250 lei",
|
| 100 |
+
# "Сегодня был в modus vivendi, я ставил 420 lei",
|
| 101 |
+
# "Вчера купил в Micov na 150 lei",
|
| 102 |
+
# "Сегодня оплатил в метрах 890,13 лей",
|
| 103 |
+
# "Вчера купил в Мерси на 210 lei",
|
| 104 |
+
# "Сегодня заплатил в Megapolis 680 lei",
|
| 105 |
+
# "Вчера Оля купила лекарство в Medical Market на 340 лей",
|
| 106 |
+
# "Сегодня оплатил в максимум 450 lei",
|
| 107 |
+
# "Вчера купил десерт в maestro delice на 120 lei",
|
| 108 |
+
# "Сегодня оплатил в maestro 750 lei",
|
| 109 |
+
# "вчера оля купила в local на 190 лей",
|
| 110 |
+
# "Сегодня был в Linelo 115 и купил на 280 лей",
|
| 111 |
+
# "Вчера купил продукты в Linel на 420,55 лей",
|
| 112 |
+
# "Сегодня оплатил vats 320 lei",
|
| 113 |
+
# "Вчера Олечка была в Kiss Beauty Salon на 450 lei",
|
| 114 |
+
# "Сегодня купил кебаб в кебаб на 150 лей",
|
| 115 |
+
# "Вчера Оля была в Кауфленд и потратила 890,15 лей",
|
| 116 |
+
# "Сегодня купил в cat shop на 650 lei",
|
| 117 |
+
# "Вчера вечером был выкатан суши на 300 восьятлей",
|
| 118 |
+
# "Оля вчера заказала в Joom на 1200 lei",
|
| 119 |
+
# "Сегодня купили рассаду в Ярди Маркет на 280 лей",
|
| 120 |
+
# "Вчера Влад оплатил в uiti credit 950 lei",
|
| 121 |
+
# "Сегодня оплатил в U.T. Credit очередной платеж 1800 лей",
|
| 122 |
+
# "Вчера заказал в iherb витамина на 420 лей",
|
| 123 |
+
# "На прошлой неделе покупали в Ярмареку на 950,13 лей",
|
| 124 |
+
# "Оля вчера была в Хипократис и оставила 650 lei",
|
| 125 |
+
# "Сегодня я купил витамины в herb на 180 лей",
|
| 126 |
+
# "Вчера купил хлеб в Граньер на 70 лей",
|
| 127 |
+
# "Сегодня ходил в Global Store за техникой на 2100 лей",
|
| 128 |
+
# "Вчера я оплатил интернет в Giganet 450,35 лей",
|
| 129 |
+
# "Сегодня Оля купила хлеб Франзелуца на 80 петлей",
|
| 130 |
+
# "вчера купил рыбу в эфилете на 420 лей",
|
| 131 |
+
# "На прошлой неделе заплатил в Fidesco 1300 lei",
|
| 132 |
+
# "Сегодня Влад был в Феличи и купил сыр на 95 лей",
|
| 133 |
+
# "Вчера вечером купили fast food на 180 lei",
|
| 134 |
+
# "Олечка вчера купила лекарство фармачия Familia на 240 лей",
|
| 135 |
+
# "Я сегодня утром оплатил Eurotelicom 310 lei",
|
| 136 |
+
# "Вчера Владислав оплатил энергоком 560 lei",
|
| 137 |
+
# "Сегодня оплатил в Елика 420 лей",
|
| 138 |
+
# "На следующей неделе в субботу хочу зайти в дёйнер-кебаб",
|
| 139 |
]
|
| 140 |
|
| 141 |
|
extractors/user_extractor.py
CHANGED
|
@@ -60,7 +60,6 @@ class ExpenseUserExtractor:
|
|
| 60 |
self.threshold = threshold
|
| 61 |
self.supplier_terms = {normalize_text(supplier) for supplier in suppliers}
|
| 62 |
self.user_terms = [normalize_text(user) for user in users]
|
| 63 |
-
self.user_lookup = dict(zip(self.user_terms, self.users))
|
| 64 |
self.user_embeddings = model.encode(
|
| 65 |
[f"passage: {user}" for user in self.user_terms],
|
| 66 |
convert_to_tensor=True,
|
|
|
|
| 60 |
self.threshold = threshold
|
| 61 |
self.supplier_terms = {normalize_text(supplier) for supplier in suppliers}
|
| 62 |
self.user_terms = [normalize_text(user) for user in users]
|
|
|
|
| 63 |
self.user_embeddings = model.encode(
|
| 64 |
[f"passage: {user}" for user in self.user_terms],
|
| 65 |
convert_to_tensor=True,
|