VladGeekPro commited on
Commit
9fee5c7
·
1 Parent(s): 9fa4ecb

LessDataTest

Browse files
Files changed (2) hide show
  1. app.py +62 -62
  2. extractors/user_extractor.py +0 -1
app.py CHANGED
@@ -74,68 +74,68 @@ TEST_PHRASES = [
74
  "Сегодня оплатил в телемаркет Крикова 655,80 лей",
75
  "Вчера был в такуме на 425,7 лей",
76
  "Сегодня купил в tagaer на 285,40 лей",
77
- "Вчера оплатил в Supraten 1200,50 лень",
78
- "Сегодня был в стоматологии о фамилии на 455,90 лень",
79
- "Я на следующей неделе заказал в стартур билеты на 855,60 лень",
80
- "Сегодня оплатил в Sankos 245,70 лей",
81
- "Вчера купил в Samurai на 325,40 лей",
82
- "Сегодня был в Salomer на 185,50 lei",
83
- "Вчера купил vragob na 655,80 lei",
84
- "Сегодня купил в primul discounter на 425,03 лей",
85
- "Вчера оплатил Premier Energy 985,90 lei",
86
- "Сегодня заказали в пицце 9 на 285,60 лей",
87
- "На прошлой неделе ходили в piața centrală, купили на 455,7 lei",
88
- "Сегодня купил в peon farm на 325,40 лей",
89
- "Вчера Wallach купила в Peach Girl на 755,50 лей",
90
- "Через 2 дня купил в Pandashop на 895,80 лей",
91
- "Pazavchora był vivația i kupil na 185,30 lei",
92
- "Сегодня оплатил в oldcom 655,90 лей",
93
- "Вчера купил рыбу в Ocean Fish на 280 lei",
94
- "Сегодня купил в номер 1 на 420 лей",
95
- "вчера воля купила в nanu market на 250 lei",
96
- "Сегодня купил в Mozza на 380 lei",
97
- "Вчера оплатил moldpressa 90 lei",
98
- "Сегодня заплатил в Moldova-Presa 180 lei",
99
- "Вчера платил MoldovaGaz 1250 lei",
100
- "Сегодня был в modus vivendi, я ставил 420 lei",
101
- "Вчера купил в Micov na 150 lei",
102
- "Сегодня оплатил в метрах 890,13 лей",
103
- "Вчера купил в Мерси на 210 lei",
104
- "Сегодня заплатил в Megapolis 680 lei",
105
- "Вчера Оля купила лекарство в Medical Market на 340 лей",
106
- "Сегодня оплатил в максимум 450 lei",
107
- "Вчера купил десерт в maestro delice на 120 lei",
108
- "Сегодня оплатил в maestro 750 lei",
109
- "вчера оля купила в local на 190 лей",
110
- "Сегодня был в Linelo 115 и купил на 280 лей",
111
- "Вчера купил продукты в Linel на 420,55 лей",
112
- "Сегодня оплатил vats 320 lei",
113
- "Вчера Олечка была в Kiss Beauty Salon на 450 lei",
114
- "Сегодня купил кебаб в кебаб на 150 лей",
115
- "Вчера Оля была в Кауфленд и потратила 890,15 лей",
116
- "Сегодня купил в cat shop на 650 lei",
117
- "Вчера вечером был выкатан суши на 300 восьятлей",
118
- "Оля вчера заказала в Joom на 1200 lei",
119
- "Сегодня купили рассаду в Ярди Маркет на 280 лей",
120
- "Вчера Влад оплатил в uiti credit 950 lei",
121
- "Сегодня оплатил в U.T. Credit очередной платеж 1800 лей",
122
- "Вчера заказал в iherb витамина на 420 лей",
123
- "На прошлой неделе покупали в Ярмареку на 950,13 лей",
124
- "Оля вчера была в Хипократис и оставила 650 lei",
125
- "Сегодня я купил витамины в herb на 180 лей",
126
- "Вчера купил хлеб в Граньер на 70 лей",
127
- "Сегодня ходил в Global Store за техникой на 2100 лей",
128
- "Вчера я оплатил интернет в Giganet 450,35 лей",
129
- "Сегодня Оля купила хлеб Франзелуца на 80 петлей",
130
- "вчера купил рыбу в эфилете на 420 лей",
131
- "На прошлой неделе заплатил в Fidesco 1300 lei",
132
- "Сегодня Влад был в Феличи и купил сыр на 95 лей",
133
- "Вчера вечером купили fast food на 180 lei",
134
- "Олечка вчера купила лекарство фармачия Familia на 240 лей",
135
- "Я сегодня утром оплатил Eurotelicom 310 lei",
136
- "Вчера Владислав оплатил энергоком 560 lei",
137
- "Сегодня оплатил в Елика 420 лей",
138
- "На следующей неделе в субботу хочу зайти в дёйнер-кебаб",
139
  ]
140
 
141
 
 
74
  "Сегодня оплатил в телемаркет Крикова 655,80 лей",
75
  "Вчера был в такуме на 425,7 лей",
76
  "Сегодня купил в tagaer на 285,40 лей",
77
+ # "Вчера оплатил в Supraten 1200,50 лень",
78
+ # "Сегодня был в стоматологии о фамилии на 455,90 лень",
79
+ # "Я на следующей неделе заказал в стартур билеты на 855,60 лень",
80
+ # "Сегодня опл��тил в Sankos 245,70 лей",
81
+ # "Вчера купил в Samurai на 325,40 лей",
82
+ # "Сегодня был в Salomer на 185,50 lei",
83
+ # "Вчера купил vragob na 655,80 lei",
84
+ # "Сегодня купил в primul discounter на 425,03 лей",
85
+ # "Вчера оплатил Premier Energy 985,90 lei",
86
+ # "Сегодня заказали в пицце 9 на 285,60 лей",
87
+ # "На прошлой неделе ходили в piața centrală, купили на 455,7 lei",
88
+ # "Сегодня купил в peon farm на 325,40 лей",
89
+ # "Вчера Wallach купила в Peach Girl на 755,50 лей",
90
+ # "Через 2 дня купил в Pandashop на 895,80 лей",
91
+ # "Pazavchora był vivația i kupil na 185,30 lei",
92
+ # "Сегодня оплатил в oldcom 655,90 лей",
93
+ # "Вчера купил рыбу в Ocean Fish на 280 lei",
94
+ # "Сегодня купил в номер 1 на 420 лей",
95
+ # "вчера воля купила в nanu market на 250 lei",
96
+ # "Сегодня купил в Mozza на 380 lei",
97
+ # "Вчера оплатил moldpressa 90 lei",
98
+ # "Сегодня заплатил в Moldova-Presa 180 lei",
99
+ # "Вчера платил MoldovaGaz 1250 lei",
100
+ # "Сегодня был в modus vivendi, я ставил 420 lei",
101
+ # "Вчера купил в Micov na 150 lei",
102
+ # "Сегодня оплатил в метрах 890,13 лей",
103
+ # "Вчера купил в Мерси на 210 lei",
104
+ # "Сегодня заплатил в Megapolis 680 lei",
105
+ # "Вчера Оля купила лекарство в Medical Market на 340 лей",
106
+ # "Сегодня оплатил в максимум 450 lei",
107
+ # "Вчера купил десерт в maestro delice на 120 lei",
108
+ # "Сегодня оплатил в maestro 750 lei",
109
+ # "вчера оля купила в local на 190 лей",
110
+ # "Сегодня был в Linelo 115 и купил на 280 лей",
111
+ # "Вчера купил продукты в Linel на 420,55 лей",
112
+ # "Сегодня оплатил vats 320 lei",
113
+ # "Вчера Олечка была в Kiss Beauty Salon на 450 lei",
114
+ # "Сегодня купил кебаб в кебаб на 150 лей",
115
+ # "Вчера Оля была в Кауфленд и потратила 890,15 лей",
116
+ # "Сегодня купил в cat shop на 650 lei",
117
+ # "Вчера вечером был выкатан суши на 300 восьятлей",
118
+ # "Оля вчера заказала в Joom на 1200 lei",
119
+ # "Сегодня купили рассаду в Ярди Маркет на 280 лей",
120
+ # "Вчера Влад оплатил в uiti credit 950 lei",
121
+ # "Сегодня оплатил в U.T. Credit очередной платеж 1800 лей",
122
+ # "Вчера заказал в iherb витамина на 420 лей",
123
+ # "На прошлой неделе покупали в Ярмареку на 950,13 лей",
124
+ # "Оля вчера была в Хипократис и оставила 650 lei",
125
+ # "Сегодня я купил витамины в herb на 180 лей",
126
+ # "Вчера купил хлеб в Граньер на 70 лей",
127
+ # "Сегодня ходил в Global Store за техникой на 2100 лей",
128
+ # "Вчера я оплатил интернет в Giganet 450,35 лей",
129
+ # "Сегодня Оля купила хлеб Франзелуца на 80 петлей",
130
+ # "вчера купил рыбу в эфилете на 420 лей",
131
+ # "На прошлой неделе заплатил в Fidesco 1300 lei",
132
+ # "Сегодня Влад был в Феличи и купил сыр на 95 лей",
133
+ # "Вчера вечером купили fast food на 180 lei",
134
+ # "Олечка вчера купила лекарство фармачия Familia на 240 лей",
135
+ # "Я сегодня утром оплатил Eurotelicom 310 lei",
136
+ # "Вчера Владислав оплатил энергоком 560 lei",
137
+ # "Сегодня оплатил в Елика 420 лей",
138
+ # "На следующей неделе в субботу хочу зайти в дёйнер-кебаб",
139
  ]
140
 
141
 
extractors/user_extractor.py CHANGED
@@ -60,7 +60,6 @@ class ExpenseUserExtractor:
60
  self.threshold = threshold
61
  self.supplier_terms = {normalize_text(supplier) for supplier in suppliers}
62
  self.user_terms = [normalize_text(user) for user in users]
63
- self.user_lookup = dict(zip(self.user_terms, self.users))
64
  self.user_embeddings = model.encode(
65
  [f"passage: {user}" for user in self.user_terms],
66
  convert_to_tensor=True,
 
60
  self.threshold = threshold
61
  self.supplier_terms = {normalize_text(supplier) for supplier in suppliers}
62
  self.user_terms = [normalize_text(user) for user in users]
 
63
  self.user_embeddings = model.encode(
64
  [f"passage: {user}" for user in self.user_terms],
65
  convert_to_tensor=True,