Spaces:
Runtime error
Runtime error
makcrx
commited on
Commit
·
fd53dcf
1
Parent(s):
9647155
update db
Browse files- extract_keywords.py +5 -1
extract_keywords.py
CHANGED
@@ -30,7 +30,8 @@ aliases = [
|
|
30 |
('unisender', ['юнисендер']),
|
31 |
('яндекс аудитории', ['экспорт аудитории', 'экспорт яндекс аудитории']),
|
32 |
('экспорт facebook', ['экспорт сегментов facebook', 'экспорт fb', 'экспорт фейсбук', 'экспорт аудиторий фб', 'fb экспорт']),
|
33 |
-
('экспорт вк', ['экспорт сегментов vkontakte', 'экспорт vk', 'экспорт контакте'])
|
|
|
34 |
]
|
35 |
|
36 |
vocab_raw = flatten([[k] + keywords for k, keywords in aliases])
|
@@ -42,6 +43,9 @@ morph = None
|
|
42 |
def normalize_word(word):
|
43 |
if word == 'лид':
|
44 |
return word
|
|
|
|
|
|
|
45 |
global morph
|
46 |
if morph is None:
|
47 |
morph = pymorphy3.MorphAnalyzer()
|
|
|
30 |
('unisender', ['юнисендер']),
|
31 |
('яндекс аудитории', ['экспорт аудитории', 'экспорт яндекс аудитории']),
|
32 |
('экспорт facebook', ['экспорт сегментов facebook', 'экспорт fb', 'экспорт фейсбук', 'экспорт аудиторий фб', 'fb экспорт']),
|
33 |
+
('экспорт вк', ['экспорт сегментов vkontakte', 'экспорт vk', 'экспорт контакте']),
|
34 |
+
('retailcrm', ['срм', 'ритейл', 'ритейл срм', 'ритейлсрм', 'retail crm', 'ритейлцрм', 'ритейл црм']),
|
35 |
]
|
36 |
|
37 |
vocab_raw = flatten([[k] + keywords for k, keywords in aliases])
|
|
|
43 |
def normalize_word(word):
|
44 |
if word == 'лид':
|
45 |
return word
|
46 |
+
if word in ['росии', 'росси']:
|
47 |
+
return 'россия'
|
48 |
+
|
49 |
global morph
|
50 |
if morph is None:
|
51 |
morph = pymorphy3.MorphAnalyzer()
|