{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "from list_questions import load_questions\n", "from extract_keywords import extract_keywords, kw_model, vectorizer" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "questions = load_questions('omnidesk-ai-chatgpt-questions.sqlite')" ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Как долго рассматривается обращение на портале поддержки?\n", "Не работает модуль СДЭК\n", "Как деактивировать модуль?\n", "Что произойдет, если я не деактивирую модуль после окончания пробного периода?\n", "Как происходит оплата за использование модуля?\n", "Модуль заморожен. Как включить/возобновить работу модуля?\n", "Как вернуть оплату за использование модуля?\n", "Возврат оплаты за модуль\n", "Как активировать модуль?\n", "Какие методы API ключа нужно разрешить для работы с модулем?\n", "Фильтры в списке обращений\n", "добрый день / здравствуйте\n", "спасибо / до свидания\n", "некорректный ответ, не понял\n", "как убрать ошибку\n", "позови человека/сотрудника/менеджера/оператора\n" ] } ], "source": [ "for q in questions:\n", " keywords = extract_keywords(q['query'])\n", " if (len(keywords) == 0):\n", " print(q['question'])" ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "экспорт сегментов в вконтакте\n" ] }, { "data": { "text/plain": [ "[]" ] }, "execution_count": 5, "metadata": {}, "output_type": "execute_result" } ], "source": [ "extract_keywords('экспорт сегментов в вконтакте')" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "[]" ] }, "execution_count": 14, "metadata": {}, "output_type": "execute_result" } ], "source": [ "kw_model.extract_keywords('экспорт сегментов в вконтакте', vectorizer=vectorizer)" ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "['почта россия',\n", " 'почта',\n", " 'почта рф',\n", " 'пр',\n", " 'gh',\n", " 'почта россия трекинг',\n", " 'пр трекинг',\n", " 'почта трекинг',\n", " 'пр трэкинг',\n", " 'почта трэкинг',\n", " 'реестр почта',\n", " 'реестр пр',\n", " 'реестр почта россия',\n", " 'реестр пэк',\n", " 'реквизит',\n", " 'пешкарика',\n", " 'импорт лид директ',\n", " 'яндекс доставка экспресс',\n", " 'яндекс доставка express',\n", " 'яд экспресс',\n", " 'ядоставка экспресс',\n", " 'яндекс доставка ndd',\n", " 'яд ндд',\n", " 'я доставка ндд',\n", " 'ядоставка ндд',\n", " 'модуль ндд',\n", " 'яндекс метрика',\n", " 'яндекс метрика импорт',\n", " 'альфабанк',\n", " 'альфа банк',\n", " 'alfabank',\n", " 'альфа',\n", " 'импорт лид facebook',\n", " 'импорт лид fb',\n", " 'загрузка лид fb',\n", " 'лида фейсбук',\n", " 'импорт лид фб',\n", " 'fb lead',\n", " 'маркетинговый расход',\n", " 'расход',\n", " 'загрузка расход',\n", " 'cloudpayments',\n", " 'клауд',\n", " 'клаудпеймент',\n", " 'клаудпейментс',\n", " 'robokassa',\n", " 'робокасса',\n", " 'робокас',\n", " 'sipuni',\n", " 'сипуня',\n", " 'сипьюня',\n", " 'mailchimp',\n", " 'майлчимп',\n", " 'мейлчать',\n", " 'мейлчимп',\n", " 'unisender',\n", " 'юнисендер',\n", " 'яндекс аудитория',\n", " 'экспорт аудитория',\n", " 'экспорт яндекс аудитория',\n", " 'экспорт facebook',\n", " 'экспорт сегмент facebook',\n", " 'экспорт fb',\n", " 'экспорт фейсбук',\n", " 'экспорт аудитория фб',\n", " 'fb экспорт',\n", " 'экспорт вк',\n", " 'экспорт сегмент vkontakte',\n", " 'экспорт vk',\n", " 'экспорт контакт',\n", " 'экспорт сегмент вконтакте',\n", " 'retailcrm',\n", " 'срм',\n", " 'ритейл',\n", " 'ритейл срм',\n", " 'ритейлсрма',\n", " 'retail crm',\n", " 'ритейлцрма',\n", " 'ритейл црм',\n", " 'retailcrm services',\n", " 'retailcrmservices',\n", " 'ритейлцрма services',\n", " 'лк crm services',\n", " 'ритейлцрма сервисес',\n", " 'ритейлсрма сервисес',\n", " 'ритейлцрма сервис',\n", " 'ритейлцрмсервисес',\n", " 'ритейлсрмсервисес']" ] }, "execution_count": 15, "metadata": {}, "output_type": "execute_result" } ], "source": [ "vectorizer.vocabulary" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [] } ], "metadata": { "kernelspec": { "display_name": "base", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.10.9" }, "orig_nbformat": 4 }, "nbformat": 4, "nbformat_minor": 2 }