Bert_Ukr_in_Swiss / README.md
Alprocco's picture
Update README.md
3a41ce1
metadata
tags:
  - bertopic
library_name: bertopic
pipeline_tag: text-classification

Bert_Ukr_in_Swiss

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("Alprocco/Bert_Ukr_in_Swiss")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 267
  • Number of training documents: 550677
{-1: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 0: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Information Requests'}, 1: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 2: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Insurance'}, 3: {'cluster_id': 2, 'cluster_name': 'Pet', 'sub_cluster': 'Pet'}, 4: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Asylum'}, 5: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Ticket Inquiries'}, 6: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 7: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 8: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 9: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}, 10: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 11: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Translation Services'}, 12: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Passport'}, 13: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Dentistry'}, 14: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 15: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Currency'}, 16: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Banking'}, 17: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Protocols'}, 18: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Mail'}, 19: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 20: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Clothing'}, 21: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Financial Assistance'}, 22: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 23: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 24: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 25: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 26: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 27: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 28: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Leasing Regulation'}, 29: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 30: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Open Chat'}, 31: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 32: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 33: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 34: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Food'}, 35: {'cluster_id': 2, 'cluster_name': 'Pet', 'sub_cluster': 'Pet'}, 36: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 37: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Vehicle'}, 38: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 39: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 40: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 41: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 42: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Status Acquisition'}, 43: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Consulate Services'}, 44: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 45: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 46: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}, 47: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 48: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Vehicle'}, 49: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 50: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 51: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'War Chat'}, 52: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 53: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 54: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 55: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 56: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 57: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Asylum'}, 58: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 59: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 60: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Tax'}, 61: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Expense'}, 62: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 63: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 64: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 65: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 66: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 67: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 68: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 69: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Family Reunion'}, 70: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 71: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 72: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 73: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 74: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 75: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Vaccinations'}, 76: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Police'}, 77: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Financial Assistance'}, 78: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 79: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Carriers, Transport to and from Ukraine'}, 80: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 81: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 82: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 83: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Parking'}, 84: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 85: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 86: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 87: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Legal information'}, 88: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 89: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 90: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Insurance'}, 91: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 92: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 93: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 94: {'cluster_id': 12, 'cluster_name': 'Religious Information', 'sub_cluster': 'Religious Information'}, 95: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 96: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 97: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 98: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 99: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 100: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Banking'}, 101: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 102: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 103: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Library'}, 104: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Library'}, 105: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Tax'}, 106: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Police'}, 107: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 108: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 109: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 110: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Legal information'}, 111: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Passport'}, 112: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 113: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 114: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 115: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 116: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 117: {'cluster_id': 9, 'cluster_name': 'Education', 'sub_cluster': 'Education'}, 118: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 119: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 120: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 121: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 122: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Translation Services'}, 123: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Insurance'}, 124: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 125: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Legal information'}, 126: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 127: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 128: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 129: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Psychotherapy'}, 130: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 131: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 132: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 133: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 134: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 135: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Home Appliances'}, 136: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 137: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 138: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 139: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Tax'}, 140: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Vaccinations'}, 141: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 142: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 143: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 144: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 145: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 146: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 147: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 148: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Vehicle'}, 149: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 150: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 151: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 152: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 153: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 154: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 155: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 156: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 157: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 158: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 159: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 160: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 161: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 162: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 163: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 164: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 165: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 166: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 167: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Public Transportation'}, 168: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Communication'}, 169: {'cluster_id': 12, 'cluster_name': 'Religious Information', 'sub_cluster': 'Religious Information'}, 170: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 171: {'cluster_id': 3, 'cluster_name': 'Transportation', 'sub_cluster': 'Taxi Services'}, 172: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 173: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 174: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 175: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Open Chat'}, 176: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 177: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 178: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 179: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 180: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 181: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 182: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Divorce'}, 183: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 184: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Protocols'}, 185: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 186: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 187: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 188: {'cluster_id': 11, 'cluster_name': 'Legal information', 'sub_cluster': 'Marriage'}, 189: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 190: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 191: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 192: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 193: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 194: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 195: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 196: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 197: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 198: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 199: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}, 200: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 201: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Logistics'}, 202: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 203: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Consulate Services'}, 204: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Seeking'}, 205: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Other Item Request'}, 206: {'cluster_id': 4, 'cluster_name': 'Accommodation', 'sub_cluster': 'Leasing Regulation'}, 207: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Other Item Request'}, 208: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Job'}, 209: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 210: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 211: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 212: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 213: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Infant & Toddler Care'}, 214: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 215: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 216: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 217: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 218: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 219: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 220: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 221: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 222: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Hospice Care'}, 223: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 224: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 225: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 226: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 227: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Dentistry'}, 228: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 229: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 230: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Customs'}, 231: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 232: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 233: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Customs'}, 234: {'cluster_id': 6, 'cluster_name': 'Integration', 'sub_cluster': 'Customs'}, 235: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Disability'}, 236: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 237: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 238: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 239: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 240: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 241: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Network Provider'}, 242: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 243: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 244: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 245: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 246: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 247: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Travel'}, 248: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 249: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Leisure and Fitness'}, 250: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 251: {'cluster_id': 10, 'cluster_name': 'Social Activity', 'sub_cluster': 'Regulation'}, 252: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 253: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Open Chat'}, 254: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 255: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Medical Request'}, 256: {'cluster_id': 0, 'cluster_name': 'Immigration', 'sub_cluster': 'Immigration Procedure'}, 257: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 258: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 259: {'cluster_id': 8, 'cluster_name': 'Social Services', 'sub_cluster': 'Protocols'}, 260: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 261: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 262: {'cluster_id': -1, 'cluster_name': 'Unknown', 'sub_cluster': 'Unknown'}, 263: {'cluster_id': 1, 'cluster_name': 'Healthcare and Insurance', 'sub_cluster': 'Infant & Toddler Care'}, 264: {'cluster_id': 7, 'cluster_name': 'Living Essentials', 'sub_cluster': 'Shopping'}, 265: {'cluster_id': 5, 'cluster_name': 'Volunteering', 'sub_cluster': 'Volunteering'}} Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 швейцарии - швейцарії - статус - 00 - добрый 102 -1_швейцарии_швейцарії_статус_00
0 беженцев - украину - украины - біженців - україни 271717 0_беженцев_украину_украины_біженців
1 паляниця - огромное - благодарю - ответ - паляниця доброго 46975 1_паляниця_огромное_благодарю_ответ
2 страховка - страховку - врачу - страховки - врача 17173 2_страховка_страховку_врачу_страховки
3 животных - собаку - собак - собаки - собака 16379 3_животных_собаку_собак_собаки
4 лагере - лагерь - лагеря - лагерях - таборі 6680 4_лагере_лагерь_лагеря_лагерях
5 билет - билеты - квиток - билета - проездной 5178 5_билет_билеты_квиток_билета
6 кантоне - кантона - кантону - каком кантоне - кантоны 5160 6_кантоне_кантона_кантону_каком кантоне
7 квартиру - ищу - ищем - жильё - жилье 5091 7_квартиру_ищу_ищем_жильё
8 завтра - 00 - августа - 30 - сентября 4428 8_завтра_00_августа_30
9 вокзале - волонтеры - волонтеров - волонтёры - волонтёров 4414 9_вокзале_волонтеры_волонтеров_волонтёры
10 языка - язык - англійської - мови - англійської мови 4203 10_языка_язык_англійської_мови
11 переводчик - переводчика - перевод - нужен переводчик - переводчиком 3971 11_переводчик_переводчика_перевод_нужен переводчик
12 паспорт - паспорта - паспорту - загран - паспортом 3912 12_паспорт_паспорта_паспорту_загран
13 зуб - зубы - стоматолог - лечение - страховка 3855 13_зуб_зубы_стоматолог_лечение
14 работу - роботу - контракт - работодатель - резюме 3769 14_работу_роботу_контракт_работодатель
15 евро - франки - франков - гривны - поменять 3752 15_евро_франки_франков_гривны
16 банк - банке - банка - банку - счёт 3195 16_банк_банке_банка_банку
17 соц - соц помощь - социальной - служба - работника 3121 17_соц_соц помощь_социальной_служба
18 письмо - почту - почте - пришло - письма 2557 18_письмо_почту_почте_пришло
19 навчання - мови - школу - школа - школи 2552 19_навчання_мови_школу_школа
20 обувь - размер - одежда - взуття - одежду 2421 20_обувь_размер_одежда_взуття
21 детей - ребёнка - ребенка - пособие - выплаты 2264 21_детей_ребёнка_ребенка_пособие
22 köln - 41 - basel - 380 - duisburg 2025 22_köln_41_basel_380
23 город - городе - каком городе - города - каком 1948 23_город_городе_каком городе_города
24 перевозчика - перевозчиков - перевізника - перевізників - перевозчик 1927 24_перевозчика_перевозчиков_перевізника_перевізників
25 школу - школы - школа - школе - школи 1900 25_школу_школы_школа_школе
26 группу - группа - добавьте - добавьте группу - группе 1896 26_группу_группа_добавьте_добавьте группу
27 поезд - поезда - поезде - потяг - поездом 1843 27_поезд_поезда_поезде_потяг
28 договор - аренды - квартиры - квартиру - аренду 1839 28_договор_аренды_квартиры_квартиру
29 знаю - знаю знаю - сожалению - сожалению знаю - честно 1774 29_знаю_знаю знаю_сожалению_сожалению знаю
30 стране - страну - страны - страна - другую страну 1769 30_стране_страну_страны_страна
31 французского - французької - французский - языка - мови 1766 31_французского_французької_французский_языка
32 ссылку - сайт - сайте - посилання - ссылка 1750 32_ссылку_сайт_сайте_посилання
33 базель - базеле - бассейн - базеля - базелі 1697 33_базель_базеле_бассейн_базеля
34 кг - молоко - продукты - кофе - мясо 1660 34_кг_молоко_продукты_кофе
35 волос - парикмахер - стрижка - стрижки - ботокс 1642 35_волос_парикмахер_стрижка_стрижки
36 україна - слава україні - слава - україні - україни 1631 36_україна_слава україні_слава_україні
37 авто - машину - машины - машина - автомобиль 1627 37_авто_машину_машины_машина
38 чат - сообщения - чату - сообщениях - чаті 1623 38_чат_сообщения_чату_сообщениях
39 месяца - недели - месяц - дней - месяцев 1606 39_месяца_недели_месяц_дней
40 магазин - магазины - магазине - магазина - магазинах 1518 40_магазин_магазины_магазине_магазина
41 деньги - выплаты - платить - гроші - денег 1517 41_деньги_выплаты_платить_гроші
42 статус - статуса - статус статус - статусом - получения статуса 1481 42_статус_статуса_статус статус_статусом
43 посольство - консульство - посольстве - посольства - консульства 1385 43_посольство_консульство_посольстве_посольства
44 имеете - шо - имеете ввиду - маєте увазі - виду 1369 44_имеете_шо_имеете ввиду_маєте увазі
45 самолёт - аэропорта - аэропорту - аэропорт - літак 1365 45_самолёт_аэропорта_аэропорту_аэропорт
46 бесплатно - безкоштовно - бесплатный - бесплатные - gratis 1327 46_бесплатно_безкоштовно_бесплатный_бесплатные
47 адрес - адресу - адреса - подскажите адрес - точный адрес 1319 47_адрес_адресу_адреса_подскажите адрес
48 велосипед - велосипеды - велосипеда - велосипедов - самокат 1292 48_велосипед_велосипеды_велосипеда_велосипедов
49 диван - мебель - мебели - меблі - перевезти 1251 49_диван_мебель_мебели_меблі
50 миграционную - миграционной - миграционную службу - службу - миграционный 1246 50_миграционную_миграционной_миграционную службу_службу
51 война - войны - війна - війни - закончится 1242 51_война_войны_війна_війни
52 фр - 300 - 200 - 100 - 500 1224 52_фр_300_200_100
53 телефон - айфон - телефона - телефонов - продам 1211 53_телефон_айфон_телефона_телефонов
54 математики - курсы - курси - заняття - курсов 1207 54_математики_курсы_курси_заняття
55 заберу - возьму - брала - собираюсь - иду 1185 55_заберу_возьму_брала_собираюсь
56 номер - контакт - контакты - контакти - позвонить 1110 56_номер_контакт_контакты_контакти
57 гуманитарной - гуманитарную - гуманитарную помощь - гуманитарной помощи - гуманитарная 1090 57_гуманитарной_гуманитарную_гуманитарную помощь_гуманитарной помощи
58 информация - источник - документы - документ - інформація 1039 58_информация_источник_документы_документ
59 футбол - спорт - тренер - спорта - зал 1008 59_футбол_спорт_тренер_спорта
60 налог - налоги - налогов - налоговой - tax 963 60_налог_налоги_налогов_налоговой
61 отопление - электричество - вода - газ - воду 952 61_отопление_электричество_вода_газ
62 кровать - ліжко - матрас - матрац - кровати 951 62_кровать_ліжко_матрас_матрац
63 личку - напишу - напишите - написала - написать 944 63_личку_напишу_напишите_написала
64 итальянского - италии - италию - итальянский - итальянском 939 64_итальянского_италии_италию_итальянский
65 чемодан - сумка - чемоданы - сумку - сумки 922 65_чемодан_сумка_чемоданы_сумку
66 карту - карта - карте - сим карту - сим 918 66_карту_карта_карте_сим карту
67 находитесь - живете - живёте - знаходитесь - проживаете 912 67_находитесь_живете_живёте_знаходитесь
68 junior - билет - проездной - ездить - взрослого 894 68_junior_билет_проездной_ездить
69 семьи - воссоединение - семью - семья - воссоединение семьи 871 69_семьи_воссоединение_семью_семья
70 швейцарии - языка - школу - язык - английский 870 70_швейцарии_языка_школу_язык
71 очки - окуляри - fielmann - зрение - очков 862 71_очки_окуляри_fielmann_зрение
72 детей - дети - детьми - детям - мама 861 72_детей_дети_детьми_детям
73 автобус - автобусы - автобуса - автобусом - автобусе 850 73_автобус_автобусы_автобуса_автобусом
74 user - користувача - налаштуваннях - info - чату 846 74_user_користувача_налаштуваннях_info
75 прививки - тест - сертификат - ковид - ковида 846 75_прививки_тест_сертификат_ковид
76 полицию - полиции - полиция - поліцію - поліція 835 76_полицию_полиции_полиция_поліцію
77 крест - красный крест - красный - креста - красного креста 818 77_крест_красный крест_красный_креста
78 праздник - фестиваль - ярмарка - роком - свято 802 78_праздник_фестиваль_ярмарка_роком
79 львова - львов - львів - цюриха - місця 792 79_львова_львов_львів_цюриха
80 девушка - девушке - спрашивала - женщина - девушки 790 80_девушка_девушке_спрашивала_женщина
81 русскоговорящего - врач - русскоговорящий - русскоговорящих - врача 789 81_русскоговорящего_врач_русскоговорящий_русскоговорящих
82 будапешт - будапешта - поезд - мукачево - венгрии 769 82_будапешт_будапешта_поезд_мукачево
83 парковки - парковка - парковку - парковке - машину 755 83_парковки_парковка_парковку_парковке
84 июнь - июль - выплаты - июня - май 752 84_июнь_июль_выплаты_июня
85 кораблики - озера - озеро - озеру - озере 706 85_кораблики_озера_озеро_озеру
86 думку - людей - мнение - людям - человек 704 86_думку_людей_мнение_людям
87 юриста - юрист - адвоката - адвокат - юристы 682 87_юриста_юрист_адвоката_адвокат
88 массаж - спортивный - спина - общению - профессиональный 655 88_массаж_спортивный_спина_общению
89 страховка - страховку - швейцарии - страховки - страховой 646 89_страховка_страховку_швейцарии_страховки
90 пластик - пластика - пластику - пластиком - новый 634 90_пластик_пластика_пластику_пластиком
91 ноутбук - ноутбуки - ноутбука - ремонт - пк 623 91_ноутбук_ноутбуки_ноутбука_ремонт
92 уроки - музыки - играть - музыкой - преподаватель 621 92_уроки_музыки_играть_музыкой
93 сайты - жилья - поиска - подскажите сайты - поиска жилья 609 93_сайты_жилья_поиска_подскажите сайты
94 церкви - церковь - святого - неділю - служба 606 94_церкви_церковь_святого_неділю
95 интернет - интернета - інтернет - роутер - wi 562 95_интернет_интернета_інтернет_роутер
96 пользователь - размещать - внимательны - user - услуги 560 96_пользователь_размещать_внимательны_user
97 бронь - брони - броні - revolut - улице 551 97_бронь_брони_броні_revolut
98 цена - ціна - цены - стоимость - цену 546 98_цена_ціна_цены_стоимость
99 ехали - ходили - едем - одессы - находимся 533 99_ехали_ходили_едем_одессы
100 карточку - карточки - карты - картку - карточка 533 100_карточку_карточки_карты_картку
101 интересует - интересует вопрос - цікавить - вопрос интересует - интересно 528 101_интересует_интересует вопрос_цікавить_вопрос интересует
102 мусора - мусор - сміття - пакеты - картон 527 102_мусора_мусор_сміття_пакеты
103 книги - книжки - библиотеке - книгу - библиотеки 517 103_книги_книжки_библиотеке_книгу
104 книги - книжки - книг - украинском - українською 515 104_книги_книжки_книг_украинском
105 налог - налоги - швейцарии - податки - доход 495 105_налог_налоги_швейцарии_податки
106 штраф - штрафы - штрафа - штрафов - выписали 487 106_штраф_штрафы_штрафа_штрафов
107 музей - музеи - музеї - art - музея 480 107_музей_музеи_музеї_art
108 фото - скиньте фото - фотографии - скину - картинку 477 108_фото_скиньте фото_фотографии_скину
109 радио - телевизор - телевидение - радіо - тв 454 109_радио_телевизор_телевидение_радіо
110 закон - закона - законы - закону - законом 445 110_закон_закона_законы_закону
111 90 - 90 дней - шенгена - шенген - шенгену 443 111_90_90 дней_шенгена_шенген
112 ukraine_reborn - montbrillant 52 - rue montbrillant - організовує_ukraine_reborn - montbrillant 435 112_ukraine_reborn_montbrillant 52_rue montbrillant_організовує_ukraine_reborn
113 мітинг - оон - женеві - завтра - сегодня 431 113_мітинг_оон_женеві_завтра
114 границе - границы - границу - кордон - кордону 427 114_границе_границы_границу_кордон
115 размер - см - розмір - размеры - ширина 422 115_размер_см_розмір_размеры
116 ждать - жду - ждём - чекати - чекаю 417 116_ждать_жду_ждём_чекати
117 facebook - telegram instagram - сторінка facebook - facebook telegram - ukraine_reborn 416 117_facebook_telegram instagram_сторінка facebook_facebook telegram
118 фотограф - фото - фотографії - камера - основи 413 118_фотограф_фото_фотографії_камера
119 извините - вибачте - простите - жаль - прощения 410 119_извините_вибачте_простите_жаль
120 фейсбуке - marketplace - фейсбук - фейсбуці - facebook 392 120_фейсбуке_marketplace_фейсбук_фейсбуці
121 berlin - берлине - looking - room - hello 390 121_berlin_берлине_looking_room
122 рождении - свидетельство - свидетельства - свидетельство рождении - народження 381 122_рождении_свидетельство_свидетельства_свидетельство рождении
123 страхование - страховку - страховка - страховой - страховки 375 123_страхование_страховку_страховка_страховой
124 собака - собачка - ищем - маленькая - жильё 372 124_собака_собачка_ищем_маленькая
125 юриста - адвокат - адвоката - юрист - юристов 362 125_юриста_адвокат_адвоката_юрист
126 приложение - приложении - додаток - приложения - app 359 126_приложение_приложении_додаток_приложения
127 зоопарк - зоопарка - zoo - вход - бесплатный 355 127_зоопарк_зоопарка_zoo_вход
128 вода - воду - воды - пить - туалет 351 128_вода_воду_воды_пить
129 психолог - психолога - психотерапевт - працюю - психологическая 351 129_психолог_психолога_психотерапевт_працюю
130 пять - числа - число - штук - 10 349 130_пять_числа_число_штук
131 европе - европу - европа - европы - європі 348 131_европе_европу_европа_европы
132 отель - отеле - готель - хостел - отеля 347 132_отель_отеле_готель_хостел
133 биометрию - биометрии - біометрію - spop - биометрия 346 133_биометрию_биометрии_біометрію_spop
134 завалили - рашист - user - irina - iryna 346 134_завалили_рашист_user_irina
135 машинку - машину - машинка - машина - мыть 346 135_машинку_машину_машинка_машина
136 германию - берлин - продуктами - берлина - германии 343 136_германию_берлин_продуктами_берлина
137 год - года - конца года - году - год момента 338 137_год_года_конца года_году
138 sunrise - swisscom - користування - кінця - конца августа 336 138_sunrise_swisscom_користування_кінця
139 украине - налог - податки - налоги - доход 328 139_украине_налог_податки_налоги
140 прививки - тест - ковид - ковида - сертификат 328 140_прививки_тест_ковид_ковида
141 турист - турцию - туризм - маршруты - поездки 321 141_турист_турцию_туризм_маршруты
142 коляска - коляску - кресло - нужна - детское 317 142_коляска_коляску_кресло_нужна
143 дешевле - дешевше - дешевле купить - цены - aldi 307 143_дешевле_дешевше_дешевле купить_цены
144 чехии - молдову - добраться - молдовы - границе 304 144_чехии_молдову_добраться_молдовы
145 авторизации - послал - действие - 2023 - ссылку 303 145_авторизации_послал_действие_2023
146 заказ - замовлення - народження - кондитер - делает 298 146_заказ_замовлення_народження_кондитер
147 мастера - маникюра - мастера маникюра - ищу мастера - педикюра 293 147_мастера_маникюра_мастера маникюра_ищу мастера
148 бензин - газ - продам - заправки - автомат 293 148_бензин_газ_продам_заправки
149 магазин - украинцев - українські - вареники - українських 287 149_магазин_украинцев_українські_вареники
150 повезло - удачи - повезёт - пощастило - щастить 285 150_повезло_удачи_повезёт_пощастило
151 green - зелёную - зелёная - карта - карту 284 151_green_зелёную_зелёная_карта
152 сигареты - сигарет - курить - пачки - алкоголь 277 152_сигареты_сигарет_курить_пачки
153 крісло - кресло - стула - стул - стулья 273 153_крісло_кресло_стула_стул
154 танці - танцы - танців - заняття - вівторок 272 154_танці_танцы_танців_заняття
155 мошенники - шахраї - мошенников - шахрайство - мошенник 271 155_мошенники_шахраї_мошенников_шахрайство
156 девочки - дівчата - девчонки - девушки - маникюр 270 156_девочки_дівчата_девчонки_девушки
157 спам - бот - админы - админ - канале 270 157_спам_бот_админы_админ
158 концерт - театр - 00 - фестиваль - сегодня 270 158_концерт_театр_00_фестиваль
159 канал - канале - каналу - канала - описании группы 268 159_канал_канале_каналу_канала
160 немецкий - немецкого - школе - дети - школу 262 160_немецкий_немецкого_школе_дети
161 йога - инструктор - йоги - занятие - занятия 260 161_йога_инструктор_йоги_занятие
162 онлайн - регистрацию - регистрация - регистрации - регистрироваться 255 162_онлайн_регистрацию_регистрация_регистрации
163 сарказм - смешно - шутка - юмор - смішно 249 163_сарказм_смешно_шутка_юмор
164 париж - францию - франции - билеты - билет 248 164_париж_францию_франции_билеты
165 цветов - квіток - цветы - сад - саду 241 165_цветов_квіток_цветы_сад
166 реклама - рекламу - рекламы - dwarn - объявления 240 166_реклама_рекламу_рекламы_dwarn
167 sbb - mobile - приложение - сайте sbb - приложении sbb 236 167_sbb_mobile_приложение_сайте sbb
168 б1 - второй - b2 - пачки - две 236 168_б1_второй_b2_пачки
169 церкви - церковь - українська - украинская - української 234 169_церкви_церковь_українська_украинская
170 русских - магазин - магазине - русском - русский 234 170_русских_магазин_магазине_русском
171 такси - такс - халб - фри - хальб 233 171_такси_такс_халб_фри
172 горы - горах - гори - гору - гор 231 172_горы_горах_гори_гору
173 90 - 90 дней - дней - 90 днів - днів 230 173_90_90 дней_дней_90 днів
174 стол - стіл - столик - письменный - стола 222 174_стол_стіл_столик_письменный
175 мужчин - женщин - мужчины - мужчинам - женщины 219 175_мужчин_женщин_мужчины_мужчинам
176 ваучер - ваучеры - хальбтакс - halbtax - халбтакс 218 176_ваучер_ваучеры_хальбтакс_halbtax
177 пораду - рекомендую - совет - советы - рекомендации 217 177_пораду_рекомендую_совет_советы
178 зоопарк - zoo - украинцев - вход - українців 214 178_зоопарк_zoo_украинцев_вход
179 тест - пцр - ковид - тесты - тест корону 213 179_тест_пцр_ковид_тесты
180 австрии - австрию - австрії - австрия - райффайзен 212 180_австрии_австрию_австрії_австрия
181 видео - відео - youtube - ютубе - ютубі 211 181_видео_відео_youtube_ютубе
182 развод - розвод - подружжя - деньги - ведитесь 210 182_развод_розвод_подружжя_деньги
183 безкоштовне - безкоштовне заняття - заняття - 3d - ігри 209 183_безкоштовне_безкоштовне заняття_заняття_3d
184 пенсию - пенсии - пенсионного - инвалидности - фонд 206 184_пенсию_пенсии_пенсионного_инвалидности
185 распечатать - роздрукувати - документы - документи - документ 203 185_распечатать_роздрукувати_документы_документи
186 канаду - визу - канада - визы - канаде 201 186_канаду_визу_канада_визы
187 виза - визу - визы - віза - візу 199 187_виза_визу_визы_віза
188 брак - замуж - браке - выйти - офіційно 199 188_брак_замуж_браке_выйти
189 парикмахер - стрижки - волосся - стрижка - салоне 196 189_парикмахер_стрижки_волосся_стрижка
190 16 - 18 - 14 16 - 17 - 14 196 190_16_18_14 16_17
191 занимаетесь - спрашиваете - чья - режи - делаете 196 191_занимаетесь_спрашиваете_чья_режи
192 прокат - зимой - зиму - кататься - покататься 194 192_прокат_зимой_зиму_кататься
193 бесплатный - проезд - бесплатный проезд - бесплатного проезда - бесплатного 192 193_бесплатный_проезд_бесплатный проезд_бесплатного проезда
194 2024 - 2023 - 2022 - 2024 года - 2021 191 194_2024_2023_2022_2024 года
195 лампы - светлана - свет - света - світло 187 195_лампы_светлана_свет_света
196 предупреждение - авторизации - послал - действие - 11 2022 185 196_предупреждение_авторизации_послал_действие
197 спробувати - малювати - малювання - картини - художник 175 197_спробувати_малювати_малювання_картини
198 магазинах - магазине - гречка - магазин - магазины 175 198_магазинах_магазине_гречка_магазин
199 волонтеров - волонтеры - волонтёров - волонтерів - швейцарии 175 199_волонтеров_волонтеры_волонтёров_волонтерів
200 косметолога - косметолог - чистку - лица - образованием 175 200_косметолога_косметолог_чистку_лица
201 кг - вес - фр - 10 фр - ваги 174 201_кг_вес_фр_10 фр
202 user - marina - elena - ирина - ekaterina 171 202_user_marina_elena_ирина
203 дюссельдорфе - консульство - дюссельдорф - консульстве - термин 169 203_дюссельдорфе_консульство_дюссельдорф_консульстве
204 airbnb - booking - аренды - ваучер - снять 166 204_airbnb_booking_аренды_ваучер
205 вина - мартини - виньетку - пиво - вино 166 205_вина_мартини_виньетку_пиво
206 квартиры - квартиру - житло - украинцев - украинцам 163 206_квартиры_квартиру_житло_украинцев
207 флаг - прапор - украинский - український - флаги 161 207_флаг_прапор_украинский_український
208 вимоги - знання - hotel - ресторан - роботи 161 208_вимоги_знання_hotel_ресторан
209 вчера - вчора - позавчера - вчера получили - вчера вечером 160 209_вчера_вчора_позавчера_вчера получили
210 пароль - зайти - вводить - кабинет - ввести 160 210_пароль_зайти_вводить_кабинет
211 причину - причина - нащо - причиной - парадокс 159 211_причину_причина_нащо_причиной
212 завалили - рашист - микола - лилия - наталья 156 212_завалили_рашист_микола_лилия
213 няню - няня - ищу - тиждень - проживанням 153 213_няню_няня_ищу_тиждень
214 числа - 25 - 33 - 37 - 32 152 214_числа_25_33_37
215 игрушки - іграшки - игрушек - детские - дитячі 151 215_игрушки_іграшки_игрушек_детские
216 интервью - собеседование - собеседования - собеседовании - співбесіду 150 216_интервью_собеседование_собеседования_собеседовании
217 собирать - збирати - безпеки - зібрані - 00 19 147 217_собирать_збирати_безпеки_зібрані
218 третий - троих - шт - мес - третье 146 218_третий_троих_шт_мес
219 витамины - аптеке - анализ - входят - беременности 145 219_витамины_аптеке_анализ_входят
220 сел - часах - аппарат - старий - ноут 145 220_сел_часах_аппарат_старий
221 испании - испанию - іспанії - испанский - море 144 221_испании_испанию_іспанії_испанский
222 hospice - general - général - meyrin - ukr 144 222_hospice_general_général_meyrin
223 вопросы - задать - задать вопрос - спросить - вопрос 144 223_вопросы_задать_задать вопрос_спросить
224 используете - слово - действие - 2023 - 03 2023 144 224_используете_слово_действие_2023
225 migros - мигрос - мигросе - change - кооп 141 225_migros_мигрос_мигросе_change
226 проверить - проверено - проверяют - проверьте - баланс 140 226_проверить_проверено_проверяют_проверьте
227 ортодонта - ортодонт - посоветуйте - хорошего - контакты 140 227_ортодонта_ортодонт_посоветуйте_хорошего
228 психолог - консультацію - безкоштовна - консультації - психологічної 139 228_психолог_консультацію_безкоштовна_консультації
229 опыт - досвід - опыте - опытом - личный опыт 138 229_опыт_досвід_опыте_опытом
230 название - имя - назва - фамилия - названия 138 230_название_имя_назва_фамилия
231 правила - новые правила - правилах - правилам - новые 138 231_правила_новые правила_правилах_правилам
232 рыба - рыбу - лицензии - права - ловить 137 232_рыба_рыбу_лицензии_права
233 маски - транспорте - маску - маска - носить 136 233_маски_транспорте_маску_маска
234 дорого - дороже - дороговато - дорогие - дорогой 136 234_дорого_дороже_дороговато_дорогие
235 инвалидность - инвалидов - инвалидности - інвалідність - инвалидам 134 235_инвалидность_инвалидов_инвалидности_інвалідність
236 sozialamt - социал - социале - социаламт - соціал 134 236_sozialamt_социал_социале_социаламт
237 адміни - адмін - адмінів - адміна - забаньте 134 237_адміни_адмін_адмінів_адміна
238 прапор - флаги - флаг - купити - днем 133 238_прапор_флаги_флаг_купити
239 обратно - возвращаться - возвращать - вернут - возвращают 132 239_обратно_возвращаться_возвращать_вернут
240 закрыто - закрыт - закрыли - закрита - закрыты 131 240_закрыто_закрыт_закрыли_закрита
241 холодильник - маленький - см - ремонту - высота 129 241_холодильник_маленький_см_ремонту
242 пробуйте - попробовать - попробуйте - спробуйте - пробовать 127 242_пробуйте_попробовать_попробуйте_спробуйте
243 amazon - доставки - доставляют - доставка - заказывать 126 243_amazon_доставки_доставляют_доставка
244 мошенничество - причина - user - предложение - требований 125 244_мошенничество_причина_user_предложение
245 парк - парке - park - парка - площадка 125 245_парк_парке_park_парка
246 неделю - тиждень - неделя - каждую неделю - недели 124 246_неделю_тиждень_неделя_каждую неделю
247 паспорт - поезде - поезд - билет - показать 122 247_паспорт_поезде_поезд_билет
248 rue - lausanne - genève - louis - avenue 121 248_rue_lausanne_genève_louis
249 ферма - фермы - ферме - бажано - робота 120 249_ферма_фермы_ферме_бажано
250 фото - фотографируют - ребенка - отпечатки - детей 118 250_фото_фотографируют_ребенка_отпечатки
251 собирать - поля - поле - сезон - паляниця 117 251_собирать_поля_поле_сезон
252 yallo - сим - sunrise - swisscom - сим карту 116 252_yallo_сим_sunrise_swisscom
253 домой - додому - вернуться домой - вернуться - дома 115 253_домой_додому_вернуться домой_вернуться
254 marketplace - купити - олх - купить - швейцарії 113 254_marketplace_купити_олх_купить
255 сахар - таблетки - рецепту - рецепт - крови 113 255_сахар_таблетки_рецепту_рецепт
256 батька - отца - доверенность - разрешение - батьків 112 256_батька_отца_доверенность_разрешение
257 читайте - читать - внимательно - уважно - почитайте 111 257_читайте_читать_внимательно_уважно
258 шоколад - фабрики - музей - шоколадку - 15 франков 111 258_шоколад_фабрики_музей_шоколадку
259 евро - 450 - франков - 100 - франков месяц 109 259_евро_450_франков_100
260 кнопку - натисніть - дякуємо - 60 - ios 109 260_кнопку_натисніть_дякуємо_60
261 посмотрите - смотрите - подивіться - закрепах - смотря 108 261_посмотрите_смотрите_подивіться_закрепах
262 компании - компанія - компания - фирмы - компанії 107 262_компании_компанія_компания_фирмы
263 самокат - мальчика - хлопчика - хлопчик - девочки 107 263_самокат_мальчика_хлопчика_хлопчик
264 купить - подскажите купить - купити - женеве купить - знает купить 102 264_купить_подскажите купить_купити_женеве купить
265 помощь - помощь нужна - нужна - нужна помощь - допомога 102 265_помощь_помощь нужна_нужна_нужна помощь

Training hyperparameters

  • calculate_probabilities: False
  • embedding_model: paraphrase-multilingual-MiniLM-L12-v2
  • language: multilingual
  • low_memory (UMAP): True
  • metric (UMAP): cosine
  • metric (HDBSCAN): euclidean
  • min_cluster_size: 100
  • n_gram_range: (1, 2)
  • n_components (UMAP): 15
  • n_neighbors (UMAP): 20
  • nr_topics: auto
  • prediction_data: True
  • random_state (UMAP): 42
  • stop_words: (list of stop words)
  • verbose: True

Framework versions

  • Numpy: 1.21.5
  • HDBSCAN: 0.8.33
  • UMAP: 0.5.4
  • Pandas: 1.4.4
  • Scikit-Learn: 1.3.0
  • Sentence-transformers: 2.2.2
  • Transformers: 4.33.2
  • Numba: 0.55.1
  • Plotly: 5.9.0
  • Python: 3.9.13