MARTINI_enrich_BERTopic_ArunasGl

This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.

Usage

To use this model, please install BERTopic:

pip install -U bertopic

You can use the model as follows:

from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ArunasGl")

topic_model.get_topic_info()

Topic overview

  • Number of topics: 20
  • Number of training documents: 2504
Click here for an overview of all topics.
Topic ID Topic Keywords Topic Frequency Label
-1 trumpas - amerikos - pavyzdziui - prezidento - reiskia 21 -1_trumpas_amerikos_pavyzdziui_prezidento
0 ukrainieciai - zelenskis - rusija - baltarusijos - nato 1338 0_ukrainieciai_zelenskis_rusija_baltarusijos
1 motyvacija - intuicija - svytuokles - prasme - niekada 210 1_motyvacija_intuicija_svytuokles_prasme
2 vakcinomis - kovid - pfizer - virusas - injekcijos 147 2_vakcinomis_kovid_pfizer_virusas
3 korupcijos - trumpas - operacijoms - kongreso - jfk 106 3_korupcijos_trumpas_operacijoms_kongreso
4 trumpas - prezidentui - donaldui - amerikos - tikrai 83 4_trumpas_prezidentui_donaldui_amerikos
5 mossad - palestinieciai - israelio - hamas - mi6 78 5_mossad_palestinieciai_israelio_hamas
6 probiotikai - lactobacillus - antioksidantas - vitaminu - reishi 58 6_probiotikai_lactobacillus_antioksidantas_vitaminu
7 bankrutavo - kriptovaliutu - finansiniu - ftx - cbdc 54 7_bankrutavo_kriptovaliutu_finansiniu_ftx
8 sukciai - nepriestaraujate - pravaziuojanciam - susirasinejimu - nekritikuoja 53 8_sukciai_nepriestaraujate_pravaziuojanciam_susirasinejimu
9 bidenas - kongresmenas - mccarthy - feinstein - susitarimo 52 9_bidenas_kongresmenas_mccarthy_feinstein
10 помните - россии - победу - воина - года 52 10_помните_россии_победу_воина
11 instagramas - fb - influenceriais - bot - platforma 41 11_instagramas_fb_influenceriais_bot
12 pedofilija - seksualiai - holivudas - persekiojima - epsteinas 40 12_pedofilija_seksualiai_holivudas_persekiojima
13 giuliani - trumpas - prokuroru - federaliniu - donaldui 39 13_giuliani_trumpas_prokuroru_federaliniu
14 elektromagnetiniais - energijos - generatorius - voltu - sildytuva 32 14_elektromagnetiniais_energijos_generatorius_voltu
15 mafija - rotschildu - chazarai - bankininkystes - judaizma 29 15_mafija_rotschildu_chazarai_bankininkystes
16 delfi - prielankiausia - kadyrovui - socialdemokratai - skandalas 26 16_delfi_prielankiausia_kadyrovui_socialdemokratai
17 prancuzijai - protestai - politikais - prezidente - macrono 23 17_prancuzijai_protestai_politikais_prezidente
18 musk - trumpu - twitter - elona - zurnalistu 22 18_musk_trumpu_twitter_elona

Training hyperparameters

  • calculate_probabilities: True
  • language: None
  • low_memory: False
  • min_topic_size: 10
  • n_gram_range: (1, 1)
  • nr_topics: None
  • seed_topic_list: None
  • top_n_words: 10
  • verbose: False
  • zeroshot_min_similarity: 0.7
  • zeroshot_topic_list: None

Framework versions

  • Numpy: 1.26.4
  • HDBSCAN: 0.8.40
  • UMAP: 0.5.7
  • Pandas: 2.2.3
  • Scikit-Learn: 1.5.2
  • Sentence-transformers: 3.3.1
  • Transformers: 4.46.3
  • Numba: 0.60.0
  • Plotly: 5.24.1
  • Python: 3.10.12
Downloads last month
5
Inference Providers NEW
This model is not currently available via any of the supported Inference Providers.