MARTINI_enrich_BERTopic_ArunasGl
This is a BERTopic model. BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
Usage
To use this model, please install BERTopic:
pip install -U bertopic
You can use the model as follows:
from bertopic import BERTopic
topic_model = BERTopic.load("AIDA-UPM/MARTINI_enrich_BERTopic_ArunasGl")
topic_model.get_topic_info()
Topic overview
- Number of topics: 20
- Number of training documents: 2504
Click here for an overview of all topics.
Topic ID | Topic Keywords | Topic Frequency | Label |
---|---|---|---|
-1 | trumpas - amerikos - pavyzdziui - prezidento - reiskia | 21 | -1_trumpas_amerikos_pavyzdziui_prezidento |
0 | ukrainieciai - zelenskis - rusija - baltarusijos - nato | 1338 | 0_ukrainieciai_zelenskis_rusija_baltarusijos |
1 | motyvacija - intuicija - svytuokles - prasme - niekada | 210 | 1_motyvacija_intuicija_svytuokles_prasme |
2 | vakcinomis - kovid - pfizer - virusas - injekcijos | 147 | 2_vakcinomis_kovid_pfizer_virusas |
3 | korupcijos - trumpas - operacijoms - kongreso - jfk | 106 | 3_korupcijos_trumpas_operacijoms_kongreso |
4 | trumpas - prezidentui - donaldui - amerikos - tikrai | 83 | 4_trumpas_prezidentui_donaldui_amerikos |
5 | mossad - palestinieciai - israelio - hamas - mi6 | 78 | 5_mossad_palestinieciai_israelio_hamas |
6 | probiotikai - lactobacillus - antioksidantas - vitaminu - reishi | 58 | 6_probiotikai_lactobacillus_antioksidantas_vitaminu |
7 | bankrutavo - kriptovaliutu - finansiniu - ftx - cbdc | 54 | 7_bankrutavo_kriptovaliutu_finansiniu_ftx |
8 | sukciai - nepriestaraujate - pravaziuojanciam - susirasinejimu - nekritikuoja | 53 | 8_sukciai_nepriestaraujate_pravaziuojanciam_susirasinejimu |
9 | bidenas - kongresmenas - mccarthy - feinstein - susitarimo | 52 | 9_bidenas_kongresmenas_mccarthy_feinstein |
10 | помните - россии - победу - воина - года | 52 | 10_помните_россии_победу_воина |
11 | instagramas - fb - influenceriais - bot - platforma | 41 | 11_instagramas_fb_influenceriais_bot |
12 | pedofilija - seksualiai - holivudas - persekiojima - epsteinas | 40 | 12_pedofilija_seksualiai_holivudas_persekiojima |
13 | giuliani - trumpas - prokuroru - federaliniu - donaldui | 39 | 13_giuliani_trumpas_prokuroru_federaliniu |
14 | elektromagnetiniais - energijos - generatorius - voltu - sildytuva | 32 | 14_elektromagnetiniais_energijos_generatorius_voltu |
15 | mafija - rotschildu - chazarai - bankininkystes - judaizma | 29 | 15_mafija_rotschildu_chazarai_bankininkystes |
16 | delfi - prielankiausia - kadyrovui - socialdemokratai - skandalas | 26 | 16_delfi_prielankiausia_kadyrovui_socialdemokratai |
17 | prancuzijai - protestai - politikais - prezidente - macrono | 23 | 17_prancuzijai_protestai_politikais_prezidente |
18 | musk - trumpu - twitter - elona - zurnalistu | 22 | 18_musk_trumpu_twitter_elona |
Training hyperparameters
- calculate_probabilities: True
- language: None
- low_memory: False
- min_topic_size: 10
- n_gram_range: (1, 1)
- nr_topics: None
- seed_topic_list: None
- top_n_words: 10
- verbose: False
- zeroshot_min_similarity: 0.7
- zeroshot_topic_list: None
Framework versions
- Numpy: 1.26.4
- HDBSCAN: 0.8.40
- UMAP: 0.5.7
- Pandas: 2.2.3
- Scikit-Learn: 1.5.2
- Sentence-transformers: 3.3.1
- Transformers: 4.46.3
- Numba: 0.60.0
- Plotly: 5.24.1
- Python: 3.10.12
- Downloads last month
- 5
Inference Providers
NEW
This model is not currently available via any of the supported Inference Providers.