Add BERTopic model

#94

by TerriTuson - opened Feb 13

←

Files changed (3) hide show

config.json CHANGED Viewed

@@ -1,32 +1,17 @@
 {
-  "_name_or_path": "EleutherAI/pythia-12b",
-  "architectures": [
-    "GPTNeoXForCausalLM"
   ],
-  "custom_pipelines": {
-    "text-generation": {
-      "impl": "instruct_pipeline.InstructionTextGenerationPipeline",
-      "pt": "AutoModelForCausalLM",
-      "tf": "TFAutoModelForCausalLM"
-    }
-  },
-  "bos_token_id": 0,
-  "eos_token_id": 0,
-  "hidden_act": "gelu",
-  "hidden_size": 5120,
-  "initializer_range": 0.02,
-  "intermediate_size": 20480,
-  "layer_norm_eps": 1e-05,
-  "max_position_embeddings": 2048,
-  "model_type": "gpt_neox",
-  "num_attention_heads": 40,
-  "num_hidden_layers": 36,
-  "rotary_emb_base": 10000,
-  "rotary_pct": 0.25,
-  "tie_word_embeddings": false,
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.25.1",
-  "use_cache": true,
-  "use_parallel_residual": true,
-  "vocab_size": 50280
-}

 {
+  "calculate_probabilities": false,
+  "language": "english",
+  "low_memory": false,
+  "min_topic_size": 10,
+  "n_gram_range": [
+    1,
+    1
   ],
+  "nr_topics": null,
+  "seed_topic_list": null,
+  "top_n_words": 10,
+  "verbose": true,
+  "zeroshot_min_similarity": 0.7,
+  "zeroshot_topic_list": null,
+  "embedding_model": "sentence-transformers/all-MiniLM-L6-v2"
+}

topic_embeddings.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:7cf67651711d33ab3e9e1b984bc01502d356a674378e79f7ed6ca97b3c8adac0
+size 124504

topics.json ADDED Viewed

The diff for this file is too large to render. See raw diff