Upload folder using huggingface_hub

Files changed (7) hide show

README.md CHANGED Viewed

@@ -5,14 +5,14 @@ tags:
 - mergekit
 - lazymergekit
 - jefferylovely/SuperThetaMaven
-- vanillaOVO/supermario_v4
 ---
-# jefferylovely/AiMaven-Theta
-jefferylovely/AiMaven-Theta is a merge of the following models using [LazyMergekit](https://colab.research.google.com/drive/1obulZ1ROXHjYLn6PPZJwRR6GzgQogxxb?usp=sharing):
 * [jefferylovely/SuperThetaMaven](https://huggingface.co/jefferylovely/SuperThetaMaven)
-* [vanillaOVO/supermario_v4](https://huggingface.co/vanillaOVO/supermario_v4)
 ## 🧩 Configuration
@@ -21,10 +21,10 @@ slices:
   - sources:
       - model: jefferylovely/SuperThetaMaven
         layer_range: [0, 32]
-      - model: vanillaOVO/supermario_v4
         layer_range: [0, 32]
 merge_method: slerp
-base_model: jefferylovely/SuperThetaMaven
 parameters:
   t:
     - filter: self_attn
@@ -44,7 +44,7 @@ from transformers import AutoTokenizer
 import transformers
 import torch
-model = "jefferylovely/jefferylovely/AiMaven-Theta"
 messages = [{"role": "user", "content": "What is a large language model?"}]
 tokenizer = AutoTokenizer.from_pretrained(model)

 - mergekit
 - lazymergekit
 - jefferylovely/SuperThetaMaven
+- flemmingmiguel/MBX-7B-v3
 ---
+# jefferylovely/AiMaven-Prometheus
+jefferylovely/AiMaven-Prometheus is a merge of the following models using [LazyMergekit](https://colab.research.google.com/drive/1obulZ1ROXHjYLn6PPZJwRR6GzgQogxxb?usp=sharing):
 * [jefferylovely/SuperThetaMaven](https://huggingface.co/jefferylovely/SuperThetaMaven)
+* [flemmingmiguel/MBX-7B-v3](https://huggingface.co/flemmingmiguel/MBX-7B-v3)
 ## 🧩 Configuration
   - sources:
       - model: jefferylovely/SuperThetaMaven
         layer_range: [0, 32]
+      - model: flemmingmiguel/MBX-7B-v3
         layer_range: [0, 32]
 merge_method: slerp
+base_model: flemmingmiguel/MBX-7B-v3
 parameters:
   t:
     - filter: self_attn
 import transformers
 import torch
+model = "jefferylovely/jefferylovely/AiMaven-Prometheus"
 messages = [{"role": "user", "content": "What is a large language model?"}]
 tokenizer = AutoTokenizer.from_pretrained(model)

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "jefferylovely/SuperThetaMaven",
   "architectures": [
     "MistralForCausalLM"
   ],
@@ -15,14 +15,12 @@
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
-  "pad_token_id": 2,
   "rms_norm_eps": 1e-05,
   "rope_theta": 10000.0,
   "sliding_window": 4096,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.35.2",
-  "unsloth_version": "2024.1",
-  "use_cache": true,
   "vocab_size": 32000
 }

 {
+  "_name_or_path": "flemmingmiguel/MBX-7B-v3",
   "architectures": [
     "MistralForCausalLM"
   ],
   "num_attention_heads": 32,
   "num_hidden_layers": 32,
   "num_key_value_heads": 8,
   "rms_norm_eps": 1e-05,
   "rope_theta": 10000.0,
   "sliding_window": 4096,
   "tie_word_embeddings": false,
   "torch_dtype": "bfloat16",
   "transformers_version": "4.35.2",
+  "use_cache": false,
   "vocab_size": 32000
 }

mergekit_config.yml CHANGED Viewed

@@ -3,10 +3,10 @@ slices:
   - sources:
       - model: jefferylovely/SuperThetaMaven
         layer_range: [0, 32]
-      - model: vanillaOVO/supermario_v4
         layer_range: [0, 32]
 merge_method: slerp
-base_model: jefferylovely/SuperThetaMaven
 parameters:
   t:
     - filter: self_attn

   - sources:
       - model: jefferylovely/SuperThetaMaven
         layer_range: [0, 32]
+      - model: flemmingmiguel/MBX-7B-v3
         layer_range: [0, 32]
 merge_method: slerp
+base_model: flemmingmiguel/MBX-7B-v3
 parameters:
   t:
     - filter: self_attn

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e01f2b87b9844243183e4c1cee766a5f97d88f72b7fa36c399e00bb568dd3c7c
 size 9942981696

 version https://git-lfs.github.com/spec/v1
+oid sha256:1e3820523522b91ace0c8ff9a6a09133c36617806144fbecdfdf44a2699a60f8
 size 9942981696

model-00002-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f1846537c5bb5ece1d1f05b734a934a48499a949259370ac977b567fdce804e
 size 4540516344

 version https://git-lfs.github.com/spec/v1
+oid sha256:aba1c7a9d45994b42fb84691fd18bf3a2ba945c95b46ca2b33b700a47ecd3971
 size 4540516344

special_tokens_map.json CHANGED Viewed

@@ -1,9 +1,4 @@
 {
-  "additional_special_tokens": [
-    "<unk>",
-    "<s>",
-    "</s>"
-  ],
   "bos_token": {
     "content": "<s>",
     "lstrip": false,
@@ -18,13 +13,6 @@
     "rstrip": false,
     "single_word": false
   },
-  "pad_token": {
-    "content": "<unk>",
-    "lstrip": false,
-    "normalized": false,
-    "rstrip": false,
-    "single_word": false
-  },
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,

 {
   "bos_token": {
     "content": "<s>",
     "lstrip": false,
     "rstrip": false,
     "single_word": false
   },
   "unk_token": {
     "content": "<unk>",
     "lstrip": false,

tokenizer_config.json CHANGED Viewed

@@ -25,21 +25,16 @@
       "special": true
     }
   },
-  "additional_special_tokens": [
-    "<unk>",
-    "<s>",
-    "</s>"
-  ],
   "bos_token": "<s>",
   "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
   "legacy": true,
-  "model_max_length": 255,
-  "pad_token": "<unk>",
-  "padding_side": "right",
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,
   "tokenizer_class": "LlamaTokenizer",
   "unk_token": "<unk>",
-  "use_default_system_prompt": true
 }

       "special": true
     }
   },
+  "additional_special_tokens": [],
   "bos_token": "<s>",
   "clean_up_tokenization_spaces": false,
   "eos_token": "</s>",
   "legacy": true,
+  "model_max_length": 1000000000000000019884624838656,
+  "pad_token": null,
   "sp_model_kwargs": {},
   "spaces_between_special_tokens": false,
   "tokenizer_class": "LlamaTokenizer",
   "unk_token": "<unk>",
+  "use_default_system_prompt": false
 }