voidful commited on Oct 16

Commit

b6d2fad

•

1 Parent(s): 2c72486

Upload folder using huggingface_hub

Files changed (19) hide show

.gitattributes CHANGED Viewed

@@ -33,3 +33,5 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+mamba-790m-chat.gguf filter=lfs diff=lfs merge=lfs -text
+trainer_state.json filter=lfs diff=lfs merge=lfs -text

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "voidful/mamba-790m-base",
   "architectures": [
     "MambaForCausalLM"
   ],
@@ -31,7 +31,7 @@
   "time_step_rank": 96,
   "time_step_scale": 1.0,
   "torch_dtype": "bfloat16",
-  "transformers_version": "4.39.3",
   "use_bias": false,
   "use_cache": true,
   "use_conv_bias": true,

 {
+  "_name_or_path": "voidful/mamba-790m-chat",
   "architectures": [
     "MambaForCausalLM"
   ],
   "time_step_rank": 96,
   "time_step_scale": 1.0,
   "torch_dtype": "bfloat16",
+  "transformers_version": "4.41.2",
   "use_bias": false,
   "use_cache": true,
   "use_conv_bias": true,

generation_config.json CHANGED Viewed

@@ -3,5 +3,5 @@
   "bos_token_id": 0,
   "eos_token_id": 0,
   "pad_token_id": 0,
-  "transformers_version": "4.39.3"
 }

   "bos_token_id": 0,
   "eos_token_id": 0,
   "pad_token_id": 0,
+  "transformers_version": "4.41.2"
 }

mamba-790m-chat.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3b2ff4c58e86c863c5777e2258b0fb5454bbc1f012cd32b5011dce1fb35b5fd6
+size 1690030496

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bfae45488d2bda35b88cbb1a9e326fc52f2d2a4b69fa85263df859b8c45b55ae
 size 1685432032

 version https://git-lfs.github.com/spec/v1
+oid sha256:8f3bcefe881c19a63b712301bd7770e676d632df914223adafc2eb7d1c80b4b7
 size 1685432032

optimizer.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e129e28e4ed15ac0c3ca7802fb1bfd9b703ca9a023803fe5ee1d6b26e602e509
-size 9880887

 version https://git-lfs.github.com/spec/v1
+oid sha256:c04b2046a900485c0fbd849bd9703446cd973a7a4e56cd869ea5e23198720269
+size 1687495450

rng_state_0.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:a1ae1347774c0749a55025376e801f5e4dc34af975a2a09aec28b6f4540c1edd
-size 14512

 version https://git-lfs.github.com/spec/v1
+oid sha256:deae52a5d5be076c874536f0aade9a502c9a1b50a39e9feafd53759f4862709c
+size 15920

rng_state_1.pth CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:57d1ee2970895440f8d97f069224d964db0d54cae0cc255eb387cb4bdcb265fa
-size 14512

 version https://git-lfs.github.com/spec/v1
+oid sha256:afab10b429acf92e0244a895189614f02a5e7744234dfeb2dcf618f193df74ae
+size 15920

rng_state_2.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:85faf95634676c14aee5e8b1dd2a48c129fee9b0a2237093440926e6c88d8d5e
+size 15920

rng_state_3.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cbd5ba4e9d0e65b0e02d9257748f23754704f0221399f81c9c9c13192e40272d
+size 15920

rng_state_4.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:2bd9cce5c1921b68e37f81d030aee11ccc1594443c286c8ca3abbd35e6c0bcd2
+size 15920

rng_state_5.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5420e3f692f20fc11644e91f6ea935e2098125ef686be2629a80f8e3d37f80e5
+size 15920

rng_state_6.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:09abd313620bc17205bb41c832419ab4e77fa2e14f6be06ee7fc297fe96705b7
+size 15920

rng_state_7.pth ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fa75be5ee01f8a9f7a5b5bdc90a525d191e87779cd922f427f6b8637d0841875
+size 15920

scheduler.pt CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:f0f35e328ce33598fc8a5cacebc00a00411c322ddb9ef556c07f91b8b9669281
 size 1064

 version https://git-lfs.github.com/spec/v1
+oid sha256:177cd19791ffd6ffb0cdedadf3499d9bbbfc5d802ecbfe67163386a640b1719a
 size 1064

tokenizer.json CHANGED Viewed

@@ -276409,10 +276409,30 @@
     "use_regex": true
   },
   "post_processor": {
-    "type": "ByteLevel",
-    "add_prefix_space": false,
-    "trim_offsets": true,
-    "use_regex": true
   },
   "decoder": {
     "type": "ByteLevel",
@@ -276428,6 +276448,7 @@
     "end_of_word_suffix": null,
     "fuse_unk": false,
     "byte_fallback": false,
     "vocab": {
       "<|endoftext|>": 0,
       "<|padding|>": 1,

     "use_regex": true
   },
   "post_processor": {
+    "type": "TemplateProcessing",
+    "single": [
+      {
+        "Sequence": {
+          "id": "A",
+          "type_id": 0
+        }
+      }
+    ],
+    "pair": [
+      {
+        "Sequence": {
+          "id": "A",
+          "type_id": 0
+        }
+      },
+      {
+        "Sequence": {
+          "id": "B",
+          "type_id": 1
+        }
+      }
+    ],
+    "special_tokens": {}
   },
   "decoder": {
     "type": "ByteLevel",
     "end_of_word_suffix": null,
     "fuse_unk": false,
     "byte_fallback": false,
+    "ignore_merges": false,
     "vocab": {
       "<|endoftext|>": 0,
       "<|padding|>": 1,

tokenizer_config.json CHANGED Viewed

@@ -1,4 +1,6 @@
 {
   "add_prefix_space": false,
   "added_tokens_decoder": {
     "0": {
@@ -245685,8 +245687,12 @@
   "bos_token": "<|endoftext|>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
   "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<|endoftext|>",
   "tokenizer_class": "GPTNeoXTokenizer",
   "unk_token": "<|endoftext|>"
 }

 {
+  "add_bos_token": false,
+  "add_eos_token": false,
   "add_prefix_space": false,
   "added_tokens_decoder": {
     "0": {
   "bos_token": "<|endoftext|>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
+  "max_length": 10000,
   "model_max_length": 1000000000000000019884624838656,
   "pad_token": "<|endoftext|>",
+  "stride": 0,
   "tokenizer_class": "GPTNeoXTokenizer",
+  "truncation_side": "right",
+  "truncation_strategy": "longest_first",
   "unk_token": "<|endoftext|>"
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:98bb5155194e16f40dfff5ee2b78fbbb75f5bf74f8fb0faab091eb7c94ab3f14
-size 4920

 version https://git-lfs.github.com/spec/v1
+oid sha256:7a8f6ce00176d186cdc5f79cd71344b2d0ffaaf948a0559c63e80ff9fe39ce83
+size 5368