SakuraLLM
/

Sakura-13B-LNovel-v0_8-AWQ

sakuraumi commited on Nov 22, 2023

Commit

7333293

•

1 Parent(s): 635f8e4

Upload 3 files

Files changed (3) hide show

gptq_model-4bit-128g.safetensors ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:c31c40e8ff8f7c821ea68d5ede34ec63744d997224cc4ecd220e8461733e97ae
+size 9125989024

model_config.json ADDED Viewed

+{
+  "hidden_size": 5120,
+  "inner_hidden_size": 13696,
+  "head_hidden_size": 128,
+  "hidden_act": "silu",
+  "num_attention_heads": 40,
+  "num_key_value_heads": 40,
+  "num_layers": 40,
+  "qkv_bias": false,
+  "o_bias": false,
+  "vocab_size": 125696,
+  "dropout_rate": 0.0,
+  "layernorm_epsilon": 1e-06,
+  "max_sequence_length": 4096,
+  "use_alibi": true
+}

tokenizer_config.json ADDED Viewed

The diff for this file is too large to render. See raw diff