lianglv commited on 3 days ago

Commit

8ac85fc

verified ·

1 Parent(s): f701f13

Upload folder using huggingface_hub

Browse files

Files changed (17) hide show

.gitattributes +1 -0
model_index.json +25 -0
scheduler/scheduler_config.json +18 -0
text_encoder/config.json +64 -0
text_encoder/model.safetensors +3 -0
tokenizer/chat_template.jinja +10 -0
tokenizer/tokenizer.json +3 -0
tokenizer/tokenizer_config.json +15 -0
transformer/config.json +30 -0
transformer/model-00001-of-00004.safetensors +3 -0
transformer/model-00002-of-00004.safetensors +3 -0
transformer/model-00003-of-00004.safetensors +3 -0
transformer/model-00004-of-00004.safetensors +3 -0
transformer/model.safetensors.index.json +1085 -0
transformer/quantization_config.json +12 -0
vae/config.json +38 -0
vae/diffusion_pytorch_model.safetensors +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+tokenizer/tokenizer.json filter=lfs diff=lfs merge=lfs -text

model_index.json ADDED Viewed

	@@ -0,0 +1,25 @@

+{
+  "_class_name": "OvisImagePipeline",
+  "_diffusers_version": "0.36.0.dev0",
+  "_name_or_path": "/mnt/disk4/lvl/Ovis-Image-7B",
+  "scheduler": [
+    "diffusers",
+    "FlowMatchEulerDiscreteScheduler"
+  ],
+  "text_encoder": [
+    "transformers",
+    "Qwen3Model"
+  ],
+  "tokenizer": [
+    "transformers",
+    "Qwen2Tokenizer"
+  ],
+  "transformer": [
+    "diffusers",
+    "OvisImageTransformer2DModel"
+  ],
+  "vae": [
+    "diffusers",
+    "AutoencoderKL"
+  ]
+}

scheduler/scheduler_config.json ADDED Viewed

	@@ -0,0 +1,18 @@

+{
+  "_class_name": "FlowMatchEulerDiscreteScheduler",
+  "_diffusers_version": "0.37.0.dev0",
+  "base_image_seq_len": 256,
+  "base_shift": 0.5,
+  "invert_sigmas": false,
+  "max_image_seq_len": 4096,
+  "max_shift": 1.15,
+  "num_train_timesteps": 1000,
+  "shift": 3.0,
+  "shift_terminal": null,
+  "stochastic_sampling": false,
+  "time_shift_type": "exponential",
+  "use_beta_sigmas": false,
+  "use_dynamic_shifting": true,
+  "use_exponential_sigmas": false,
+  "use_karras_sigmas": false
+}

text_encoder/config.json ADDED Viewed

	@@ -0,0 +1,64 @@

+{
+  "_attn_implementation_autoset": true,
+  "architectures": [
+    "Qwen3Model"
+  ],
+  "attention_bias": false,
+  "attention_dropout": 0.0,
+  "bos_token_id": 151643,
+  "dtype": "bfloat16",
+  "eos_token_id": 151645,
+  "head_dim": 128,
+  "hidden_act": "silu",
+  "hidden_size": 2048,
+  "initializer_range": 0.02,
+  "intermediate_size": 6144,
+  "layer_types": [
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention",
+    "full_attention"
+  ],
+  "max_position_embeddings": 40960,
+  "max_window_layers": 28,
+  "model_type": "qwen3",
+  "num_attention_heads": 16,
+  "num_hidden_layers": 28,
+  "num_key_value_heads": 8,
+  "pad_token_id": null,
+  "rms_norm_eps": 1e-06,
+  "rope_parameters": {
+    "rope_theta": 1000000,
+    "rope_type": "default"
+  },
+  "sliding_window": null,
+  "tie_word_embeddings": true,
+  "transformers_version": "5.7.0",
+  "use_cache": true,
+  "use_sliding_window": false,
+  "vocab_size": 151936
+}

text_encoder/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd61165ab387530f73813cf5e1ac18819c535ea8b9a1111a7d87cc79543f5cd9
+size 3441183752

tokenizer/chat_template.jinja ADDED Viewed

	@@ -0,0 +1,10 @@

+{%- for message in messages %}{{- '<|im_start|>' + message.role + '
+'}}{%- if message.role == 'system' or message.role == 'user' %}{%- if message.content is string %}{{- message.content | replace('<image>', '') | replace('<video>', '') }}{%- else %}{%- for item in message.content %}{%- if item.type == 'text' and 'text' in item %}{{- item.text | replace('<image>', '') | replace('<video>', '') }}{%- elif item.type == 'image' %}{{- '<image>'}}{%- elif item.type == 'video' %}{{- '<video>'}}{%- else %}{{- raise_exception('Invalid content type. Supported types for system and user are text, image, video.')}}{%- endif %}{%- if not loop.last %}{{- '
+'}}{%- endif %}{%- endfor %}{%- endif %}{%- elif message.role == 'assistant' %}{%- set content = '' %}{%- if message.content is string %}{%- set content = message.content | replace('<image>', '') | replace('<video>', '') %}{%- else %}{%- for item in message.content %}{%- if item.type == 'text' and 'text' in item %}{%- set content = content ~ (item.text | replace('<image>', '') | replace('<video>', '')) %}{%- else %}{{- raise_exception('Invalid content type. Supported type for assistant is text.')}}{%- endif %}{%- endfor %}{%- endif %}{%- set content = content.split('</think>')[-1].lstrip('
+') %}{{- content }}{%- else %}{{- raise_exception('Invalid role. Supported roles are system, user, assistant.')}}{%- endif %}{{- '<|im_end|>
+'}}{%- endfor %}{%- if add_generation_prompt %}{{- '<|im_start|>assistant
+' }}{%- if enable_thinking is defined and enable_thinking is false %}{{- '<think>
+</think>
+' }}{%- endif %}{%- endif %}

tokenizer/tokenizer.json ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:33bc7e10f3893cca5d37bdc21b020361cb1ead2b56605f59fdfb0f7c0fe81f3c
+size 11422928

tokenizer/tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "add_prefix_space": false,
+  "backend": "tokenizers",
+  "bos_token": null,
+  "clean_up_tokenization_spaces": false,
+  "eos_token": "<|im_end|>",
+  "errors": "replace",
+  "is_local": true,
+  "local_files_only": false,
+  "model_max_length": 131072,
+  "pad_token": "<|endoftext|>",
+  "split_special_tokens": false,
+  "tokenizer_class": "Qwen2Tokenizer",
+  "unk_token": null
+}

transformer/config.json ADDED Viewed

	@@ -0,0 +1,30 @@

+{
+  "_class_name": "OvisImageTransformer2DModel",
+  "_diffusers_version": "0.36.0.dev0",
+  "_name_or_path": "/mnt/disk4/lvl/Ovis-Image-7B/transformer",
+  "attention_head_dim": 128,
+  "axes_dims_rope": [
+    16,
+    56,
+    56
+  ],
+  "in_channels": 64,
+  "joint_attention_dim": 2048,
+  "num_attention_heads": 24,
+  "num_layers": 6,
+  "num_single_layers": 27,
+  "out_channels": null,
+  "patch_size": 1,
+  "quantization_config": {
+    "autoround_version": "0.13.0",
+    "batch_size": 1,
+    "bits": 4,
+    "block_name_to_quantize": "transformer_blocks,single_transformer_blocks",
+    "data_type": "int",
+    "group_size": 128,
+    "nsamples": 64,
+    "packing_format": "auto_round:auto_gptq",
+    "quant_method": "auto-round",
+    "sym": true
+  }
+}

transformer/model-00001-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:41c644ad50fc2028d386afe76ae55d23059e904c83888c5536148c292cfdd3f7
+size 1060229568

transformer/model-00002-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:d4ccde8041d288dfdc3d9cd86cae07a5aabef1375a4b9b0f6805984c6fa739e0
+size 1069937984

transformer/model-00003-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6d5de5630637a801c97d2eb61ff80838350920e449a535c8e2d82c531129899d
+size 1045399264

transformer/model-00004-of-00004.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:502e35a22123ded86e969c749e05c719035a72ff0a5df01eca50064ed897580f
+size 709637512

transformer/model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,1085 @@

+{
+  "metadata": {
+    "format": "safetensors",
+    "total_shards": 4,
+    "total_parameters": 1018791744,
+    "total_size": 3885078144
+  },
+  "weight_map": {
+    "transformer_blocks.0.norm1.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1_context.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1_context.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1_context.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.norm1_context.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.norm_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.norm_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_q.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_q.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_q.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_q.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_k.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_k.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_k.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_k.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_v.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_v.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_v.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_v.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_out.0.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_out.0.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_out.0.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_out.0.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.norm_added_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.norm_added_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_q_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_q_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_q_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_q_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_k_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_k_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_k_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_k_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_v_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_v_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_v_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.add_v_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_add_out.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_add_out.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_add_out.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.attn.to_add_out.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.0.ff_context.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1_context.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1_context.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1_context.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.norm1_context.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.norm_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.norm_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_q.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_q.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_q.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_q.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_k.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_k.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_k.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_k.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_v.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_v.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_v.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_v.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_out.0.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_out.0.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_out.0.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_out.0.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.norm_added_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.norm_added_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_q_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_q_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_q_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_q_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_k_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_k_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_k_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_k_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_v_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_v_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_v_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.add_v_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_add_out.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_add_out.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_add_out.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.attn.to_add_out.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.1.ff_context.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1_context.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1_context.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1_context.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.norm1_context.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.norm_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.norm_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_q.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_q.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_q.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_q.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_k.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_k.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_k.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_k.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_v.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_v.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_v.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_v.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_out.0.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_out.0.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_out.0.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_out.0.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.norm_added_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.norm_added_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_q_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_q_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_q_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_q_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_k_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_k_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_k_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_k_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_v_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_v_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_v_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.add_v_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_add_out.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_add_out.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_add_out.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.attn.to_add_out.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.2.ff_context.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1_context.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1_context.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1_context.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.norm1_context.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.norm_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.norm_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_q.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_q.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_q.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_q.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_k.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_k.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_k.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_k.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_v.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_v.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_v.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_v.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_out.0.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_out.0.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_out.0.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_out.0.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.norm_added_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.norm_added_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_q_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_q_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_q_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_q_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_k_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_k_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_k_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_k_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_v_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_v_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_v_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.add_v_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_add_out.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_add_out.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_add_out.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.attn.to_add_out.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.3.ff_context.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1_context.linear.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1_context.linear.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1_context.linear.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.norm1_context.linear.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.norm_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.norm_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_q.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_q.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_q.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_q.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_k.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_k.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_k.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_k.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_v.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_v.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_v.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_v.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_out.0.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_out.0.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_out.0.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_out.0.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.norm_added_q.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.norm_added_k.weight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_q_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_q_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_q_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_q_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_k_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_k_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_k_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_k_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_v_proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_v_proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_v_proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.add_v_proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_add_out.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_add_out.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_add_out.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.attn.to_add_out.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.2.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.2.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.2.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff.net.2.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.0.proj.qweight": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.0.proj.qzeros": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.0.proj.scales": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.0.proj.bias": "model-00001-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.2.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.2.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.2.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.4.ff_context.net.2.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1.linear.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1.linear.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1.linear.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1.linear.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1_context.linear.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1_context.linear.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1_context.linear.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.norm1_context.linear.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_out.0.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_out.0.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_out.0.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_out.0.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.norm_added_q.weight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.norm_added_k.weight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_q_proj.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_q_proj.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_q_proj.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_q_proj.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_k_proj.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_k_proj.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_k_proj.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_k_proj.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_v_proj.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_v_proj.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_v_proj.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.add_v_proj.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_add_out.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_add_out.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_add_out.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.attn.to_add_out.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.0.proj.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.0.proj.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.0.proj.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.0.proj.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.2.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.2.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.2.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff.net.2.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.0.proj.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.0.proj.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.0.proj.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.0.proj.bias": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.2.qweight": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.2.qzeros": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.2.scales": "model-00002-of-00004.safetensors",
+    "transformer_blocks.5.ff_context.net.2.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.0.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.1.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.2.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.3.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.4.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.5.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.6.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_v.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_v.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_v.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.7.attn.to_v.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.norm.linear.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.norm.linear.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.norm.linear.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.norm.linear.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_mlp.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_mlp.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_mlp.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_mlp.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_out.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_out.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_out.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.proj_out.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.norm_q.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.norm_k.weight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_q.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_q.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_q.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_q.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_k.qweight": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_k.qzeros": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_k.scales": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_k.bias": "model-00002-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.8.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.9.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.10.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.11.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.12.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.13.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.14.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.15.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.16.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.17.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.18.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_mlp.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_mlp.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_mlp.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_mlp.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_out.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_out.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_out.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.proj_out.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.norm_q.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.norm_k.weight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_q.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_q.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_q.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_q.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_k.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_k.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_k.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_k.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_v.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_v.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_v.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.19.attn.to_v.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.20.norm.linear.qweight": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.20.norm.linear.qzeros": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.20.norm.linear.scales": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.20.norm.linear.bias": "model-00003-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.20.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.norm.linear.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.norm.linear.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.norm.linear.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.norm.linear.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.21.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.norm.linear.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.norm.linear.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.norm.linear.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.norm.linear.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.22.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.norm.linear.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.norm.linear.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.norm.linear.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.norm.linear.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.23.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.norm.linear.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.norm.linear.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.norm.linear.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.norm.linear.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.24.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.norm.linear.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.norm.linear.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.norm.linear.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.norm.linear.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.25.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.norm.linear.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.norm.linear.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.norm.linear.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.norm.linear.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_mlp.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_mlp.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_mlp.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_mlp.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_out.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_out.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_out.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.proj_out.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.norm_q.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.norm_k.weight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_q.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_q.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_q.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_q.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_k.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_k.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_k.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_k.bias": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_v.qweight": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_v.qzeros": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_v.scales": "model-00004-of-00004.safetensors",
+    "single_transformer_blocks.26.attn.to_v.bias": "model-00004-of-00004.safetensors",
+    "timestep_embedder.linear_1.weight": "model-00004-of-00004.safetensors",
+    "timestep_embedder.linear_1.bias": "model-00004-of-00004.safetensors",
+    "timestep_embedder.linear_2.weight": "model-00004-of-00004.safetensors",
+    "timestep_embedder.linear_2.bias": "model-00004-of-00004.safetensors",
+    "context_embedder_norm.weight": "model-00004-of-00004.safetensors",
+    "context_embedder.weight": "model-00004-of-00004.safetensors",
+    "context_embedder.bias": "model-00004-of-00004.safetensors",
+    "x_embedder.weight": "model-00004-of-00004.safetensors",
+    "x_embedder.bias": "model-00004-of-00004.safetensors",
+    "norm_out.linear.weight": "model-00004-of-00004.safetensors",
+    "norm_out.linear.bias": "model-00004-of-00004.safetensors",
+    "proj_out.weight": "model-00004-of-00004.safetensors",
+    "proj_out.bias": "model-00004-of-00004.safetensors"
+  }
+}

transformer/quantization_config.json ADDED Viewed

	@@ -0,0 +1,12 @@

+{
+  "bits": 4,
+  "data_type": "int",
+  "group_size": 128,
+  "sym": true,
+  "batch_size": 1,
+  "nsamples": 64,
+  "autoround_version": "0.13.0",
+  "block_name_to_quantize": "transformer_blocks,single_transformer_blocks",
+  "quant_method": "auto-round",
+  "packing_format": "auto_round:auto_gptq"
+}

vae/config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "_class_name": "AutoencoderKL",
+  "_diffusers_version": "0.37.0.dev0",
+  "_name_or_path": "/mnt/disk4/lvl/Ovis-Image-7B/vae",
+  "act_fn": "silu",
+  "block_out_channels": [
+    128,
+    256,
+    512,
+    512
+  ],
+  "down_block_types": [
+    "DownEncoderBlock2D",
+    "DownEncoderBlock2D",
+    "DownEncoderBlock2D",
+    "DownEncoderBlock2D"
+  ],
+  "force_upcast": true,
+  "in_channels": 3,
+  "latent_channels": 16,
+  "latents_mean": null,
+  "latents_std": null,
+  "layers_per_block": 2,
+  "mid_block_add_attention": true,
+  "norm_num_groups": 32,
+  "out_channels": 3,
+  "sample_size": 1024,
+  "scaling_factor": 0.3611,
+  "shift_factor": 0.1159,
+  "up_block_types": [
+    "UpDecoderBlock2D",
+    "UpDecoderBlock2D",
+    "UpDecoderBlock2D",
+    "UpDecoderBlock2D"
+  ],
+  "use_post_quant_conv": false,
+  "use_quant_conv": false
+}

vae/diffusion_pytorch_model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:f5b59a26851551b67ae1fe58d32e76486e1e812def4696a4bea97f16604d40a3
+size 167666902