kkail8 commited on Aug 19, 2025

Commit

25d8c0b

1 Parent(s): d6a96c4

Upload 40 files to dualffn_attnlora/

Browse files

Files changed (40) hide show

dualffn_attnlora/config.txt +233 -0
dualffn_attnlora/epoch000-global_step4500/lora/README.md +201 -0
dualffn_attnlora/epoch000-global_step4500/lora/adapter_config.json +38 -0
dualffn_attnlora/epoch000-global_step4500/lora/adapter_model.bin +3 -0
dualffn_attnlora/epoch000-global_step4500/lr_scheduler +0 -0
dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00001.bin +3 -0
dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00002.bin +3 -0
dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00003.bin +3 -0
dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00004.bin +3 -0
dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00005.bin +3 -0
dualffn_attnlora/epoch000-global_step4500/model/pytorch_model.bin.index.json +1469 -0
dualffn_attnlora/epoch000-global_step4500/running_states.json +6 -0
dualffn_attnlora/epoch000-global_step4500/sampler +0 -0
dualffn_attnlora/epoch001-global_step16000/lora/README.md +201 -0
dualffn_attnlora/epoch001-global_step16000/lora/adapter_config.json +38 -0
dualffn_attnlora/epoch001-global_step16000/lora/adapter_model.bin +3 -0
dualffn_attnlora/epoch001-global_step16000/lr_scheduler +0 -0
dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00001.bin +3 -0
dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00002.bin +3 -0
dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00003.bin +3 -0
dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00004.bin +3 -0
dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00005.bin +3 -0
dualffn_attnlora/epoch001-global_step16000/model/pytorch_model.bin.index.json +1469 -0
dualffn_attnlora/epoch001-global_step16000/running_states.json +6 -0
dualffn_attnlora/epoch001-global_step16000/sampler +0 -0
dualffn_attnlora/epoch001-global_step21000/lora/README.md +201 -0
dualffn_attnlora/epoch001-global_step21000/lora/adapter_config.json +38 -0
dualffn_attnlora/epoch001-global_step21000/lora/adapter_model.bin +3 -0
dualffn_attnlora/epoch001-global_step21000/lr_scheduler +0 -0
dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00001.bin +3 -0
dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00002.bin +3 -0
dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00003.bin +3 -0
dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00004.bin +3 -0
dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00005.bin +3 -0
dualffn_attnlora/epoch001-global_step21000/model/pytorch_model.bin.index.json +1469 -0
dualffn_attnlora/epoch001-global_step21000/running_states.json +6 -0
dualffn_attnlora/epoch001-global_step21000/sampler +0 -0
dualffn_attnlora/log.txt +0 -0
dualffn_attnlora/tensorboard/events.out.tfevents.1755194708.361b65dc6631.2576728.0 +3 -0
dualffn_attnlora/tensorboard/events.out.tfevents.1755267800.361b65dc6631.701156.0 +3 -0

dualffn_attnlora/config.txt ADDED Viewed

	@@ -0,0 +1,233 @@

+{
+    "dataset": {
+        "type": "VariableVideoAudioTextDataset",
+        "direct_load_video_cli": true,
+        "transform_name": "resize_crop",
+        "audio_transform_name": "mel_spec_audioldm2",
+        "default_video_fps": 16,
+        "scale_factor": 16,
+        "use_audio_in_video": true,
+        "data_path": "debug/meta/TAVGBench_train_140k.csv"
+    },
+    "load_text_features": false,
+    "bucket_config": {
+        "240p": {
+            "33": [
+                [
+                    1.0,
+                    1.0
+                ],
+                16
+            ],
+            "49": [
+                [
+                    1.0,
+                    0.4
+                ],
+                12
+            ],
+            "65": [
+                [
+                    1.0,
+                    0.3
+                ],
+                12
+            ],
+            "81": [
+                [
+                    1.0,
+                    0.2
+                ],
+                10
+            ]
+        },
+        "360p": {
+            "33": [
+                [
+                    0.5,
+                    0.5
+                ],
+                8
+            ],
+            "49": [
+                [
+                    0.5,
+                    0.3
+                ],
+                6
+            ],
+            "65": [
+                [
+                    0.5,
+                    0.2
+                ],
+                6
+            ],
+            "81": [
+                [
+                    0.5,
+                    0.2
+                ],
+                5
+            ]
+        },
+        "480p": {
+            "33": [
+                [
+                    0.5,
+                    0.3
+                ],
+                5
+            ],
+            "49": [
+                [
+                    1.0,
+                    0.2
+                ],
+                4
+            ],
+            "65": [
+                [
+                    1.0,
+                    0.2
+                ],
+                4
+            ],
+            "81": [
+                [
+                    1.0,
+                    0.1
+                ],
+                3
+            ]
+        }
+    },
+    "grad_checkpoint": true,
+    "num_workers": 16,
+    "num_bucket_build_workers": 8,
+    "dtype": "bf16",
+    "plugin": "zero2",
+    "video_weight_path": "./checkpoints/Wan2.1-T2V-1.3B/diffusion_pytorch_model.safetensors",
+    "audio_weight_path": "exps/audio/dual_ffn_no_attnlora/epoch017-global_step75000",
+    "model": {
+        "type": "Wan2_1_T2V_1_3B",
+        "weight_init_from": [
+            "./checkpoints/Wan2.1-T2V-1.3B/diffusion_pytorch_model.safetensors",
+            "exps/audio/dual_ffn_no_attnlora/epoch017-global_step75000"
+        ],
+        "model_type": "t2av",
+        "patch_size": [
+            1,
+            2,
+            2
+        ],
+        "dim": 1536,
+        "ffn_dim": 8960,
+        "freq_dim": 256,
+        "num_heads": 12,
+        "num_layers": 30,
+        "window_size": [
+            -1,
+            -1
+        ],
+        "qk_norm": true,
+        "cross_attn_norm": true,
+        "audio_patch_size": [
+            2,
+            2
+        ],
+        "audio_in_dim": 8,
+        "audio_out_dim": 8,
+        "audio_special_token": false,
+        "train_audio_specific_blocks": false,
+        "dual_ffn": true,
+        "init_from_video_branch": false,
+        "class_drop_prob": 0.1
+    },
+    "vae": {
+        "type": "Wan2_1_T2V_1_3B_VAE",
+        "from_pretrained": "./checkpoints/Wan2.1-T2V-1.3B",
+        "vae_checkpoint": "Wan2.1_VAE.pth",
+        "vae_stride": [
+            4,
+            8,
+            8
+        ]
+    },
+    "audio_vae": {
+        "type": "AudioLDM2",
+        "from_pretrained": "./checkpoints/audioldm2"
+    },
+    "text_encoder": {
+        "type": "Wan2_1_T2V_1_3B_t5_umt5",
+        "from_pretrained": "./checkpoints/Wan2.1-T2V-1.3B",
+        "t5_checkpoint": "models_t5_umt5-xxl-enc-bf16.pth",
+        "t5_tokenizer": "google/umt5-xxl",
+        "text_len": 512
+    },
+    "scheduler": {
+        "type": "rflow",
+        "use_timestep_transform": true,
+        "num_sampling_steps": 50,
+        "transform_scale": 5.0
+    },
+    "aes": null,
+    "flow": null,
+    "neg_prompt": "\u8272\u8c03\u8273\u4e3d\uff0c\u8fc7\u66dd\uff0c\u9759\u6001\uff0c\u7ec6\u8282\u6a21\u7cca\u4e0d\u6e05\uff0c\u5b57\u5e55\uff0c\u98ce\u683c\uff0c\u4f5c\u54c1\uff0c\u753b\u4f5c\uff0c\u753b\u9762\uff0c\u9759\u6b62\uff0c\u6574\u4f53\u53d1\u7070\uff0c\u6700\u5dee\u8d28\u91cf\uff0c\u4f4e\u8d28\u91cf\uff0cJPEG\u538b\u7f29\u6b8b\u7559\uff0c\u4e11\u964b\u7684\uff0c\u6b8b\u7f3a\u7684\uff0c\u591a\u4f59\u7684\u624b\u6307\uff0c\u753b\u5f97\u4e0d\u597d\u7684\u624b\u90e8\uff0c\u753b\u5f97\u4e0d\u597d\u7684\u8138\u90e8\uff0c\u7578\u5f62\u7684\uff0c\u6bc1\u5bb9\u7684\uff0c\u5f62\u6001\u7578\u5f62\u7684\u80a2\u4f53\uff0c\u624b\u6307\u878d\u5408\uff0c\u9759\u6b62\u4e0d\u52a8\u7684\u753b\u9762\uff0c\u6742\u4e71\u7684\u80cc\u666f\uff0c\u4e09\u6761\u817f\uff0c\u80cc\u666f\u4eba\u5f88\u591a\uff0c\u5012\u7740\u8d70\uff0c\u4f4e\u97f3\u8d28\uff0c\u5dee\u97f3\u8d28\uff0c\u6700\u5dee\u97f3\u8d28\uff0c\u566a\u97f3\uff0c\u5931\u771f\u7684\uff0c\u7834\u97f3\uff0c\u524a\u6ce2\u5931\u771f\uff0c\u6570\u5b57\u7455\u75b5\uff0c\u58f0\u97f3\u6545\u969c\uff0c\u4e0d\u81ea\u7136\u7684\uff0c\u523a\u8033\u7684\uff0c\u5c16\u9510\u7684\uff0c\u5e95\u566a\uff0c\u8fc7\u591a\u6df7\u54cd\uff0c\u8fc7\u591a\u56de\u58f0\uff0c\u7a81\u5140\u7684\u526a\u8f91\uff0c\u4e0d\u81ea\u7136\u7684\u6de1\u51fa\uff0c\u5f55\u97f3\u8d28\u91cf\u5dee\uff0c\u4e1a\u4f59\u5f55\u97f3",
+    "lora_enabled": true,
+    "lora_r": 128,
+    "lora_alpha": 256,
+    "lora_target_modules": [
+        "self_attn.q",
+        "self_attn.k",
+        "self_attn.v",
+        "self_attn.o",
+        "cross_attn.q",
+        "cross_attn.k",
+        "cross_attn.v",
+        "cross_attn.o"
+    ],
+    "lora_dropout": 0,
+    "seed": 42,
+    "outputs": "./outputs/audio_video",
+    "wandb": false,
+    "epochs": 10,
+    "log_every": 10,
+    "ckpt_every": 250,
+    "save_total_limit": 2,
+    "load": null,
+    "grad_clip": 1.0,
+    "lr": 0.0001,
+    "ema_decay": 0.99,
+    "adam_eps": 1e-15,
+    "warmup_steps": 1000,
+    "sampling_rate": 16000,
+    "mel_bins": 64,
+    "audio_cfg": {
+        "preprocessing": {
+            "audio": {
+                "sampling_rate": 16000,
+                "max_wav_value": 32768.0,
+                "duration": 10.24,
+                "scale_factor": 8
+            },
+            "stft": {
+                "filter_length": 1024,
+                "hop_length": 160,
+                "win_length": 1024
+            },
+            "mel": {
+                "n_mel_channels": 64,
+                "mel_fmin": 0,
+                "mel_fmax": 8000
+            }
+        },
+        "augmentation": {
+            "mixup": 0.0
+        }
+    },
+    "config": "configs/wan2.1/train/stage2_audio_video.py",
+    "start_from_scratch": false,
+    "record_time": false,
+    "port": 29500
+}

dualffn_attnlora/epoch000-global_step4500/lora/README.md ADDED Viewed

	@@ -0,0 +1,201 @@

+---
+library_name: peft
+---
+# Model Card for Model ID
+<!-- Provide a quick summary of what the model is/does. -->
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+- **Developed by:** [More Information Needed]
+- **Funded by [optional]:** [More Information Needed]
+- **Shared by [optional]:** [More Information Needed]
+- **Model type:** [More Information Needed]
+- **Language(s) (NLP):** [More Information Needed]
+- **License:** [More Information Needed]
+- **Finetuned from model [optional]:** [More Information Needed]
+### Model Sources [optional]
+<!-- Provide the basic links for the model. -->
+- **Repository:** [More Information Needed]
+- **Paper [optional]:** [More Information Needed]
+- **Demo [optional]:** [More Information Needed]
+## Uses
+<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+### Direct Use
+<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
+[More Information Needed]
+### Downstream Use [optional]
+<!-- This section is for the model use when fine-tuned for a task, or when plugged into a larger ecosystem/app -->
+[More Information Needed]
+### Out-of-Scope Use
+<!-- This section addresses misuse, malicious use, and uses that the model will not work well for. -->
+[More Information Needed]
+## Bias, Risks, and Limitations
+<!-- This section is meant to convey both technical and sociotechnical limitations. -->
+[More Information Needed]
+### Recommendations
+<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
+Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
+## How to Get Started with the Model
+Use the code below to get started with the model.
+[More Information Needed]
+## Training Details
+### Training Data
+<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
+[More Information Needed]
+### Training Procedure
+<!-- This relates heavily to the Technical Specifications. Content here should link to that section when it is relevant to the training procedure. -->
+#### Preprocessing [optional]
+[More Information Needed]
+#### Training Hyperparameters
+- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
+#### Speeds, Sizes, Times [optional]
+<!-- This section provides information about throughput, start/end time, checkpoint size if relevant, etc. -->
+[More Information Needed]
+## Evaluation
+<!-- This section describes the evaluation protocols and provides the results. -->
+### Testing Data, Factors & Metrics
+#### Testing Data
+<!-- This should link to a Dataset Card if possible. -->
+[More Information Needed]
+#### Factors
+<!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
+[More Information Needed]
+#### Metrics
+<!-- These are the evaluation metrics being used, ideally with a description of why. -->
+[More Information Needed]
+### Results
+[More Information Needed]
+#### Summary
+## Model Examination [optional]
+<!-- Relevant interpretability work for the model goes here -->
+[More Information Needed]
+## Environmental Impact
+<!-- Total emissions (in grams of CO2eq) and additional considerations, such as electricity usage, go here. Edit the suggested text below accordingly -->
+Carbon emissions can be estimated using the [Machine Learning Impact calculator](https://mlco2.github.io/impact#compute) presented in [Lacoste et al. (2019)](https://arxiv.org/abs/1910.09700).
+- **Hardware Type:** [More Information Needed]
+- **Hours used:** [More Information Needed]
+- **Cloud Provider:** [More Information Needed]
+- **Compute Region:** [More Information Needed]
+- **Carbon Emitted:** [More Information Needed]
+## Technical Specifications [optional]
+### Model Architecture and Objective
+[More Information Needed]
+### Compute Infrastructure
+[More Information Needed]
+#### Hardware
+[More Information Needed]
+#### Software
+[More Information Needed]
+## Citation [optional]
+<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
+**BibTeX:**
+[More Information Needed]
+**APA:**
+[More Information Needed]
+## Glossary [optional]
+<!-- If relevant, include terms and calculations in this section that can help readers understand the model or model card. -->
+[More Information Needed]
+## More Information [optional]
+[More Information Needed]
+## Model Card Authors [optional]
+[More Information Needed]
+## Model Card Contact
+[More Information Needed]
+### Framework versions
+- PEFT 0.12.0

dualffn_attnlora/epoch000-global_step4500/lora/adapter_config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": {
+    "base_model_class": "WanModel",
+    "parent_library": "javisdit.models.wan.modules.model"
+  },
+  "base_model_name_or_path": null,
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 256,
+  "lora_dropout": 0,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "cross_attn.o",
+    "cross_attn.v",
+    "self_attn.q",
+    "cross_attn.q",
+    "self_attn.v",
+    "cross_attn.k",
+    "self_attn.k",
+    "self_attn.o"
+  ],
+  "task_type": null,
+  "use_dora": false,
+  "use_rslora": false
+}

dualffn_attnlora/epoch000-global_step4500/lora/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5660dada895f7e8375b1f3384953fdc9057f351e2e48a22d9288ecfc717a47b2
+size 188906250

dualffn_attnlora/epoch000-global_step4500/lr_scheduler ADDED Viewed

Binary file (1.01 kB). View file

dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00001.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:00b9ff36adbfc8df7f036fa453c35adfe7d60387facf724fd2007e9866d054fe
+size 1063199704

dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00002.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0cda6556a1bdd2ee31970e0e326f8f12ccefd563f4b2b119825318af3b96d825
+size 1052337966

dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00003.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:4ab8901f7992a4d340bb5e949f06f644bd6aa5d9598e9105c6fef3b270210efa
+size 1073578482

dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:93503a5e27eae09d5b4ead072d53a47014369bbc571c3e368ccfe83becfe1be7
+size 1069650054

dualffn_attnlora/epoch000-global_step4500/model/pytorch_model-00005.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:3fbba2e178ac45fa4cf776425591d31eb3f9bfef886217e07161ff99635338a6
+size 435227208

dualffn_attnlora/epoch000-global_step4500/model/pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,1469 @@

+{
+  "metadata": {
+    "total_size": 4476.091003417969
+  },
+  "weight_map": {
+    "audio_patch_embedding.weight": "pytorch_model-00001.bin",
+    "audio_patch_embedding.bias": "pytorch_model-00001.bin",
+    "audio_head.modulation": "pytorch_model-00001.bin",
+    "audio_head.head.weight": "pytorch_model-00001.bin",
+    "audio_head.head.bias": "pytorch_model-00001.bin",
+    "patch_embedding.weight": "pytorch_model-00001.bin",
+    "patch_embedding.bias": "pytorch_model-00001.bin",
+    "head.modulation": "pytorch_model-00001.bin",
+    "head.head.weight": "pytorch_model-00001.bin",
+    "head.head.bias": "pytorch_model-00001.bin",
+    "text_embedding.0.weight": "pytorch_model-00001.bin",
+    "text_embedding.0.bias": "pytorch_model-00001.bin",
+    "text_embedding.2.weight": "pytorch_model-00001.bin",
+    "text_embedding.2.bias": "pytorch_model-00001.bin",
+    "time_embedding.0.weight": "pytorch_model-00001.bin",
+    "time_embedding.0.bias": "pytorch_model-00001.bin",
+    "time_embedding.2.weight": "pytorch_model-00001.bin",
+    "time_embedding.2.bias": "pytorch_model-00001.bin",
+    "time_projection.1.weight": "pytorch_model-00001.bin",
+    "time_projection.1.bias": "pytorch_model-00001.bin",
+    "audio_time_projection.1.weight": "pytorch_model-00001.bin",
+    "audio_time_projection.1.bias": "pytorch_model-00001.bin",
+    "blocks.0.modulation": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.0.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.0.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.0.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.1.modulation": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.1.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.1.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.1.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.2.modulation": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.2.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.2.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.2.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.3.modulation": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.3.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.3.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.3.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.4.modulation": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.4.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.4.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.4.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.5.modulation": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.5.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.5.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.5.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.6.modulation": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.6.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.6.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.6.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.6.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.6.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.6.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.7.modulation": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.7.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.7.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.7.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.8.modulation": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.8.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.8.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.8.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.9.modulation": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.9.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.9.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.9.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.10.modulation": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.10.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.10.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.10.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.11.modulation": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.11.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.11.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.11.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.12.modulation": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.12.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.12.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.12.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.13.modulation": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.13.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.13.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.13.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.13.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.13.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.13.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.14.modulation": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.14.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.14.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.14.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.15.modulation": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.15.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.15.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.15.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.16.modulation": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.16.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.16.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.16.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.17.modulation": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.17.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.17.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.17.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.18.modulation": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.18.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.18.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.18.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.19.modulation": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.19.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.19.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.19.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.20.modulation": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.20.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.20.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.20.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.21.modulation": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.21.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.21.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.21.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.22.modulation": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.22.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.22.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.22.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.23.modulation": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.23.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.23.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.23.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.24.modulation": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.24.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.24.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.24.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.25.modulation": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.25.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.25.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.25.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.26.modulation": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.26.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.26.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.26.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.27.modulation": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.27.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.27.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.27.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_modulation.param": "pytorch_model-00005.bin",
+    "blocks.28.modulation": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.28.norm3.weight": "pytorch_model-00005.bin",
+    "blocks.28.norm3.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.28.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_modulation.param": "pytorch_model-00005.bin",
+    "blocks.29.modulation": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.29.norm3.weight": "pytorch_model-00005.bin",
+    "blocks.29.norm3.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.29.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_modulation.param": "pytorch_model-00005.bin"
+  }
+}

dualffn_attnlora/epoch000-global_step4500/running_states.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "epoch": 0,
+    "step": 4500,
+    "global_step": 4500,
+    "batch_size": null
+}

dualffn_attnlora/epoch000-global_step4500/sampler ADDED Viewed

Binary file (928 Bytes). View file

dualffn_attnlora/epoch001-global_step16000/lora/README.md ADDED Viewed

	@@ -0,0 +1,201 @@

+---
+library_name: peft
+---
+# Model Card for Model ID
+<!-- Provide a quick summary of what the model is/does. -->
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+- **Developed by:** [More Information Needed]
+- **Funded by [optional]:** [More Information Needed]
+- **Shared by [optional]:** [More Information Needed]
+- **Model type:** [More Information Needed]
+- **Language(s) (NLP):** [More Information Needed]
+- **License:** [More Information Needed]
+- **Finetuned from model [optional]:** [More Information Needed]
+### Model Sources [optional]
+<!-- Provide the basic links for the model. -->
+- **Repository:** [More Information Needed]
+- **Paper [optional]:** [More Information Needed]
+- **Demo [optional]:** [More Information Needed]
+## Uses
+<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+### Direct Use
+<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
+[More Information Needed]
+### Downstream Use [optional]
+<!-- This section is for the model use when fine-tuned for a task, or when plugged into a larger ecosystem/app -->
+[More Information Needed]
+### Out-of-Scope Use
+<!-- This section addresses misuse, malicious use, and uses that the model will not work well for. -->
+[More Information Needed]
+## Bias, Risks, and Limitations
+<!-- This section is meant to convey both technical and sociotechnical limitations. -->
+[More Information Needed]
+### Recommendations
+<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
+Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
+## How to Get Started with the Model
+Use the code below to get started with the model.
+[More Information Needed]
+## Training Details
+### Training Data
+<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
+[More Information Needed]
+### Training Procedure
+<!-- This relates heavily to the Technical Specifications. Content here should link to that section when it is relevant to the training procedure. -->
+#### Preprocessing [optional]
+[More Information Needed]
+#### Training Hyperparameters
+- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
+#### Speeds, Sizes, Times [optional]
+<!-- This section provides information about throughput, start/end time, checkpoint size if relevant, etc. -->
+[More Information Needed]
+## Evaluation
+<!-- This section describes the evaluation protocols and provides the results. -->
+### Testing Data, Factors & Metrics
+#### Testing Data
+<!-- This should link to a Dataset Card if possible. -->
+[More Information Needed]
+#### Factors
+<!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
+[More Information Needed]
+#### Metrics
+<!-- These are the evaluation metrics being used, ideally with a description of why. -->
+[More Information Needed]
+### Results
+[More Information Needed]
+#### Summary
+## Model Examination [optional]
+<!-- Relevant interpretability work for the model goes here -->
+[More Information Needed]
+## Environmental Impact
+<!-- Total emissions (in grams of CO2eq) and additional considerations, such as electricity usage, go here. Edit the suggested text below accordingly -->
+Carbon emissions can be estimated using the [Machine Learning Impact calculator](https://mlco2.github.io/impact#compute) presented in [Lacoste et al. (2019)](https://arxiv.org/abs/1910.09700).
+- **Hardware Type:** [More Information Needed]
+- **Hours used:** [More Information Needed]
+- **Cloud Provider:** [More Information Needed]
+- **Compute Region:** [More Information Needed]
+- **Carbon Emitted:** [More Information Needed]
+## Technical Specifications [optional]
+### Model Architecture and Objective
+[More Information Needed]
+### Compute Infrastructure
+[More Information Needed]
+#### Hardware
+[More Information Needed]
+#### Software
+[More Information Needed]
+## Citation [optional]
+<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
+**BibTeX:**
+[More Information Needed]
+**APA:**
+[More Information Needed]
+## Glossary [optional]
+<!-- If relevant, include terms and calculations in this section that can help readers understand the model or model card. -->
+[More Information Needed]
+## More Information [optional]
+[More Information Needed]
+## Model Card Authors [optional]
+[More Information Needed]
+## Model Card Contact
+[More Information Needed]
+### Framework versions
+- PEFT 0.12.0

dualffn_attnlora/epoch001-global_step16000/lora/adapter_config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": {
+    "base_model_class": "WanModel",
+    "parent_library": "javisdit.models.wan.modules.model"
+  },
+  "base_model_name_or_path": null,
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 256,
+  "lora_dropout": 0,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "cross_attn.k",
+    "self_attn.q",
+    "cross_attn.o",
+    "cross_attn.v",
+    "self_attn.k",
+    "self_attn.v",
+    "self_attn.o",
+    "cross_attn.q"
+  ],
+  "task_type": null,
+  "use_dora": false,
+  "use_rslora": false
+}

dualffn_attnlora/epoch001-global_step16000/lora/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:182151dd46dca51e880de1c784bde5bd057fcd792e4ea3943ecee6d16bbdbd8e
+size 188906250

dualffn_attnlora/epoch001-global_step16000/lr_scheduler ADDED Viewed

Binary file (1.01 kB). View file

dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00001.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:69ce4887cbfe234c0fac5baadd2d97a70e1f56ac7a72e47cd8741fe6ef5596ca
+size 1063199704

dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00002.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:50334920ec815fa33a81b22ed030328a4de798d1137f70b7c57c8893f16c1f89
+size 1052337966

dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00003.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8dfc53cfd8758bbfeadf3f3d4de7d215d5e9131d2d7105630ff8ebf4f62d3106
+size 1073578482

dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2430592bd48f7b74555803b2a7809ed5b953d796bc719f1a0f0f37627cb7fc58
+size 1069650054

dualffn_attnlora/epoch001-global_step16000/model/pytorch_model-00005.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:bd120006292351ed34ca8a55620437a2846dfbb3679b81e70a152813d9dd7218
+size 435227208

dualffn_attnlora/epoch001-global_step16000/model/pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,1469 @@

+{
+  "metadata": {
+    "total_size": 4476.091003417969
+  },
+  "weight_map": {
+    "audio_patch_embedding.weight": "pytorch_model-00001.bin",
+    "audio_patch_embedding.bias": "pytorch_model-00001.bin",
+    "audio_head.modulation": "pytorch_model-00001.bin",
+    "audio_head.head.weight": "pytorch_model-00001.bin",
+    "audio_head.head.bias": "pytorch_model-00001.bin",
+    "patch_embedding.weight": "pytorch_model-00001.bin",
+    "patch_embedding.bias": "pytorch_model-00001.bin",
+    "head.modulation": "pytorch_model-00001.bin",
+    "head.head.weight": "pytorch_model-00001.bin",
+    "head.head.bias": "pytorch_model-00001.bin",
+    "text_embedding.0.weight": "pytorch_model-00001.bin",
+    "text_embedding.0.bias": "pytorch_model-00001.bin",
+    "text_embedding.2.weight": "pytorch_model-00001.bin",
+    "text_embedding.2.bias": "pytorch_model-00001.bin",
+    "time_embedding.0.weight": "pytorch_model-00001.bin",
+    "time_embedding.0.bias": "pytorch_model-00001.bin",
+    "time_embedding.2.weight": "pytorch_model-00001.bin",
+    "time_embedding.2.bias": "pytorch_model-00001.bin",
+    "time_projection.1.weight": "pytorch_model-00001.bin",
+    "time_projection.1.bias": "pytorch_model-00001.bin",
+    "audio_time_projection.1.weight": "pytorch_model-00001.bin",
+    "audio_time_projection.1.bias": "pytorch_model-00001.bin",
+    "blocks.0.modulation": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.0.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.0.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.0.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.1.modulation": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.1.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.1.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.1.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.2.modulation": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.2.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.2.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.2.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.3.modulation": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.3.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.3.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.3.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.4.modulation": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.4.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.4.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.4.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.5.modulation": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.5.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.5.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.5.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.6.modulation": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.6.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.6.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.6.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.6.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.6.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.6.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.7.modulation": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.7.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.7.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.7.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.8.modulation": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.8.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.8.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.8.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.9.modulation": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.9.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.9.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.9.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.10.modulation": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.10.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.10.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.10.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.11.modulation": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.11.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.11.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.11.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.12.modulation": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.12.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.12.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.12.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.13.modulation": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.13.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.13.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.13.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.13.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.13.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.13.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.14.modulation": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.14.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.14.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.14.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.15.modulation": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.15.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.15.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.15.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.16.modulation": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.16.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.16.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.16.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.17.modulation": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.17.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.17.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.17.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.18.modulation": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.18.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.18.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.18.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.19.modulation": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.19.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.19.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.19.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.20.modulation": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.20.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.20.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.20.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.21.modulation": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.21.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.21.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.21.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.22.modulation": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.22.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.22.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.22.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.23.modulation": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.23.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.23.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.23.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.24.modulation": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.24.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.24.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.24.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.25.modulation": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.25.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.25.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.25.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.26.modulation": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.26.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.26.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.26.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.27.modulation": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.27.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.27.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.27.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_modulation.param": "pytorch_model-00005.bin",
+    "blocks.28.modulation": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.28.norm3.weight": "pytorch_model-00005.bin",
+    "blocks.28.norm3.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.28.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_modulation.param": "pytorch_model-00005.bin",
+    "blocks.29.modulation": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.29.norm3.weight": "pytorch_model-00005.bin",
+    "blocks.29.norm3.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.29.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_modulation.param": "pytorch_model-00005.bin"
+  }
+}

dualffn_attnlora/epoch001-global_step16000/running_states.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "epoch": 1,
+    "step": 5443,
+    "global_step": 16000,
+    "batch_size": null
+}

dualffn_attnlora/epoch001-global_step16000/sampler ADDED Viewed

Binary file (928 Bytes). View file

dualffn_attnlora/epoch001-global_step21000/lora/README.md ADDED Viewed

	@@ -0,0 +1,201 @@

+---
+library_name: peft
+---
+# Model Card for Model ID
+<!-- Provide a quick summary of what the model is/does. -->
+## Model Details
+### Model Description
+<!-- Provide a longer summary of what this model is. -->
+- **Developed by:** [More Information Needed]
+- **Funded by [optional]:** [More Information Needed]
+- **Shared by [optional]:** [More Information Needed]
+- **Model type:** [More Information Needed]
+- **Language(s) (NLP):** [More Information Needed]
+- **License:** [More Information Needed]
+- **Finetuned from model [optional]:** [More Information Needed]
+### Model Sources [optional]
+<!-- Provide the basic links for the model. -->
+- **Repository:** [More Information Needed]
+- **Paper [optional]:** [More Information Needed]
+- **Demo [optional]:** [More Information Needed]
+## Uses
+<!-- Address questions around how the model is intended to be used, including the foreseeable users of the model and those affected by the model. -->
+### Direct Use
+<!-- This section is for the model use without fine-tuning or plugging into a larger ecosystem/app. -->
+[More Information Needed]
+### Downstream Use [optional]
+<!-- This section is for the model use when fine-tuned for a task, or when plugged into a larger ecosystem/app -->
+[More Information Needed]
+### Out-of-Scope Use
+<!-- This section addresses misuse, malicious use, and uses that the model will not work well for. -->
+[More Information Needed]
+## Bias, Risks, and Limitations
+<!-- This section is meant to convey both technical and sociotechnical limitations. -->
+[More Information Needed]
+### Recommendations
+<!-- This section is meant to convey recommendations with respect to the bias, risk, and technical limitations. -->
+Users (both direct and downstream) should be made aware of the risks, biases and limitations of the model. More information needed for further recommendations.
+## How to Get Started with the Model
+Use the code below to get started with the model.
+[More Information Needed]
+## Training Details
+### Training Data
+<!-- This should link to a Dataset Card, perhaps with a short stub of information on what the training data is all about as well as documentation related to data pre-processing or additional filtering. -->
+[More Information Needed]
+### Training Procedure
+<!-- This relates heavily to the Technical Specifications. Content here should link to that section when it is relevant to the training procedure. -->
+#### Preprocessing [optional]
+[More Information Needed]
+#### Training Hyperparameters
+- **Training regime:** [More Information Needed] <!--fp32, fp16 mixed precision, bf16 mixed precision, bf16 non-mixed precision, fp16 non-mixed precision, fp8 mixed precision -->
+#### Speeds, Sizes, Times [optional]
+<!-- This section provides information about throughput, start/end time, checkpoint size if relevant, etc. -->
+[More Information Needed]
+## Evaluation
+<!-- This section describes the evaluation protocols and provides the results. -->
+### Testing Data, Factors & Metrics
+#### Testing Data
+<!-- This should link to a Dataset Card if possible. -->
+[More Information Needed]
+#### Factors
+<!-- These are the things the evaluation is disaggregating by, e.g., subpopulations or domains. -->
+[More Information Needed]
+#### Metrics
+<!-- These are the evaluation metrics being used, ideally with a description of why. -->
+[More Information Needed]
+### Results
+[More Information Needed]
+#### Summary
+## Model Examination [optional]
+<!-- Relevant interpretability work for the model goes here -->
+[More Information Needed]
+## Environmental Impact
+<!-- Total emissions (in grams of CO2eq) and additional considerations, such as electricity usage, go here. Edit the suggested text below accordingly -->
+Carbon emissions can be estimated using the [Machine Learning Impact calculator](https://mlco2.github.io/impact#compute) presented in [Lacoste et al. (2019)](https://arxiv.org/abs/1910.09700).
+- **Hardware Type:** [More Information Needed]
+- **Hours used:** [More Information Needed]
+- **Cloud Provider:** [More Information Needed]
+- **Compute Region:** [More Information Needed]
+- **Carbon Emitted:** [More Information Needed]
+## Technical Specifications [optional]
+### Model Architecture and Objective
+[More Information Needed]
+### Compute Infrastructure
+[More Information Needed]
+#### Hardware
+[More Information Needed]
+#### Software
+[More Information Needed]
+## Citation [optional]
+<!-- If there is a paper or blog post introducing the model, the APA and Bibtex information for that should go in this section. -->
+**BibTeX:**
+[More Information Needed]
+**APA:**
+[More Information Needed]
+## Glossary [optional]
+<!-- If relevant, include terms and calculations in this section that can help readers understand the model or model card. -->
+[More Information Needed]
+## More Information [optional]
+[More Information Needed]
+## Model Card Authors [optional]
+[More Information Needed]
+## Model Card Contact
+[More Information Needed]
+### Framework versions
+- PEFT 0.12.0

dualffn_attnlora/epoch001-global_step21000/lora/adapter_config.json ADDED Viewed

	@@ -0,0 +1,38 @@

+{
+  "alpha_pattern": {},
+  "auto_mapping": {
+    "base_model_class": "WanModel",
+    "parent_library": "javisdit.models.wan.modules.model"
+  },
+  "base_model_name_or_path": null,
+  "bias": "none",
+  "fan_in_fan_out": false,
+  "inference_mode": true,
+  "init_lora_weights": true,
+  "layer_replication": null,
+  "layers_pattern": null,
+  "layers_to_transform": null,
+  "loftq_config": {},
+  "lora_alpha": 256,
+  "lora_dropout": 0,
+  "megatron_config": null,
+  "megatron_core": "megatron.core",
+  "modules_to_save": null,
+  "peft_type": "LORA",
+  "r": 128,
+  "rank_pattern": {},
+  "revision": null,
+  "target_modules": [
+    "cross_attn.k",
+    "self_attn.q",
+    "cross_attn.o",
+    "cross_attn.v",
+    "self_attn.k",
+    "self_attn.v",
+    "self_attn.o",
+    "cross_attn.q"
+  ],
+  "task_type": null,
+  "use_dora": false,
+  "use_rslora": false
+}

dualffn_attnlora/epoch001-global_step21000/lora/adapter_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:631b5398fd2457e4137b00007a2a787196572e0cf88324f065d8e0d173b9e450
+size 188906250

dualffn_attnlora/epoch001-global_step21000/lr_scheduler ADDED Viewed

Binary file (1.01 kB). View file

dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00001.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d711c7a4eaf69224b2cff149b99eee1409a23dc52780c9b84f7637608ae8a7a
+size 1063199704

dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00002.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:165086859f93a5a3b36bb9233600e714bbf520eb68d2a86ddbb961caec8166b9
+size 1052337966

dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00003.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d219ef678d624ea543d1667056afe794a391736b3be8c4d1b401b2f4c85c339
+size 1073578482

dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00004.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c3ffd4891a3339a6ccc519946b125d5f7bea8c322b0fd05bc836fd324b90615c
+size 1069650054

dualffn_attnlora/epoch001-global_step21000/model/pytorch_model-00005.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ef88df7cc24b790b8160224c874f13710d870fa501c4681ba683315785771a6f
+size 435227208

dualffn_attnlora/epoch001-global_step21000/model/pytorch_model.bin.index.json ADDED Viewed

	@@ -0,0 +1,1469 @@

+{
+  "metadata": {
+    "total_size": 4476.091003417969
+  },
+  "weight_map": {
+    "audio_patch_embedding.weight": "pytorch_model-00001.bin",
+    "audio_patch_embedding.bias": "pytorch_model-00001.bin",
+    "audio_head.modulation": "pytorch_model-00001.bin",
+    "audio_head.head.weight": "pytorch_model-00001.bin",
+    "audio_head.head.bias": "pytorch_model-00001.bin",
+    "patch_embedding.weight": "pytorch_model-00001.bin",
+    "patch_embedding.bias": "pytorch_model-00001.bin",
+    "head.modulation": "pytorch_model-00001.bin",
+    "head.head.weight": "pytorch_model-00001.bin",
+    "head.head.bias": "pytorch_model-00001.bin",
+    "text_embedding.0.weight": "pytorch_model-00001.bin",
+    "text_embedding.0.bias": "pytorch_model-00001.bin",
+    "text_embedding.2.weight": "pytorch_model-00001.bin",
+    "text_embedding.2.bias": "pytorch_model-00001.bin",
+    "time_embedding.0.weight": "pytorch_model-00001.bin",
+    "time_embedding.0.bias": "pytorch_model-00001.bin",
+    "time_embedding.2.weight": "pytorch_model-00001.bin",
+    "time_embedding.2.bias": "pytorch_model-00001.bin",
+    "time_projection.1.weight": "pytorch_model-00001.bin",
+    "time_projection.1.bias": "pytorch_model-00001.bin",
+    "audio_time_projection.1.weight": "pytorch_model-00001.bin",
+    "audio_time_projection.1.bias": "pytorch_model-00001.bin",
+    "blocks.0.modulation": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.0.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.0.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.0.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.0.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.0.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.0.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.0.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.0.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.1.modulation": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.1.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.1.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.1.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.1.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.1.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.1.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.1.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.1.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.2.modulation": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.2.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.2.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.2.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.2.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.2.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.2.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.2.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.2.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.3.modulation": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.3.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.3.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.3.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.3.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.3.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.3.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.3.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.3.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.4.modulation": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.4.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.4.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.4.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.4.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.4.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.4.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.4.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.4.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.5.modulation": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.5.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.5.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.5.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.5.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.5.ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.5.ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.2.weight": "pytorch_model-00001.bin",
+    "blocks.5.audio_ffn.2.bias": "pytorch_model-00001.bin",
+    "blocks.5.audio_modulation.param": "pytorch_model-00001.bin",
+    "blocks.6.modulation": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.6.self_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.6.norm3.weight": "pytorch_model-00001.bin",
+    "blocks.6.norm3.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.q.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.k.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.v.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.bias": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.lora_A.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.o.lora_B.default.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.norm_q.weight": "pytorch_model-00001.bin",
+    "blocks.6.cross_attn.norm_k.weight": "pytorch_model-00001.bin",
+    "blocks.6.ffn.0.weight": "pytorch_model-00001.bin",
+    "blocks.6.ffn.0.bias": "pytorch_model-00001.bin",
+    "blocks.6.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.6.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.6.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.6.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.7.modulation": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.7.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.7.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.7.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.7.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.7.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.7.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.7.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.7.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.8.modulation": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.8.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.8.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.8.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.8.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.8.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.8.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.8.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.8.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.9.modulation": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.9.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.9.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.9.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.9.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.9.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.9.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.9.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.9.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.10.modulation": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.10.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.10.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.10.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.10.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.10.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.10.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.10.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.10.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.11.modulation": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.11.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.11.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.11.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.11.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.11.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.11.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.11.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.11.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.12.modulation": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.12.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.12.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.12.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.12.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.12.ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.12.ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.0.weight": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.0.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.2.weight": "pytorch_model-00002.bin",
+    "blocks.12.audio_ffn.2.bias": "pytorch_model-00002.bin",
+    "blocks.12.audio_modulation.param": "pytorch_model-00002.bin",
+    "blocks.13.modulation": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.13.self_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.13.norm3.weight": "pytorch_model-00002.bin",
+    "blocks.13.norm3.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.q.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.k.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.v.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.bias": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.lora_A.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.o.lora_B.default.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.norm_q.weight": "pytorch_model-00002.bin",
+    "blocks.13.cross_attn.norm_k.weight": "pytorch_model-00002.bin",
+    "blocks.13.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.13.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.13.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.13.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.13.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.13.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.14.modulation": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.14.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.14.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.14.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.14.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.14.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.14.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.14.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.14.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.15.modulation": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.15.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.15.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.15.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.15.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.15.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.15.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.15.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.15.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.16.modulation": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.16.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.16.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.16.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.16.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.16.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.16.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.16.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.16.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.17.modulation": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.17.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.17.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.17.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.17.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.17.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.17.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.17.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.17.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.18.modulation": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.18.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.18.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.18.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.18.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.18.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.18.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.18.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.18.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.19.modulation": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.19.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.19.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.19.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.19.cross_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.19.ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.19.ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.0.weight": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.0.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.2.weight": "pytorch_model-00003.bin",
+    "blocks.19.audio_ffn.2.bias": "pytorch_model-00003.bin",
+    "blocks.19.audio_modulation.param": "pytorch_model-00003.bin",
+    "blocks.20.modulation": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.v.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.bias": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.o.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.norm_q.weight": "pytorch_model-00003.bin",
+    "blocks.20.self_attn.norm_k.weight": "pytorch_model-00003.bin",
+    "blocks.20.norm3.weight": "pytorch_model-00003.bin",
+    "blocks.20.norm3.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.q.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.lora_A.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.k.lora_B.default.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.weight": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.bias": "pytorch_model-00003.bin",
+    "blocks.20.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.20.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.20.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.20.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.20.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.20.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.21.modulation": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.21.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.21.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.21.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.21.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.21.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.21.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.21.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.21.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.22.modulation": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.22.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.22.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.22.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.22.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.22.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.22.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.22.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.22.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.23.modulation": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.23.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.23.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.23.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.23.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.23.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.23.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.23.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.23.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.24.modulation": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.24.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.24.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.24.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.24.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.24.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.24.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.24.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.24.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.25.modulation": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.25.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.25.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.25.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.25.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.25.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.25.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.25.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.25.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.26.modulation": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.26.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.26.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.26.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.26.cross_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.26.ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.26.ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.0.weight": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.0.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.2.weight": "pytorch_model-00004.bin",
+    "blocks.26.audio_ffn.2.bias": "pytorch_model-00004.bin",
+    "blocks.26.audio_modulation.param": "pytorch_model-00004.bin",
+    "blocks.27.modulation": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.k.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.v.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.bias": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.o.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.norm_q.weight": "pytorch_model-00004.bin",
+    "blocks.27.self_attn.norm_k.weight": "pytorch_model-00004.bin",
+    "blocks.27.norm3.weight": "pytorch_model-00004.bin",
+    "blocks.27.norm3.bias": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.bias": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.lora_A.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.q.lora_B.default.weight": "pytorch_model-00004.bin",
+    "blocks.27.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.27.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.27.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.27.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.27.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.27.audio_modulation.param": "pytorch_model-00005.bin",
+    "blocks.28.modulation": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.28.self_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.28.norm3.weight": "pytorch_model-00005.bin",
+    "blocks.28.norm3.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.28.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.28.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.28.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.28.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.28.audio_modulation.param": "pytorch_model-00005.bin",
+    "blocks.29.modulation": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.29.self_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.29.norm3.weight": "pytorch_model-00005.bin",
+    "blocks.29.norm3.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.q.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.k.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.v.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.bias": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.lora_A.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.o.lora_B.default.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.norm_q.weight": "pytorch_model-00005.bin",
+    "blocks.29.cross_attn.norm_k.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.29.ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.29.ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.0.weight": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.0.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.2.weight": "pytorch_model-00005.bin",
+    "blocks.29.audio_ffn.2.bias": "pytorch_model-00005.bin",
+    "blocks.29.audio_modulation.param": "pytorch_model-00005.bin"
+  }
+}

dualffn_attnlora/epoch001-global_step21000/running_states.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+    "epoch": 1,
+    "step": 10443,
+    "global_step": 21000,
+    "batch_size": null
+}

dualffn_attnlora/epoch001-global_step21000/sampler ADDED Viewed

Binary file (928 Bytes). View file

dualffn_attnlora/log.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

dualffn_attnlora/tensorboard/events.out.tfevents.1755194708.361b65dc6631.2576728.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:eccb9e8866e08c0120827ed813e4bb456880304ba3c8e5a86b9c12bfa26c132f
+size 68155

dualffn_attnlora/tensorboard/events.out.tfevents.1755267800.361b65dc6631.701156.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7380cab2cc6afa67a6bb1dde9b1116b13683c320e1266409d1ae727c5e9f962c
+size 234199