|
{ |
|
"metadata": { |
|
"ParamSize": 405, |
|
"ParamBytes": 7322025600.0, |
|
"BitsPerParam": 4.500366420249213 |
|
}, |
|
"records": [ |
|
{ |
|
"dataPath": "params_shard_0.bin", |
|
"format": "raw-shard", |
|
"nbytes": 81922560, |
|
"records": [ |
|
{ |
|
"name": "lm_head.q_weight", |
|
"shape": [ |
|
32001, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 81922560, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0697be082ade47c89c5b8756c540aa80" |
|
}, |
|
{ |
|
"dataPath": "params_shard_1.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.38.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "ea08cbad1e6c3103161c091f1f30d8c5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_2.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.38.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "f1f632a036eabe2f053e2f1a561a77a8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_3.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.39.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "15ad02a0af22890a5d7e134630c0cf6c" |
|
}, |
|
{ |
|
"dataPath": "params_shard_4.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.39.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b27614523da9cb11ed9c349e1843344f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_5.bin", |
|
"format": "raw-shard", |
|
"nbytes": 27965760, |
|
"records": [ |
|
{ |
|
"name": "lm_head.q_scale", |
|
"shape": [ |
|
32001, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240320, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.38.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 10240320 |
|
}, |
|
{ |
|
"name": "model.layers.38.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 10250560 |
|
}, |
|
{ |
|
"name": "model.layers.38.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 14674240 |
|
}, |
|
{ |
|
"name": "model.layers.38.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 23521600 |
|
}, |
|
{ |
|
"name": "model.layers.39.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 23531840 |
|
}, |
|
{ |
|
"name": "model.layers.39.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 23542080 |
|
} |
|
], |
|
"md5sum": "c4eb4cfbb1db04f4481761b5e03a2236" |
|
}, |
|
{ |
|
"dataPath": "params_shard_6.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.39.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "79ae161f65b68d4da1b4b6ccfb755715" |
|
}, |
|
{ |
|
"dataPath": "params_shard_7.bin", |
|
"format": "raw-shard", |
|
"nbytes": 81922560, |
|
"records": [ |
|
{ |
|
"name": "model.embed_tokens.q_weight", |
|
"shape": [ |
|
32001, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 81922560, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "f5381192ea1d84f6ec947ab32ef3bc2e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_8.bin", |
|
"format": "raw-shard", |
|
"nbytes": 28528640, |
|
"records": [ |
|
{ |
|
"name": "model.layers.39.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.39.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 8847360 |
|
}, |
|
{ |
|
"name": "model.layers.39.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 8857600 |
|
}, |
|
{ |
|
"name": "model.layers.39.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 13772800 |
|
}, |
|
{ |
|
"name": "model.layers.39.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 26880000 |
|
}, |
|
{ |
|
"name": "model.norm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28518400 |
|
} |
|
], |
|
"md5sum": "291861851b9d374a82bfc45c3c6d965e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_9.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.0.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "39fd2a781bad2b0872aa90db35059b1c" |
|
}, |
|
{ |
|
"dataPath": "params_shard_10.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.0.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "56a7a0d485e97439de08ed4ef6c631f9" |
|
}, |
|
{ |
|
"dataPath": "params_shard_11.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.0.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "346c0f14ef88929c621c68fe77bc48f7" |
|
}, |
|
{ |
|
"dataPath": "params_shard_12.bin", |
|
"format": "raw-shard", |
|
"nbytes": 28447040, |
|
"records": [ |
|
{ |
|
"name": "model.embed_tokens.q_scale", |
|
"shape": [ |
|
32001, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240320, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.0.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 10240320 |
|
}, |
|
{ |
|
"name": "model.layers.0.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 10250560 |
|
}, |
|
{ |
|
"name": "model.layers.0.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 14674240 |
|
}, |
|
{ |
|
"name": "model.layers.0.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 23521600 |
|
}, |
|
{ |
|
"name": "model.layers.0.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 23531840 |
|
} |
|
], |
|
"md5sum": "c3263311c071315e0c3d631d17988d0e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_13.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.1.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "05b056dc2d80c27a1cf14caac36fb8b8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_14.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.1.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "4fe1bb4c38bfb7db74d5e60c09e94b64" |
|
}, |
|
{ |
|
"dataPath": "params_shard_15.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.1.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "1ae97e622089e43d5f6c628d2096e87b" |
|
}, |
|
{ |
|
"dataPath": "params_shard_16.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.0.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.0.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.1.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.1.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.1.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.1.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.1.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "246fd518301c75947884ee7c0d981c7f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_17.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.2.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b39c173e22a13255ef5b2a9ab7f8f11d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_18.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.2.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e179e0e982fd70e7deea37c7df584a33" |
|
}, |
|
{ |
|
"dataPath": "params_shard_19.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.2.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "85eb307be85ad37d5a7fd0fdc45d0d8c" |
|
}, |
|
{ |
|
"dataPath": "params_shard_20.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.1.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.1.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.2.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.2.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.2.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.2.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.2.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "c7625a52780403fe8e2122122cb0eb19" |
|
}, |
|
{ |
|
"dataPath": "params_shard_21.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.3.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e8b77b7860210e6891c8641080a3a6dd" |
|
}, |
|
{ |
|
"dataPath": "params_shard_22.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.3.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "c419c3a5880899763e31f54f9161d0aa" |
|
}, |
|
{ |
|
"dataPath": "params_shard_23.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.3.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "d7894501d32e92bbd7dfcb644ce6e3f8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_24.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.2.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.2.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.3.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.3.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.3.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.3.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.3.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "bcb2adf6986ec8d498cc53bf3841037a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_25.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.4.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "c2320ddca85bd14ead40642fd9f95717" |
|
}, |
|
{ |
|
"dataPath": "params_shard_26.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.4.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "cb0f69bf29e4aa92410ccb019fc9236e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_27.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.4.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "30ada311d33535cf415407be7af785e6" |
|
}, |
|
{ |
|
"dataPath": "params_shard_28.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.3.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.3.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.4.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.4.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.4.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.4.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.4.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "7cfe423007e6a1f2c9325f1eb9fc0a35" |
|
}, |
|
{ |
|
"dataPath": "params_shard_29.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.5.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "dc64097ea4b506eee3a3e10dc303cc0b" |
|
}, |
|
{ |
|
"dataPath": "params_shard_30.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.5.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "06c318672f5c52ccb227438ea4a7092a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_31.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.5.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "d5f4e12c554b4c0b6bc33968de53cc29" |
|
}, |
|
{ |
|
"dataPath": "params_shard_32.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.4.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.4.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.5.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.5.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.5.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.5.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.5.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "9ad62daf087714d0d7d7020ee92b9fb5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_33.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.6.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "c94e5c7419c4f57a2869b3c237724f49" |
|
}, |
|
{ |
|
"dataPath": "params_shard_34.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.6.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "90e2f4b85ea3ea08841ffba047c94c0a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_35.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.6.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b529fdf61e303d8bfdc0f7b490d5136e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_36.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.5.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.5.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.6.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.6.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.6.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.6.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.6.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "6ea93461d063e7730eff922a9d90fe2d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_37.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.7.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "20d9b1013449e76245c6ff76263d73c5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_38.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32768000, |
|
"records": [ |
|
{ |
|
"name": "model.layers.6.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.6.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.7.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.7.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 19660800 |
|
} |
|
], |
|
"md5sum": "bda955923af273d583c89e289aae1b32" |
|
}, |
|
{ |
|
"dataPath": "params_shard_39.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.10.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "d1683baee779cde7c96ae2eccfb81607" |
|
}, |
|
{ |
|
"dataPath": "params_shard_40.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.10.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "69dc5a94899a6e9c4f6bde4ff4167797" |
|
}, |
|
{ |
|
"dataPath": "params_shard_41.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.10.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0e5f5db1f74fe4083b503d3d484e0b73" |
|
}, |
|
{ |
|
"dataPath": "params_shard_42.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.7.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.10.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 1638400 |
|
}, |
|
{ |
|
"name": "model.layers.10.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 1648640 |
|
}, |
|
{ |
|
"name": "model.layers.10.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 6072320 |
|
}, |
|
{ |
|
"name": "model.layers.10.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14919680 |
|
}, |
|
{ |
|
"name": "model.layers.10.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 14929920 |
|
}, |
|
{ |
|
"name": "model.layers.10.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 19845120 |
|
} |
|
], |
|
"md5sum": "1b1a581d6d06a06b01c3c6e02ee086a9" |
|
}, |
|
{ |
|
"dataPath": "params_shard_43.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.11.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e0f73e5abf21b22eb0ab079deea7160b" |
|
}, |
|
{ |
|
"dataPath": "params_shard_44.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.11.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "f743053431ee109bce9bd0c297629738" |
|
}, |
|
{ |
|
"dataPath": "params_shard_45.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.11.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "d8253180a5f658d0537b339271f49862" |
|
}, |
|
{ |
|
"dataPath": "params_shard_46.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.10.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.11.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 1638400 |
|
}, |
|
{ |
|
"name": "model.layers.11.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 1648640 |
|
}, |
|
{ |
|
"name": "model.layers.11.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 6072320 |
|
}, |
|
{ |
|
"name": "model.layers.11.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14919680 |
|
}, |
|
{ |
|
"name": "model.layers.11.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 14929920 |
|
}, |
|
{ |
|
"name": "model.layers.11.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 19845120 |
|
} |
|
], |
|
"md5sum": "59fad1ba46dac4c2805567ab8d2fde38" |
|
}, |
|
{ |
|
"dataPath": "params_shard_47.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.12.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "6924ac06a52ed715cafacac60f409707" |
|
}, |
|
{ |
|
"dataPath": "params_shard_48.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.12.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "84e004f1a9d7b95bd0c84afcd69bad65" |
|
}, |
|
{ |
|
"dataPath": "params_shard_49.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.12.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "278cf4f4eee9a689f0dd6725305446af" |
|
}, |
|
{ |
|
"dataPath": "params_shard_50.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.11.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.12.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 1638400 |
|
}, |
|
{ |
|
"name": "model.layers.12.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 1648640 |
|
}, |
|
{ |
|
"name": "model.layers.12.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 6072320 |
|
}, |
|
{ |
|
"name": "model.layers.12.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14919680 |
|
}, |
|
{ |
|
"name": "model.layers.12.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 14929920 |
|
}, |
|
{ |
|
"name": "model.layers.12.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 19845120 |
|
} |
|
], |
|
"md5sum": "4128fdb8055d6f9cc175518b34efad94" |
|
}, |
|
{ |
|
"dataPath": "params_shard_51.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.13.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "489a7b92ef43d57853fee00bbe6499ca" |
|
}, |
|
{ |
|
"dataPath": "params_shard_52.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.13.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "96ebc23847fcff0eab1e4010bc08856b" |
|
}, |
|
{ |
|
"dataPath": "params_shard_53.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.13.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "04697c479a597b01b7db6aef825409a7" |
|
}, |
|
{ |
|
"dataPath": "params_shard_54.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.12.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.13.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 1638400 |
|
}, |
|
{ |
|
"name": "model.layers.13.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 1648640 |
|
}, |
|
{ |
|
"name": "model.layers.13.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 6072320 |
|
}, |
|
{ |
|
"name": "model.layers.13.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14919680 |
|
}, |
|
{ |
|
"name": "model.layers.13.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 14929920 |
|
}, |
|
{ |
|
"name": "model.layers.13.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 19845120 |
|
} |
|
], |
|
"md5sum": "34795055d455e14122b5fc0830f18aa1" |
|
}, |
|
{ |
|
"dataPath": "params_shard_55.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.14.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "24612f760f51f9a02962096a1b5ac585" |
|
}, |
|
{ |
|
"dataPath": "params_shard_56.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.14.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "9139483c55130bb2e562b3192dddf54d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_57.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.14.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "3d0f9edffeb74f28b4491d1ba0338fcf" |
|
}, |
|
{ |
|
"dataPath": "params_shard_58.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.13.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.14.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 1638400 |
|
}, |
|
{ |
|
"name": "model.layers.14.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 1648640 |
|
}, |
|
{ |
|
"name": "model.layers.14.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 6072320 |
|
}, |
|
{ |
|
"name": "model.layers.14.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14919680 |
|
}, |
|
{ |
|
"name": "model.layers.14.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 14929920 |
|
}, |
|
{ |
|
"name": "model.layers.14.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 19845120 |
|
} |
|
], |
|
"md5sum": "f14ee8eaa3f288158bfe2bb81c55886e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_59.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.15.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "a6bcd4b092436cf08583a93aabee9891" |
|
}, |
|
{ |
|
"dataPath": "params_shard_60.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.7.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "6d946796bf50770959f8e4ea94c857b2" |
|
}, |
|
{ |
|
"dataPath": "params_shard_61.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.7.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "f3023afc8a3a07a479929c62a011cb36" |
|
}, |
|
{ |
|
"dataPath": "params_shard_62.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.8.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "039fbf22ffeed52fa0230a12e5df4d2f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_63.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.8.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e28fd57833306613c2c02548a8a60941" |
|
}, |
|
{ |
|
"dataPath": "params_shard_64.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.8.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "5ef935cc304d3d983e570808b360b6a2" |
|
}, |
|
{ |
|
"dataPath": "params_shard_65.bin", |
|
"format": "raw-shard", |
|
"nbytes": 33136640, |
|
"records": [ |
|
{ |
|
"name": "model.layers.14.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.15.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 1638400 |
|
}, |
|
{ |
|
"name": "model.layers.7.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 6553600 |
|
}, |
|
{ |
|
"name": "model.layers.7.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 6563840 |
|
}, |
|
{ |
|
"name": "model.layers.7.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 10987520 |
|
}, |
|
{ |
|
"name": "model.layers.7.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19834880 |
|
}, |
|
{ |
|
"name": "model.layers.8.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19845120 |
|
}, |
|
{ |
|
"name": "model.layers.8.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19855360 |
|
}, |
|
{ |
|
"name": "model.layers.8.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24279040 |
|
}, |
|
{ |
|
"name": "model.layers.8.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 33126400 |
|
} |
|
], |
|
"md5sum": "143d47ff33cb1004cf2c46fff563f738" |
|
}, |
|
{ |
|
"dataPath": "params_shard_66.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.9.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b53e7bdb718c71036f7c93c6581a439d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_67.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.9.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "9ab5432153e7e6c723714f6defa9d055" |
|
}, |
|
{ |
|
"dataPath": "params_shard_68.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.9.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "4e0335167e559df99b0ef368b72836d0" |
|
}, |
|
{ |
|
"dataPath": "params_shard_69.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.8.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.8.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.8.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.9.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.9.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.9.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.9.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "47157067195730bdfc63166534cc188a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_70.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.15.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "cc111c599aeedae3066f841d9afe9416" |
|
}, |
|
{ |
|
"dataPath": "params_shard_71.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.15.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "642309be72c45d1673f836d59b0ca7ef" |
|
}, |
|
{ |
|
"dataPath": "params_shard_72.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.9.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.9.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.9.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.15.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.15.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.15.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.15.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "40c37ee3c3d86b2020c82b13978b938b" |
|
}, |
|
{ |
|
"dataPath": "params_shard_73.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.16.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "3b278a92c387f843d131248bd5769ac6" |
|
}, |
|
{ |
|
"dataPath": "params_shard_74.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.16.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "8ed7bccf2662633f899f3f01dd5809df" |
|
}, |
|
{ |
|
"dataPath": "params_shard_75.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.16.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "09fa659b74dc3b2bcec6a5156e079237" |
|
}, |
|
{ |
|
"dataPath": "params_shard_76.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.15.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.15.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.16.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.16.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.16.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.16.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.16.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "36f82618d49104c9524f5b254c53a76f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_77.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.17.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e7d4bd5f375d92cb62ba3de4dcbdda55" |
|
}, |
|
{ |
|
"dataPath": "params_shard_78.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.17.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "29872185176bb75fbab6c9bc7232af9f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_79.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.17.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "4c97217b84a36164e3d8eac10a627bd4" |
|
}, |
|
{ |
|
"dataPath": "params_shard_80.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.16.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.16.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.17.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.17.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.17.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.17.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.17.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "17b2b457dd5c300f140027d1095680ee" |
|
}, |
|
{ |
|
"dataPath": "params_shard_81.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.18.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e9e3efd05fd6b9b8ed21a988a8f7f3ee" |
|
}, |
|
{ |
|
"dataPath": "params_shard_82.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.18.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b8a514895cf47a05711df414ffb64efe" |
|
}, |
|
{ |
|
"dataPath": "params_shard_83.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.18.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0e5dc24fe80aeaa8cd60b60ecb96abff" |
|
}, |
|
{ |
|
"dataPath": "params_shard_84.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.17.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.17.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.18.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.18.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.18.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.18.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.18.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "f028f8748c86c045aac5b5322362dbb8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_85.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.19.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "9780a94bb5a2ea9780396078b7d0e8f1" |
|
}, |
|
{ |
|
"dataPath": "params_shard_86.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.19.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "e91911a87a1de3e9cb019aeb848d7eb7" |
|
}, |
|
{ |
|
"dataPath": "params_shard_87.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.19.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "7658055645e10640a7676d8909cf82aa" |
|
}, |
|
{ |
|
"dataPath": "params_shard_88.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.18.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.18.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.19.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.19.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.19.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.19.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.19.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "b86b633ff3659cdea14cbc77f27aea21" |
|
}, |
|
{ |
|
"dataPath": "params_shard_89.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.20.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0a926563c8019648eaafffa5061754e5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_90.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.20.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "cbde4d76896be9bceafe8ed0f344061f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_91.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.20.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "bb19bf72e9ea3e7a4bf4cfbdf1738848" |
|
}, |
|
{ |
|
"dataPath": "params_shard_92.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.19.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.19.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.20.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.20.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.20.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.20.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.20.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "832db2f03b78eac87ff96b9827c2c26d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_93.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.21.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "55a0af73a1e232e0b9c63c37e7e0b19a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_94.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.21.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "8b5deca84e77207ed3eb6829cd147c6c" |
|
}, |
|
{ |
|
"dataPath": "params_shard_95.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.21.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "9783d50e95c53b1c3c98f2ac0880e9f4" |
|
}, |
|
{ |
|
"dataPath": "params_shard_96.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.20.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.20.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.21.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.21.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.21.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.21.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.21.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "f0bfbafc86e602053d25424a168aed1a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_97.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.22.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "bc145499fa54f6c55298560a66dc4098" |
|
}, |
|
{ |
|
"dataPath": "params_shard_98.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.22.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "3ad6787b8005d1459ceec26701fb1133" |
|
}, |
|
{ |
|
"dataPath": "params_shard_99.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.22.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "3b51f3c83ce5bc773474ab8095044f86" |
|
}, |
|
{ |
|
"dataPath": "params_shard_100.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.21.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.21.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.22.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.22.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.22.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.22.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.22.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "c4c78a0070fcd1641d8bf0352c229994" |
|
}, |
|
{ |
|
"dataPath": "params_shard_101.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.23.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "6642c8f14b4492f103a72febd9d20586" |
|
}, |
|
{ |
|
"dataPath": "params_shard_102.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.23.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "cb51f2206531d89eca30a280a36a44f3" |
|
}, |
|
{ |
|
"dataPath": "params_shard_103.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.23.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "a91a6e591d718ca83848c72ccaaa4025" |
|
}, |
|
{ |
|
"dataPath": "params_shard_104.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.22.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.22.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.23.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.23.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.23.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.23.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.23.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "d946626fecef31f3feab1a8bc1d7f163" |
|
}, |
|
{ |
|
"dataPath": "params_shard_105.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.24.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "daf48f1dfaedb510f0b3951b3ecb9528" |
|
}, |
|
{ |
|
"dataPath": "params_shard_106.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.24.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "642cb1a208862f1a8f900afba15bf00f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_107.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.24.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "9a95dbb4c6033124d338ad19de773d2a" |
|
}, |
|
{ |
|
"dataPath": "params_shard_108.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.23.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.23.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.24.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.24.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.24.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.24.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.24.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "fa65f2c0a9024034f9384259935b3dbc" |
|
}, |
|
{ |
|
"dataPath": "params_shard_109.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.25.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "2238134f5a6237d8701749ab9aca188d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_110.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.25.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "ae687cd409881e0b5124d7a117bdeef5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_111.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.25.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "8035a546e39fd9722ead12d6f40987e7" |
|
}, |
|
{ |
|
"dataPath": "params_shard_112.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.24.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.24.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.25.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.25.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.25.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.25.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.25.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "bc471d943e14e754b49140e600894c0e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_113.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.26.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "10c1168920c0d67fa0febf8018461775" |
|
}, |
|
{ |
|
"dataPath": "params_shard_114.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.26.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "63bcec509e39e0a6c5969aa7a31e7bbd" |
|
}, |
|
{ |
|
"dataPath": "params_shard_115.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.26.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0163ec35a99c148aec82a60a45ed9535" |
|
}, |
|
{ |
|
"dataPath": "params_shard_116.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.25.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.25.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.26.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.26.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.26.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.26.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.26.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "d47868912520b9cfccecd2b08382a9f5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_117.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.27.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "8b603bf99bad65f6a426361a3649f2ab" |
|
}, |
|
{ |
|
"dataPath": "params_shard_118.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.27.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "2b1d7d79c0756dfa3cf2c920ccef78ca" |
|
}, |
|
{ |
|
"dataPath": "params_shard_119.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.27.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "6351bc1ffc9bfbd19ac0615b160e1e8d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_120.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.26.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.26.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.27.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.27.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.27.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.27.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.27.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "cfea80fae115b5b469e64b47ff0a5b5e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_121.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.28.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "d249c81800e4eec1065575ac4b54d5ca" |
|
}, |
|
{ |
|
"dataPath": "params_shard_122.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.28.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "73bd3d9e13d28532dde52648dcb4bf4e" |
|
}, |
|
{ |
|
"dataPath": "params_shard_123.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.28.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b3871c2432b0907b239d0d711f406b68" |
|
}, |
|
{ |
|
"dataPath": "params_shard_124.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.27.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.27.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.28.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.28.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.28.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.28.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.28.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "1e5c1b1ae6e005df9815c779f80d3135" |
|
}, |
|
{ |
|
"dataPath": "params_shard_125.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.29.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "08ff42782eb6e4d06b54593d553861a7" |
|
}, |
|
{ |
|
"dataPath": "params_shard_126.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.29.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "097fd1906f7e5d115b9f1ba475203021" |
|
}, |
|
{ |
|
"dataPath": "params_shard_127.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.29.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "518b07a6b59fb5732fddd5646b917e9f" |
|
}, |
|
{ |
|
"dataPath": "params_shard_128.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.28.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.28.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.29.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.29.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.29.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.29.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 28026880 |
|
}, |
|
{ |
|
"name": "model.layers.29.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 28037120 |
|
} |
|
], |
|
"md5sum": "dd64061ea775f96168a05d960da9c6ab" |
|
}, |
|
{ |
|
"dataPath": "params_shard_129.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.30.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "aecff958903056b9b447da827e0471d8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_130.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.30.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "5c08ea7bd23cde1551c4366f36994409" |
|
}, |
|
{ |
|
"dataPath": "params_shard_131.bin", |
|
"format": "raw-shard", |
|
"nbytes": 28508160, |
|
"records": [ |
|
{ |
|
"name": "model.layers.29.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.29.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.30.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.30.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 23592960 |
|
} |
|
], |
|
"md5sum": "b9ec4a384ca1be7530d65d26c34d92ad" |
|
}, |
|
{ |
|
"dataPath": "params_shard_132.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.30.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "aa3a33fb90fea26ab0cb9ceb0219895c" |
|
}, |
|
{ |
|
"dataPath": "params_shard_133.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.31.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "701c394425aaa31f7099a719406442f3" |
|
}, |
|
{ |
|
"dataPath": "params_shard_134.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.31.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0a926c5fa91cae678f8e1a0e326fd3b6" |
|
}, |
|
{ |
|
"dataPath": "params_shard_135.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.31.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "beed1156ca3d25b9c302dcd977c00d77" |
|
}, |
|
{ |
|
"dataPath": "params_shard_136.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32481280, |
|
"records": [ |
|
{ |
|
"name": "model.layers.30.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.30.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
}, |
|
{ |
|
"name": "model.layers.30.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 14745600 |
|
}, |
|
{ |
|
"name": "model.layers.30.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 14755840 |
|
}, |
|
{ |
|
"name": "model.layers.30.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19179520 |
|
}, |
|
{ |
|
"name": "model.layers.31.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19189760 |
|
}, |
|
{ |
|
"name": "model.layers.31.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19200000 |
|
}, |
|
{ |
|
"name": "model.layers.31.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 23623680 |
|
}, |
|
{ |
|
"name": "model.layers.31.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32471040 |
|
} |
|
], |
|
"md5sum": "970779970520be0ddba650a06c7afc16" |
|
}, |
|
{ |
|
"dataPath": "params_shard_137.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.32.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "5d826201fc0855b3a2365bb649c8e35d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_138.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.32.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "c2cb83e04f5c085144510ba8878f4514" |
|
}, |
|
{ |
|
"dataPath": "params_shard_139.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.32.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "424aab4902252052f792becde9b5fb13" |
|
}, |
|
{ |
|
"dataPath": "params_shard_140.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.31.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.31.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.31.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.32.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.32.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.32.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.32.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "c16f975b84b153c0aa9ac94a5599c509" |
|
}, |
|
{ |
|
"dataPath": "params_shard_141.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.33.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "afe667b6e095a1d273c985431741b5c2" |
|
}, |
|
{ |
|
"dataPath": "params_shard_142.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.33.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "2d2c6753fc7b505020c75a42132fa8c8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_143.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.33.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "3ae7d43a82f779c0fe5e17fd8d7418f5" |
|
}, |
|
{ |
|
"dataPath": "params_shard_144.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.32.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.32.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.32.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.33.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.33.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.33.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.33.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "209897b6000c73c376e6ce6c9b1012ed" |
|
}, |
|
{ |
|
"dataPath": "params_shard_145.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.34.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "b57271e7022c8f0b7a152f7f1f28a322" |
|
}, |
|
{ |
|
"dataPath": "params_shard_146.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.34.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "13c6e72052d299412f57860457243208" |
|
}, |
|
{ |
|
"dataPath": "params_shard_147.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.34.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "d1c325f4c8242000dcd3c8879554dc40" |
|
}, |
|
{ |
|
"dataPath": "params_shard_148.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.33.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.33.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.33.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.34.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.34.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.34.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.34.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "c7ad918b513cd8c66478f0ed6a3dceec" |
|
}, |
|
{ |
|
"dataPath": "params_shard_149.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.35.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "1224189b5a4e532d256c114d31de4d26" |
|
}, |
|
{ |
|
"dataPath": "params_shard_150.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.35.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "0b925362e79771cde4e736bc7d2f0ddc" |
|
}, |
|
{ |
|
"dataPath": "params_shard_151.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.35.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "28ceb7b611bb837aedb46ab24e8ecbe6" |
|
}, |
|
{ |
|
"dataPath": "params_shard_152.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.34.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.34.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.34.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.35.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.35.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.35.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.35.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "dc95a00b596ca6bd4a034ce0a1d4da09" |
|
}, |
|
{ |
|
"dataPath": "params_shard_153.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.36.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "4c958b080916f330c95fc44d27ea05b8" |
|
}, |
|
{ |
|
"dataPath": "params_shard_154.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.36.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "9a79de0e2c22e8bc33e5567e8b229936" |
|
}, |
|
{ |
|
"dataPath": "params_shard_155.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.36.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "1a06c6287966f546166384294bef00dd" |
|
}, |
|
{ |
|
"dataPath": "params_shard_156.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.35.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.35.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.35.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.36.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.36.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.36.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.36.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "4b7e16964d879369b7bded3c802220e2" |
|
}, |
|
{ |
|
"dataPath": "params_shard_157.bin", |
|
"format": "raw-shard", |
|
"nbytes": 35389440, |
|
"records": [ |
|
{ |
|
"name": "model.layers.37.mlp.down_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
1728 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 35389440, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "bc1f18661cc735ab08fa27411a122836" |
|
}, |
|
{ |
|
"dataPath": "params_shard_158.bin", |
|
"format": "raw-shard", |
|
"nbytes": 70778880, |
|
"records": [ |
|
{ |
|
"name": "model.layers.37.mlp.gate_up_proj.q_weight", |
|
"shape": [ |
|
27648, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 70778880, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "f2413a49d3d191944fafa50c47c85b29" |
|
}, |
|
{ |
|
"dataPath": "params_shard_159.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.37.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "4f2b6fd3f946da76442a38c555692c78" |
|
}, |
|
{ |
|
"dataPath": "params_shard_160.bin", |
|
"format": "raw-shard", |
|
"nbytes": 32952320, |
|
"records": [ |
|
{ |
|
"name": "model.layers.36.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.36.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.36.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.37.input_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 19660800 |
|
}, |
|
{ |
|
"name": "model.layers.37.mlp.down_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
432 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4423680, |
|
"byteOffset": 19671040 |
|
}, |
|
{ |
|
"name": "model.layers.37.mlp.gate_up_proj.q_scale", |
|
"shape": [ |
|
27648, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 8847360, |
|
"byteOffset": 24094720 |
|
}, |
|
{ |
|
"name": "model.layers.37.post_attention_layernorm.weight", |
|
"shape": [ |
|
5120 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 10240, |
|
"byteOffset": 32942080 |
|
} |
|
], |
|
"md5sum": "b8866ea4966818d1ff123f20cd37c7cf" |
|
}, |
|
{ |
|
"dataPath": "params_shard_161.bin", |
|
"format": "raw-shard", |
|
"nbytes": 39321600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.38.self_attn.qkv_proj.q_weight", |
|
"shape": [ |
|
15360, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 39321600, |
|
"byteOffset": 0 |
|
} |
|
], |
|
"md5sum": "99fc6ee67b0dfd493a78767fd076309d" |
|
}, |
|
{ |
|
"dataPath": "params_shard_162.bin", |
|
"format": "raw-shard", |
|
"nbytes": 24576000, |
|
"records": [ |
|
{ |
|
"name": "model.layers.37.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.37.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 4915200 |
|
}, |
|
{ |
|
"name": "model.layers.37.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 18022400 |
|
}, |
|
{ |
|
"name": "model.layers.38.self_attn.qkv_proj.q_scale", |
|
"shape": [ |
|
15360, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 4915200, |
|
"byteOffset": 19660800 |
|
} |
|
], |
|
"md5sum": "c62a14123c5b984ba3be02951ca8bda7" |
|
}, |
|
{ |
|
"dataPath": "params_shard_163.bin", |
|
"format": "raw-shard", |
|
"nbytes": 14745600, |
|
"records": [ |
|
{ |
|
"name": "model.layers.38.self_attn.o_proj.q_weight", |
|
"shape": [ |
|
5120, |
|
640 |
|
], |
|
"dtype": "uint32", |
|
"format": "raw", |
|
"nbytes": 13107200, |
|
"byteOffset": 0 |
|
}, |
|
{ |
|
"name": "model.layers.38.self_attn.o_proj.q_scale", |
|
"shape": [ |
|
5120, |
|
160 |
|
], |
|
"dtype": "float16", |
|
"format": "raw", |
|
"nbytes": 1638400, |
|
"byteOffset": 13107200 |
|
} |
|
], |
|
"md5sum": "1bc8400067ddb796ded6a1d6eba9ce9e" |
|
} |
|
] |
|
} |