truthtaicom
/

nb-llama-3.2-1B-Instruct-v1-q4f16_1-MLC

Tai Truong commited on Dec 5, 2024

Commit

a8477f0

1 Parent(s): 9895f82

Add nb-llama-3.2-1B instruct model weights

Files changed (1) hide show

mlc-chat-config.json CHANGED Viewed

@@ -18,8 +18,8 @@
       "original_max_position_embeddings": 8192,
       "rope_type": "llama3"
     },
-    "context_window_size": 131072,
-    "prefill_chunk_size": 8192,
     "num_key_value_heads": 8,
     "head_dim": 64,
     "tensor_parallel_shards": 1,
@@ -27,9 +27,9 @@
     "max_batch_size": 128
   },
   "vocab_size": 128256,
-  "context_window_size": 131072,
   "sliding_window_size": -1,
-  "prefill_chunk_size": 8192,
   "attention_sink_size": -1,
   "tensor_parallel_shards": 1,
   "pipeline_parallel_stages": 1,

       "original_max_position_embeddings": 8192,
       "rope_type": "llama3"
     },
+    "context_window_size": 2048,
+    "prefill_chunk_size": 64,
     "num_key_value_heads": 8,
     "head_dim": 64,
     "tensor_parallel_shards": 1,
     "max_batch_size": 128
   },
   "vocab_size": 128256,
+  "context_window_size": 2048,
   "sliding_window_size": -1,
+  "prefill_chunk_size": 64,
   "attention_sink_size": -1,
   "tensor_parallel_shards": 1,
   "pipeline_parallel_stages": 1,