update model files

Files changed (3) hide show

README.md ADDED Viewed

+# Speculative decoding with Qwen 32B + Qwen 1.5B
+Example:
+```sh
+llama-server \
+    -m qwen2.5-coder-32b-instruct-q4_k_m.gguf \
+    -md qwen2.5-coder-1.5b-instruct-q4_k_m.gguf \
+    --ctx-size 65536
+```

qwen2.5-coder-1.5b-instruct-q4_k_m.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:cc324af070c2ecbfd324a30884d2f951a7ff756aba85cb811a6ec436933bb046
+size 1117320768

qwen2.5-coder-32b-instruct-q4_k_m.gguf ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:4d64b316b5e6319d9613e0d97935d9ebd631fc7e334da400d00085eca749d085
+size 19851335872