Xorbits
/

chatglm2-6B-GGML

Model card Files Files and versions Community

Bojun-Feng commited on Jul 6, 2023

Commit

d8d84d4

•

1 Parent(s): 199529e

Update README.md

Files changed (1) hide show

README.md +3 -1

README.md CHANGED Viewed

@@ -18,7 +18,9 @@ GGML files are for CPU + GPU inference using [chatglm.cpp](https://github.com/li
 | chatglm2-ggml-q4_0.bin | q4_0 | 4 | 3.5 GB  |
 | chatglm2-ggml-q4_1.bin | q4_1 | 4 | 3.9 GB  |
 | chatglm2-ggml-q5_0.bin | q5_0 | 5 | 4.3 GB  |
-| chatglm2-ggml-q5_1.bin | q5_1 | 4 | 4.7 GB  |
 # How to run in xorbits-inference
 Coming soon.

 | chatglm2-ggml-q4_0.bin | q4_0 | 4 | 3.5 GB  |
 | chatglm2-ggml-q4_1.bin | q4_1 | 4 | 3.9 GB  |
 | chatglm2-ggml-q5_0.bin | q5_0 | 5 | 4.3 GB  |
+| chatglm2-ggml-q5_1.bin | q5_1 | 5 | 4.7 GB  |
+| chatglm2-ggml-q5_1.bin | q8_0 | 8 | 6.6 GB  |
 # How to run in xorbits-inference
 Coming soon.