npc0 commited on
Commit
76c03a4
1 Parent(s): 96f99bc

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +40 -0
README.md ADDED
@@ -0,0 +1,40 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - zh
4
+ - en
5
+ tags:
6
+ - glm
7
+ - chatglm
8
+ - ggml
9
+ ---
10
+ # ChatGLM3-6B-32k-fp16
11
+
12
+ 介绍 (Introduction)
13
+ ChatGLM3-6B-32k 是 ChatGLM 系列最新一代的开源模型,[THUDM/chatglm3-6b](https://github.com/THUDM/ChatGLM3)
14
+
15
+ 用 [ChatGLM.CPP](https://github.com/li-plus/chatglm.cpp) 基於 GGML quantize 生成 f16 權重 weights 儲存於此倉庫。
16
+
17
+ ## Performance
18
+ |Model |GGML quantize method| HDD size |
19
+ |--------------------------|--------------------|----------|
20
+ |chatglm3-32k-ggml-q4_0.bin| f16 | ?.?? GB |
21
+
22
+ ## Getting Started
23
+ 1. Install dependency
24
+ ```sh
25
+ pip install chatglm-cpp transformers
26
+ ```
27
+
28
+ 2. Download weight
29
+ ```sh
30
+ wget https://huggingface.co/npc0/chatglm3-6b-32k-f16/resolve/main/chatglm3-32k-ggml-f16.bin
31
+ ```
32
+
33
+ 3. Code
34
+ ```py
35
+ import chatglm_cpp
36
+
37
+ pipeline = chatglm_cpp.Pipeline("./chatglm3-32k-ggml-f16.bin")
38
+ pipeline.chat(["你好"])
39
+ # Output: 你好👋!我是人工智能助手 ChatGLM3-6B,很高兴见到你,欢迎问我任何问题。
40
+ ```