renillhuang
commited on
Commit
•
2ae9a66
1
Parent(s):
4813f43
Update README_zh.md
Browse files- README_zh.md +33 -4
README_zh.md
CHANGED
@@ -32,7 +32,7 @@
|
|
32 |
- [📖 模型介绍](#zh_model-introduction)
|
33 |
- [🔗 下载路径](#zh_model-download)
|
34 |
- [🔖 评估结果](#zh_model-benchmark)
|
35 |
-
- [📊 模型推理](#zh_model-inference)
|
36 |
- [📜 声明协议](#zh_declarations-license)
|
37 |
- [🥇 企业介绍](#zh_company-introduction)
|
38 |
|
@@ -267,9 +267,38 @@ CUDA_VISIBLE_DEVICES=0 python demo/text_generation.py --model OrionStarAI/Orion-
|
|
267 |
|
268 |
```
|
269 |
|
270 |
-
## 4.4.
|
|
|
|
|
271 |
|
272 |
-
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
273 |
|
274 |
`````
|
275 |
用户:你好,你叫什么名字
|
@@ -296,7 +325,7 @@ Orion-14B:从前有一个小男孩叫杰克,他住在一个小村庄里。杰
|
|
296 |
这个故事告诉我们,只要有勇气和决心,我们就能克服一切困难,实现自己的梦想。
|
297 |
`````
|
298 |
|
299 |
-
### 4.
|
300 |
|
301 |
`````
|
302 |
用户:自己を紹介してください
|
|
|
32 |
- [📖 模型介绍](#zh_model-introduction)
|
33 |
- [🔗 下载路径](#zh_model-download)
|
34 |
- [🔖 评估结果](#zh_model-benchmark)
|
35 |
+
- [📊 模型推理](#zh_model-inference)[<img src="./assets/imgs/vllm.png" alt="vllm" height="20"/>](#vllm) [<img src="./assets/imgs/llama_cpp.png" alt="llamacpp" height="20"/>](#llama-cpp)
|
36 |
- [📜 声明协议](#zh_declarations-license)
|
37 |
- [🥇 企业介绍](#zh_company-introduction)
|
38 |
|
|
|
267 |
|
268 |
```
|
269 |
|
270 |
+
## 4.4. 使用vllm推理
|
271 |
+
- 工程地址<br>
|
272 |
+
https://github.com/vllm-project/vllm
|
273 |
|
274 |
+
- 拉取请求<br>
|
275 |
+
https://github.com/vllm-project/vllm/pull/2539
|
276 |
+
|
277 |
+
<a name="llama-cpp"></a><br>
|
278 |
+
## 4.5. 使用llama.cpp推理
|
279 |
+
|
280 |
+
- 工程地址<br>
|
281 |
+
https://github.com/ggerganov/llama.cpp
|
282 |
+
|
283 |
+
- 拉取请求<br>
|
284 |
+
https://github.com/ggerganov/llama.cpp/pull/5118
|
285 |
+
|
286 |
+
- 如何转换GGUF格式模型
|
287 |
+
|
288 |
+
```shell
|
289 |
+
python convert-hf-to-gguf.py path/to/Orion-14B-Chat --outfile chat.gguf
|
290 |
+
```
|
291 |
+
|
292 |
+
- 如何运行GGUF格式模型推理
|
293 |
+
|
294 |
+
```shell
|
295 |
+
./main --frequency-penalty 0.5 --frequency-penalty 0.5 --top-k 5 --top-p 0.9 -m chat.gguf -p "Building a website can be done in 10 simple steps:\nStep 1:" -n 400 -e
|
296 |
+
```
|
297 |
+
|
298 |
+
|
299 |
+
## 4.6. 示例输出
|
300 |
+
|
301 |
+
### 4.6.1. 闲聊
|
302 |
|
303 |
`````
|
304 |
用户:你好,你叫什么名字
|
|
|
325 |
这个故事告诉我们,只要有勇气和决心,我们就能克服一切困难,实现自己的梦想。
|
326 |
`````
|
327 |
|
328 |
+
### 4.6.2. 日韩
|
329 |
|
330 |
`````
|
331 |
用户:自己を紹介してください
|