File size: 3,608 Bytes
ef2fed3
 
 
 
 
 
 
 
c50312f
ef2fed3
65d97b1
751a54e
96cd96f
751a54e
96cd96f
7128e8d
 
3c24b5a
 
7cb5538
6041762
bf2ef7e
 
7cb5538
82515cb
 
 
 
 
 
947602b
 
 
 
 
665354c
402215d
665354c
 
 
 
 
 
 
 
 
 
 
 
402215d
 
 
 
2a7b7b1
402215d
 
751a54e
a10fbed
65d97b1
 
82515cb
08afbac
e85f4a5
08afbac
4d7c081
a10fbed
4d7c081
96cd96f
 
 
a10fbed
 
82515cb
 
 
 
 
 
 
 
665354c
 
 
 
a10fbed
751a54e
6041762
751a54e
 
0e24559
6af4300
 
65d97b1
6041762
3c24b5a
6041762
bd111f7
6041762
8569de4
a10fbed
481102f
c30e006
ff057a2
eed5ac1
ff057a2
481102f
751a54e
96cd96f
 
46670ec
8941872
ef2fed3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
---
license: openrail
title: 'Chinese-LangChain '
sdk: gradio
emoji: 🚀
colorFrom: yellow
colorTo: yellow
pinned: true
app_file: app.py
---

# Chinese-LangChain

> Chinese-LangChain:中文langchain项目,基于ChatGLM-6b+langchain实现本地化知识库检索与智能答案生成

https://github.com/yanqiangmiffy/Chinese-LangChain

俗称:小必应,Q.Talk,强聊,QiangTalk

## 🔥 效果演示

![](https://github.com/yanqiangmiffy/Chinese-LangChain/blob/master/images/web_demos/v1.png)
![](https://github.com/yanqiangmiffy/Chinese-LangChain/blob/master/images/web_demos/v3.png)

## 🚋 使用教程

- 选择知识库询问相关领域的问题

## 🏗️ 部署教程

### 运行配置

- 显存:12g,实际运行9g够了
- 运行内存:32g

### 运行环境

```text
langchain
gradio
transformers
sentence_transformers
faiss-cpu
unstructured
duckduckgo_search
mdtex2html
chardet
cchardet
```

### 启动Gradio

```shell
python main.py
```

## 🚀 特性

- 📝 2023/04/20 支持模型问答与检索问答模式切换
- 📝 2023/04/20 感谢HF官方提供免费算力,添加HuggingFace Spaces在线体验[[🤗 DEMO](https://huggingface.co/spaces/ChallengeHub/Chinese-LangChain)
- 📝 2023/04/19 发布45万Wikipedia的文本预处理语料以及FAISS索引向量
- 🐯 2023/04/19 引入ChuanhuChatGPT皮肤
- 📱 2023/04/19 增加web search功能,需要确保网络畅通!(感谢[@wanghao07456](https://github.com/wanghao07456),提供的idea)
- 📚 2023/04/18 webui增加知识库选择功能
- 🚀 2023/04/18 修复推理预测超时5s报错问题
- 🎉 2023/04/17 支持多种文档上传与内容解析:pdf、docx,ppt等
- 🎉 2023/04/17 支持知识增量更新

[//]: # (- 支持检索结果与LLM生成结果对比)

## 🧰 知识库

### 构建知识库

- Wikipedia-zh

> 详情见:corpus/zh_wikipedia/README.md

### 知识库向量索引

| 知识库数据                                            |FAISS向量|
|--------------------------------------------------|----|
| 截止去年九月的130w条中文维基百科处理结果和对应faiss向量文件 @[yubuyuabc](https://github.com/yubuyuabc)         |链接:https://pan.baidu.com/s/1Yls_Qtg15W1gneNuFP9O_w?pwd=exij 提取码:exij|
| 💹 [大规模金融研报知识图谱](http://openkg.cn/dataset/fr2kg) |链接:https://pan.baidu.com/s/1FcIH5Fi3EfpS346DnDu51Q?pwd=ujjv 提取码:ujjv |

## 🔨 TODO

* [x] 支持上下文
* [x] 支持知识增量更新
* [x] 支持加载不同知识库
* [x] 支持检索结果与LLM生成结果对比
* [ ] 支持检索生成结果与原始LLM生成结果对比
* [ ] 支持模型问答与检索问答
* [ ] 检索结果过滤与排序
* [x] 互联网检索结果接入
* [ ] 模型初始化有问题
* [ ] 增加非LangChain策略

## 交流

欢迎多提建议、Bad cases,目前尚不完善,欢迎进群及时交流,也欢迎大家多提PR</br>

<figure class="third">
    <img src="https://raw.githubusercontent.com/yanqiangmiffy/Chinese-LangChain/master/images/ch.jpg" width="180px"><img src="https://raw.githubusercontent.com/yanqiangmiffy/Chinese-LangChain/master/images/chatgroup.jpg" width="180px" height="270px"><img src="https://raw.githubusercontent.com/yanqiangmiffy/Chinese-LangChain/master/images/personal.jpg" width="180px">
</figure>

## ❤️引用

- webui参考:https://github.com/thomas-yanxin/LangChain-ChatGLM-Webui
- knowledge问答参考:https://github.com/imClumsyPanda/langchain-ChatGLM
- LLM模型:https://github.com/THUDM/ChatGLM-6B
- CSS:https://huggingface.co/spaces/JohnSmith9982/ChuanhuChatGPT