Spaces:
Runtime error
Runtime error
File size: 3,608 Bytes
ef2fed3 c50312f ef2fed3 65d97b1 751a54e 96cd96f 751a54e 96cd96f 7128e8d 3c24b5a 7cb5538 6041762 bf2ef7e 7cb5538 82515cb 947602b 665354c 402215d 665354c 402215d 2a7b7b1 402215d 751a54e a10fbed 65d97b1 82515cb 08afbac e85f4a5 08afbac 4d7c081 a10fbed 4d7c081 96cd96f a10fbed 82515cb 665354c a10fbed 751a54e 6041762 751a54e 0e24559 6af4300 65d97b1 6041762 3c24b5a 6041762 bd111f7 6041762 8569de4 a10fbed 481102f c30e006 ff057a2 eed5ac1 ff057a2 481102f 751a54e 96cd96f 46670ec 8941872 ef2fed3 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 |
---
license: openrail
title: 'Chinese-LangChain '
sdk: gradio
emoji: 🚀
colorFrom: yellow
colorTo: yellow
pinned: true
app_file: app.py
---
# Chinese-LangChain
> Chinese-LangChain:中文langchain项目,基于ChatGLM-6b+langchain实现本地化知识库检索与智能答案生成
https://github.com/yanqiangmiffy/Chinese-LangChain
俗称:小必应,Q.Talk,强聊,QiangTalk
## 🔥 效果演示
![](https://github.com/yanqiangmiffy/Chinese-LangChain/blob/master/images/web_demos/v1.png)
![](https://github.com/yanqiangmiffy/Chinese-LangChain/blob/master/images/web_demos/v3.png)
## 🚋 使用教程
- 选择知识库询问相关领域的问题
## 🏗️ 部署教程
### 运行配置
- 显存:12g,实际运行9g够了
- 运行内存:32g
### 运行环境
```text
langchain
gradio
transformers
sentence_transformers
faiss-cpu
unstructured
duckduckgo_search
mdtex2html
chardet
cchardet
```
### 启动Gradio
```shell
python main.py
```
## 🚀 特性
- 📝 2023/04/20 支持模型问答与检索问答模式切换
- 📝 2023/04/20 感谢HF官方提供免费算力,添加HuggingFace Spaces在线体验[[🤗 DEMO](https://huggingface.co/spaces/ChallengeHub/Chinese-LangChain)
- 📝 2023/04/19 发布45万Wikipedia的文本预处理语料以及FAISS索引向量
- 🐯 2023/04/19 引入ChuanhuChatGPT皮肤
- 📱 2023/04/19 增加web search功能,需要确保网络畅通!(感谢[@wanghao07456](https://github.com/wanghao07456),提供的idea)
- 📚 2023/04/18 webui增加知识库选择功能
- 🚀 2023/04/18 修复推理预测超时5s报错问题
- 🎉 2023/04/17 支持多种文档上传与内容解析:pdf、docx,ppt等
- 🎉 2023/04/17 支持知识增量更新
[//]: # (- 支持检索结果与LLM生成结果对比)
## 🧰 知识库
### 构建知识库
- Wikipedia-zh
> 详情见:corpus/zh_wikipedia/README.md
### 知识库向量索引
| 知识库数据 |FAISS向量|
|--------------------------------------------------|----|
| 截止去年九月的130w条中文维基百科处理结果和对应faiss向量文件 @[yubuyuabc](https://github.com/yubuyuabc) |链接:https://pan.baidu.com/s/1Yls_Qtg15W1gneNuFP9O_w?pwd=exij 提取码:exij|
| 💹 [大规模金融研报知识图谱](http://openkg.cn/dataset/fr2kg) |链接:https://pan.baidu.com/s/1FcIH5Fi3EfpS346DnDu51Q?pwd=ujjv 提取码:ujjv |
## 🔨 TODO
* [x] 支持上下文
* [x] 支持知识增量更新
* [x] 支持加载不同知识库
* [x] 支持检索结果与LLM生成结果对比
* [ ] 支持检索生成结果与原始LLM生成结果对比
* [ ] 支持模型问答与检索问答
* [ ] 检索结果过滤与排序
* [x] 互联网检索结果接入
* [ ] 模型初始化有问题
* [ ] 增加非LangChain策略
## 交流
欢迎多提建议、Bad cases,目前尚不完善,欢迎进群及时交流,也欢迎大家多提PR</br>
<figure class="third">
<img src="https://raw.githubusercontent.com/yanqiangmiffy/Chinese-LangChain/master/images/ch.jpg" width="180px"><img src="https://raw.githubusercontent.com/yanqiangmiffy/Chinese-LangChain/master/images/chatgroup.jpg" width="180px" height="270px"><img src="https://raw.githubusercontent.com/yanqiangmiffy/Chinese-LangChain/master/images/personal.jpg" width="180px">
</figure>
## ❤️引用
- webui参考:https://github.com/thomas-yanxin/LangChain-ChatGLM-Webui
- knowledge问答参考:https://github.com/imClumsyPanda/langchain-ChatGLM
- LLM模型:https://github.com/THUDM/ChatGLM-6B
- CSS:https://huggingface.co/spaces/JohnSmith9982/ChuanhuChatGPT |