自己搭建的demo,提示No sentence-transformers model found with name /mnt/chatGLM/embedding/text2vec-large-chinese. Creating a new one with MEAN pooling.

#10
by gaos - opened

自己搭建了ChatGLM+text2vec-large-chinese的demo,但是使用时提示
No sentence-transformers model found with name /mnt/chatGLM/embedding/text2vec-large-chinese. Creating a new one with MEAN pooling.
虽然能够运行,但是还有几个问题想要请教大家。
1、这种情况是没有用text2vec-large-chinese而使用了其他的embedding模型吗
2、这个问题怎么解决,在文件夹下确实有模型,该怎么解决呢

以下是我的代码

import os

from langchain.document_loaders import UnstructuredFileLoader
from langchain.embeddings.huggingface import HuggingFaceEmbeddings
from langchain.vectorstores import FAISS

embedding_model_name = '/mnt/chatGLM/embedding/text2vec-large-chinese'
docs_path = '/mnt/chatGLM/embedding'
embeddings = HuggingFaceEmbeddings(model_name=embedding_model_name, model_kwargs={'device': 'cpu'})

# 遍历指定路径下的文本文件,并使用UnstructuredFileLoader加载文档。然后将加载的文档添加到一个列表中。
docs = []
for doc in os.listdir(docs_path):
    if doc.endswith('.txt'):
        print(doc)
        loader = UnstructuredFileLoader(f'{docs_path}/{doc}', mode="elements")
        doc = loader.load()
        docs.extend(doc)

# 使用FAISS模块将文档转换为向量,并将向量存储到vector_store对象中。然后将向量存储保存到本地。
vector_store = FAISS.from_documents(docs, embeddings)
vector_store.save_local('vector_store_local')

我也发现了这个问题,在文件夹下确实有模型,却一直有该提示

我也遇到了这个情况,有老哥解决了吗

我也遇到了这个情况,有老哥解决了吗

还没有,我看到https://github.com/thomas-yanxin/LangChain-ChatGLM-Webui/issues/98回答没点 知识库文件向量化 这个button,但是我没有部署这个项目,只是自己搭建了ChatGLM+text2vec-large-chinese的demo。应该有办法解决,但是没找到。。。

这个模型不是标准的模型,使用https://github.com/shibing624/text2vec提取文档向量

@fictionking 朋友,啥意思啊,text2vec-base-chinese里有这几个文件,复制过来吗?

@fictionking 朋友,啥意思啊,text2vec-base-chinese里有这几个文件,复制过来吗?

对的,我已经弄好了

Sign up or log in to comment