File size: 1,721 Bytes
c48f835 93e0c72 c48f835 93e0c72 c48f835 93e0c72 c48f835 93e0c72 c48f835 93e0c72 c48f835 93e0c72 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 |
import gradio as gr
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
from langchain.chains import RetrievalQA
from langchain.embeddings import SentenceTransformerEmbeddings
from langchain.vectorstores import FAISS
from langchain.text_splitter import CharacterTextSplitter
# بارگذاری مدل و توکنایزر
model_name = "HooshvareLab/bert-fa-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForQuestionAnswering.from_pretrained(model_name)
# متن اصلی (میتوانید از فایل Word خوانده شود)
document_text = """
این یک متن نمونه است که به عنوان پایهای برای پاسخ به سؤالات استفاده میشود.
"""
# تقسیم متن به قسمتهای کوچکتر
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_text(document_text)
# تبدیل متن به بردارهای معنایی
embeddings = SentenceTransformerEmbeddings(model_name="paraphrase-multilingual-MiniLM-L12-v2")
vectorstore = FAISS.from_texts(texts, embeddings)
# ایجاد زنجیره QA
qa_chain = RetrievalQA.from_chain_type(
llm=model,
chain_type="stuff",
retriever=vectorstore.as_retriever()
)
# تعریف تابع پاسخدهی
def chatbot_response(query):
answer = qa_chain.run(query)
return answer
# ایجاد رابط کاربری با Gradio
iface = gr.Interface(
fn=chatbot_response,
inputs="text",
outputs="text",
title="چتبات فارسی",
description="یک چتبات تعاملی که از محتوای فایلهای Word استفاده میکند."
)
iface.launch() |