1 / app.py
hadi272's picture
Update app.py
93e0c72 verified
import gradio as gr
from transformers import AutoTokenizer, AutoModelForQuestionAnswering
from langchain.chains import RetrievalQA
from langchain.embeddings import SentenceTransformerEmbeddings
from langchain.vectorstores import FAISS
from langchain.text_splitter import CharacterTextSplitter
# بارگذاری مدل و توکنایزر
model_name = "HooshvareLab/bert-fa-base-uncased"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForQuestionAnswering.from_pretrained(model_name)
# متن اصلی (می‌توانید از فایل Word خوانده شود)
document_text = """
این یک متن نمونه است که به عنوان پایه‌ای برای پاسخ به سؤالات استفاده می‌شود.
"""
# تقسیم متن به قسمت‌های کوچکتر
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=200)
texts = text_splitter.split_text(document_text)
# تبدیل متن به بردارهای معنایی
embeddings = SentenceTransformerEmbeddings(model_name="paraphrase-multilingual-MiniLM-L12-v2")
vectorstore = FAISS.from_texts(texts, embeddings)
# ایجاد زنجیره QA
qa_chain = RetrievalQA.from_chain_type(
llm=model,
chain_type="stuff",
retriever=vectorstore.as_retriever()
)
# تعریف تابع پاسخ‌دهی
def chatbot_response(query):
answer = qa_chain.run(query)
return answer
# ایجاد رابط کاربری با Gradio
iface = gr.Interface(
fn=chatbot_response,
inputs="text",
outputs="text",
title="چت‌بات فارسی",
description="یک چت‌بات تعاملی که از محتوای فایل‌های Word استفاده می‌کند."
)
iface.launch()