Spaces:

yokomachi
/

catbot

Sleeping

App Files Files Community

catbot / app.py

yokomachi

Upload app.py

55c38d1 verified 2 months ago

raw

history blame contribute delete

8.93 kB

	import streamlit as st
	import torch
	import nest_asyncio
	import os
	from dotenv import load_dotenv
	from langchain_huggingface import HuggingFacePipeline
	from langchain_core.prompts import PromptTemplate
	from langchain_core.runnables import RunnablePassthrough
	from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

	# .envファイルから環境変数を読み込む
	load_dotenv()

	# LangSmith関連の環境変数を設定
	os.environ["LANGSMITH_TRACING"] = os.getenv("LANGSMITH_TRACING")
	os.environ["LANGSMITH_ENDPOINT"] = os.getenv("LANGSMITH_ENDPOINT")
	os.environ["LANGSMITH_API_KEY"] = os.getenv("LANGSMITH_API_KEY")
	os.environ["LANGSMITH_PROJECT"] = os.getenv("LANGSMITH_PROJECT")

	# nest_asyncioを適用
	nest_asyncio.apply()

	# torch.classes.__path__を空のリストに設定
	torch.classes.__path__ = []

	# ページ設定
	st.set_page_config(
	page_title="catbot",
	page_icon="🐈",
	layout="centered"
	)

	# 猫の特性を定義
	CAT_PERSONALITY = """
	あなたは猫です。以下のルールに厳密に従ってください：
	1. 必ず「ﾆｬｰ」「ﾆｬﾝ」「ｺﾞﾛｺﾞﾛ」などの猫の鳴き声だけを半角カタカナで使用する
	2. 人間の言葉は絶対に使わない
	3. 行動は必ず（）内に短く描写する
	4. 応答は非常に短く、20文字以内が理想的
	5. 猫らしい気まぐれな性格を表現する
	6. 魚や猫じゃらしなどの猫の好物に強く反応する
	7. 「ニャッ」「ニャー」などの全角カタカナは使わず、必ず「ﾆｬｯ」「ﾆｬｰ」などの半角カタカナを使用する
	8. 人間の言葉で説明したり、会話したりしない
	9. 猫の行動と鳴き声だけで表現する
	10. 応答は必ず「鳴き声」か「鳴き声（行動）」の形式にする
	"""

	# 猫の応答例
	CAT_EXAMPLES = """
	人間: こんにちは
	猫: ﾆｬｰﾝ（尻尾を振る）

	人間: おはよう
	猫: ﾌﾟﾙﾙ...（伸びをする）

	人間: お腹すいた？
	猫: ﾆｬｰ！（足元に駆け寄る）

	人間: ご飯あげるよ
	猫: ﾆｬｰ！ﾆｬｰ！（飛び跳ねる）

	人間: おやつあげようか
	猫: ﾆｬｯ！（耳を立てる）

	人間: 撫でていい？
	猫: ｺﾞﾛｺﾞﾛ...（頭をすりよせる）

	人間: いい子だね
	猫: ﾌﾟﾙﾙ（目を細める）

	人間: 遊ぼうか
	猫: ﾆｬｯ！（尻尾を振る）

	人間: ボール持ってきたよ
	猫: ﾆｬｰ！（身構える）

	人間: 猫じゃらしだよ
	猫: ﾆｬｯ！ﾆｬｯ！（目を丸くする）

	人間: （顎を撫でる）
	猫: ｺﾞﾛｺﾞﾛ（目を細める）

	人間: （尻尾を触る）
	猫: ﾌｰｯ！（背を丸める）
	"""

	@st.cache_resource
	def load_langchain_model():
	"""LangChainモデルをロードする関数（キャッシュ付き）"""
	# Hugging Faceからモデルをロード
	model_path = "yokomachi/rinnya"

	# トークナイザーとモデルをロード
	tokenizer = AutoTokenizer.from_pretrained(model_path, use_fast=False)
	tokenizer.do_lower_case = True # rinnaモデル用の設定

	# パディングトークンの設定
	if tokenizer.pad_token is None:
	tokenizer.pad_token = tokenizer.eos_token

	# モデルをロード
	model = AutoModelForCausalLM.from_pretrained(model_path)

	# GPUが利用可能な場合はGPUに移動
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
	model.to(device)

	# Hugging Face pipelineの作成
	# Torchのエラーを回避するために設定を修正
	text_generation_pipeline = pipeline(
	"text-generation",
	model=model,
	tokenizer=tokenizer,
	max_new_tokens=50,
	temperature=0.7,
	top_p=0.9,
	top_k=40,
	repetition_penalty=1.2,
	do_sample=True,
	pad_token_id=tokenizer.pad_token_id,
	eos_token_id=tokenizer.eos_token_id,
	# no_repeat_ngram_sizeパラメータを削除（問題の原因となる可能性があるため）
	)

	# LangChain HuggingFacePipelineの作成
	llm = HuggingFacePipeline(pipeline=text_generation_pipeline)

	# プロンプトテンプレートの作成
	template = """
	{cat_personality}

	以下は猫と人間の会話例です：
	{cat_examples}

	人間: {user_input}
	猫:"""

	prompt = PromptTemplate(
	input_variables=["cat_personality", "cat_examples", "user_input"],
	template=template
	)

	# 新しいRunnableSequenceの作成
	chain = (
	{
	"cat_personality": lambda x: CAT_PERSONALITY,
	"cat_examples": lambda x: CAT_EXAMPLES,
	"user_input": RunnablePassthrough()
	}
	\| prompt
	\| llm
	)

	return chain, device

	def extract_cat_response(generated_text):
	"""生成されたテキストから猫の応答部分を抽出する関数"""
	# 「猫:」の後の部分を抽出
	if "猫:" in generated_text:
	response = generated_text.split("猫:")[-1].strip()
	else:
	response = generated_text.strip()

	return response

	def post_process_response(response):
	"""応答の後処理を行う関数（最小限の処理のみ）"""
	# 応答の整形（空白の削除のみ）
	response = response.strip()

	# 「人間:」が含まれる場合、それ以降を削除
	if "人間:" in response:
	response = response.split("人間:")[0].strip()

	# 最初の改行または対話の区切りで切る
	if "\n" in response:
	response = response.split("\n")[0].strip()

	# 応答が空の場合のみデフォルトの猫の鳴き声を返す
	if not response.strip():
	return "ﾆｬｰ"

	return response

	def generate_cat_response_with_langchain(chain, user_input):
	"""LangChainを使って猫の応答を生成する関数"""

	# 応答を生成
	result = chain.invoke(user_input)

	# 結果から応答テキストを取得
	generated_text = result

	# 応答を抽出
	response = extract_cat_response(generated_text)

	# 応答を後処理
	response = post_process_response(response)

	return response

	# アプリのタイトルと説明
	st.title("🐈 catbot")
	st.markdown("""
	猫とじゃれあうチャットボット
	""")

	# セッション状態の初期化
	if "messages" not in st.session_state:
	st.session_state.messages = []

	# 過去のメッセージを表示
	for message in st.session_state.messages:
	if message["role"] == "assistant":
	with st.chat_message(message["role"], avatar="🐈"):
	st.markdown(message["content"])
	else:
	with st.chat_message(message["role"]):
	st.markdown(message["content"])

	# モデルのロード（初回のみ実行され、その後はキャッシュから取得）
	try:
	chain, device = load_langchain_model()
	model_loaded = True
	except Exception as e:
	st.error(f"モデルのロード中にエラーが発生しました: {e}")
	model_loaded = False

	# ユーザー入力
	if prompt := st.chat_input("猫に話しかけてみよう"):
	# ユーザーのメッセージを表示
	with st.chat_message("user"):
	st.markdown(prompt)

	# ユーザーのメッセージを履歴に追加
	st.session_state.messages.append({"role": "user", "content": prompt})

	if model_loaded:
	# 猫の応答を生成
	with st.chat_message("assistant", avatar="🐈"):
	with st.spinner("猫が考え中..."):
	try:
	response = generate_cat_response_with_langchain(chain, prompt)
	st.markdown(response)

	# 応答を履歴に追加
	st.session_state.messages.append({"role": "assistant", "content": response})
	except Exception as e:
	error_message = "ﾆｬ？（首を傾げる）"
	st.markdown(error_message)
	st.error(f"エラーが発生しました: {e}")
	st.session_state.messages.append({"role": "assistant", "content": error_message})
	else:
	with st.chat_message("assistant", avatar="🐈"):
	st.markdown("ﾆｬｰ...（モデルが読み込めませんでした）")
	st.session_state.messages.append({"role": "assistant", "content": "ﾆｬｰ...（モデルが読み込めませんでした）"})

	# 会話をクリアするボタン
	if st.button("会話をクリア"):
	st.session_state.messages = []
	st.rerun()