Spaces:

sirochild
/

mari

Sleeping

App Files Files Community

sirochild commited on Jul 24

Commit

a8eb81f

verified ·

1 Parent(s): 5086caa

Upload 9 files

Browse files

Files changed (3) hide show

README.md +89 -14
app.py +16 -1
generate_dialogue_with_swallow.py +2 -2

README.md CHANGED Viewed

@@ -1,14 +1,89 @@
----
-title: Mari
-emoji: 😻
-colorFrom: pink
-colorTo: green
-sdk: gradio
-sdk_version: 5.38.0
-app_file: app.py
-pinned: false
-license: mit
-short_description: mari
----
-Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference

+# 麻理チャット - Swallow-MX-8x7b-NVE GGUF版
+このアプリケーションは、東京工業大学のSwallow-MX-8x7b-NVEモデルの量子化GGUF版を使用した対話型チャットボットです。「麻理」という名のAIキャラクターとの会話を楽しむことができます。
+## 特徴
+- 東京工業大学の日本語大規模言語モデル「Swallow-MX-8x7b-NVE-v0.1」の量子化版（Q4_K_M）を使用
+- llama-cpp-pythonによる高速・省メモリな推論
+- 複数のシーン（水族館、カフェ、神社など）に対応した背景と会話
+- 好感度システムによる関係性の変化
+- 感情分析による応答の調整
+## セットアップ方法
+### Hugging Face Spacesでの実行
+1. このリポジトリをHugging Face Spacesにインポートします
+2. Spacesの設定で以下を選択します:
+   - SDK: Gradio
+   - Python: 3.10
+   - CPU: 必要に応じて（最低でも4GB RAM推奨）
+   - Hardware: CPU（GPUは不要です）
+3. 必要に応じて環境変数を設定します:
+   - `GROQ_API_KEY`: Groq APIキー（オプション、シーン遷移時の指示生成に使用）
+#### デプロイに関する注意事項
+- **初回のデプロイ時間**: モデルのダウンロード（約4GB）に時間がかかります。辛抱強く待ってください。
+- **ビルドエラーが発生した場合**: Spacesの「Settings」タブで「Factory Reboot」を実行してみてください。
+- **メモリ不足エラー**: CPUのメモリを増やす（4GB以上推奨）か、「Restart Space」を試してください。
+- **タイムアウトエラー**: ビルドプロセスが長すぎる場合は、再度デプロイを試みてください。
+#### トラブルシューティング
+1. **モデルのロードに失敗する場合**:
+   - Spacesの「Settings」タブで「Restart Space」を実行してください。
+   - それでも解決しない場合は「Factory Reboot」を試してください。
+2. **アプリが起動しない場合**:
+   - ログを確認して、エラーの原因を特定してください。
+   - メモリ不足の場合は、CPUのメモリ割り当てを増やしてください。
+3. **応答生成が遅い場合**:
+   - これは正常です。量子化モデルをCPUで実行しているため、応答生成には時間がかかります。
+### ローカル環境での実行
+1. リポジトリをクローンします
+2. 依存関係をインストールします:
+   ```
+   pip install -r requirements.txt
+   ```
+3. `.env`ファイルを作成し、必要な環境変数を設定します:
+   ```
+   GROQ_API_KEY=your_groq_api_key_here
+   ```
+4. アプリケーションを実行します:
+   ```
+   python app.py
+   ```
+## 使用方法
+1. テキスト入力欄にメッセージを入力します
+2. 麻理からの応答が表示されます
+3. 会話を続けることで好感度が変化します
+4. 特定の場所について話し、行くことに同意すると、シーンが変化します
+## シーン一覧
+- `default`: デフォルトの部屋
+- `room_night`: 夜の部屋
+- `beach_sunset`: 夕暮れのビーチ
+- `festival_night`: 夜のお祭り
+- `shrine_day`: 昼間の神社
+- `cafe_afternoon`: 午後のカフェ
+- `aquarium_night`: 夜の水族館
+## モデル情報
+このアプリケーションは、東京工業大学が開発した「Swallow-MX-8x7b-NVE-v0.1」モデルの量子化GGUF版を使用しています。
+- 元のモデル: [tokyotech-llm/Swallow-MX-8x7b-NVE-v0.1](https://huggingface.co/tokyotech-llm/Swallow-MX-8x7b-NVE-v0.1)
+- 量子化GGUF版: [mmnga/tokyotech-llm-Swallow-MX-8x7b-NVE-v0.1-gguf](https://huggingface.co/mmnga/tokyotech-llm-Swallow-MX-8x7b-NVE-v0.1-gguf)
+## 注意事項
+- GGUF形式の量子化モデル（Q4_K_M）を使用することで、メモリ使用量を大幅に削減しています
+- llama-cpp-pythonを使用することで、GPUメモリの効率的な使用が可能になっています
+- Hugging Face Spaces上でも快適に動作するように最適化されています

app.py CHANGED Viewed

@@ -5,7 +5,17 @@ import json
 from dotenv import load_dotenv
 from transformers import pipeline
 import re
-from llama_cpp import Llama
 from huggingface_hub import hf_hub_download
 from generate_dialogue_with_swallow import generate_dialogue_with_swallow
@@ -36,6 +46,11 @@ try:
     # 最も安全な設定でモデルをロード（CPUのみ）
     print("CPUモードでモデルをロードします")
     try:
         swallow_model = Llama(
             model_path=model_path,

 from dotenv import load_dotenv
 from transformers import pipeline
 import re
+# llama-cpp-pythonのインポート（ビルド済みパッケージに対応）
+try:
+    from llama_cpp import Llama
+except ImportError:
+    try:
+        # 別の可能性のあるインポート名を試す
+        from llama_cpp_python import Llama
+    except ImportError:
+        # モジュールが見つからない場合のフォールバック
+        print("警告: llama-cpp-pythonモジュールが見つかりません。")
+        Llama = None
 from huggingface_hub import hf_hub_download
 from generate_dialogue_with_swallow import generate_dialogue_with_swallow
     # 最も安全な設定でモデルをロード（CPUのみ）
     print("CPUモードでモデルをロードします")
+    # Llamaクラスが利用可能かチェック
+    if Llama is None:
+        raise ImportError("llama-cpp-pythonモジュールが見つかりません")
     try:
         swallow_model = Llama(
             model_path=model_path,

generate_dialogue_with_swallow.py CHANGED Viewed

@@ -14,8 +14,8 @@ def generate_dialogue_with_swallow(history, message, affection, stage_name, scen
         scene_params: シーンパラメータの辞書
         instruction: 特別な指示（シーン遷移時など）
         use_simple_prompt: 簡潔なプロンプトを使用するかどうか
-        swallow_model: Swallowモデル（llama-cpp）のインスタンス
-        tokenizer: 未使用（llama-cppでは不要）
         SYSTEM_PROMPT_MARI: システムプロンプト
     Returns:

         scene_params: シーンパラメータの辞書
         instruction: 特別な指示（シーン遷移時など）
         use_simple_prompt: 簡潔なプロンプトを使用するかどうか
+        swallow_model: Swallowモデル（llama-cpp-python）のインスタンス
+        tokenizer: 未使用（llama-cpp-pythonでは不要）
         SYSTEM_PROMPT_MARI: システムプロンプト
     Returns: