sirochild commited on
Commit
32c9748
·
verified ·
1 Parent(s): a8eb81f

Delete README.md

Browse files
Files changed (1) hide show
  1. README.md +0 -89
README.md DELETED
@@ -1,89 +0,0 @@
1
- # 麻理チャット - Swallow-MX-8x7b-NVE GGUF版
2
-
3
- このアプリケーションは、東京工業大学のSwallow-MX-8x7b-NVEモデルの量子化GGUF版を使用した対話型チャットボットです。「麻理」という名のAIキャラクターとの会話を楽しむことができます。
4
-
5
- ## 特徴
6
-
7
- - 東京工業大学の日本語大規模言語モデル「Swallow-MX-8x7b-NVE-v0.1」の量子化版(Q4_K_M)を使用
8
- - llama-cpp-pythonによる高速・省メモリな推論
9
- - 複数のシーン(水族館、カフェ、神社など)に対応した背景と会話
10
- - 好感度システムによる関係性の変化
11
- - 感情分析による応答の調整
12
-
13
- ## セットアップ方法
14
-
15
- ### Hugging Face Spacesでの実行
16
-
17
- 1. このリポジトリをHugging Face Spacesにインポートします
18
- 2. Spacesの設定で以下を選択します:
19
- - SDK: Gradio
20
- - Python: 3.10
21
- - CPU: 必要に応じて(最低でも4GB RAM推奨)
22
- - Hardware: CPU(GPUは不要です)
23
- 3. 必要に応じて環境変数を設定します:
24
- - `GROQ_API_KEY`: Groq APIキー(オプション、シーン遷移時の指示生成に使用)
25
-
26
- #### デプロイに関する注意事項
27
-
28
- - **初回のデプロイ時間**: モデルのダウンロード(約4GB)に時間がかかります。辛抱強く待ってください。
29
- - **ビルドエラーが発生した場合**: Spacesの「Settings」タブで「Factory Reboot」を実行してみてください。
30
- - **メモリ不足エラー**: CPUのメモリを増やす(4GB以上推奨)か、「Restart Space」を試してください。
31
- - **タイムアウトエラー**: ビルドプロセスが長すぎる場合は、再度デプロイを試みてください。
32
-
33
- #### トラブルシューティング
34
-
35
- 1. **モデルのロードに失敗する場合**:
36
- - Spacesの「Settings」タブで「Restart Space」を実行してください。
37
- - それでも解決しない場合は「Factory Reboot」を試してください。
38
-
39
- 2. **アプリが起動しない場合**:
40
- - ログを確認して、エラーの原因を特定してください。
41
- - メモリ不足の場合は、CPUのメモリ割り当てを増やしてください。
42
-
43
- 3. **応答生成が遅い場合**:
44
- - これは正常です。量子化モデルをCPUで実行しているため、応答生成には時間がかかります。
45
-
46
- ### ローカル環境での実行
47
-
48
- 1. リポジトリをクローンします
49
- 2. 依存関係をインストールします:
50
- ```
51
- pip install -r requirements.txt
52
- ```
53
- 3. `.env`ファイルを作成し、必要な環境変数を設定します:
54
- ```
55
- GROQ_API_KEY=your_groq_api_key_here
56
- ```
57
- 4. アプリケーションを実行します:
58
- ```
59
- python app.py
60
- ```
61
-
62
- ## 使用方法
63
-
64
- 1. テキスト入力欄にメッセージを入力します
65
- 2. 麻理からの応答が表示されます
66
- 3. 会話を続けることで好感度が変化します
67
- 4. 特定の場所について話し、行くことに同意すると、シーンが変化します
68
-
69
- ## シーン一覧
70
-
71
- - `default`: デフォルトの部屋
72
- - `room_night`: 夜の部屋
73
- - `beach_sunset`: 夕暮れのビーチ
74
- - `festival_night`: 夜のお祭り
75
- - `shrine_day`: 昼間の神社
76
- - `cafe_afternoon`: 午後のカフェ
77
- - `aquarium_night`: 夜の水族館
78
-
79
- ## モデル情報
80
-
81
- このアプリケーションは、東京工業大学が開発した「Swallow-MX-8x7b-NVE-v0.1」モデルの量子化GGUF版を使用しています。
82
- - 元のモデル: [tokyotech-llm/Swallow-MX-8x7b-NVE-v0.1](https://huggingface.co/tokyotech-llm/Swallow-MX-8x7b-NVE-v0.1)
83
- - 量子化GGUF版: [mmnga/tokyotech-llm-Swallow-MX-8x7b-NVE-v0.1-gguf](https://huggingface.co/mmnga/tokyotech-llm-Swallow-MX-8x7b-NVE-v0.1-gguf)
84
-
85
- ## 注意事項
86
-
87
- - GGUF形式の量子化モデル(Q4_K_M)を使用することで、メモリ使用量を大幅に削減しています
88
- - llama-cpp-pythonを使用することで、GPUメモリの効率的な使用が可能になっています
89
- - Hugging Face Spaces上でも快適に動作するように最適化されています