File size: 2,163 Bytes
1858ba9 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 |
# 配置指南
本文档介绍如何配置 VoiceDialogue 系统。
## 启动参数
通过 `main.py` 的命令行参数可以方便地进行配置:
| 参数 | 缩写 | 可选值 | 默认值 | 描述 |
|---|---|---|---|---|
| `--mode` | `-m` | `cli`, `api` | `cli` | 设置运行模式 |
| `--language`| `-l` | `zh`, `en` | `zh` | (CLI模式) 设置用户语言 |
| `--speaker` | `-s` | (动态获取) | `沈逸` | (CLI模式) 设置TTS语音角色 |
| `--host` | | IP地址 | `0.0.0.0` | (API模式) 服务器主机 |
| `--port` | `-p` | 端口号 | `8000` | (API模式) 服务器端口 |
| `--reload`| | 无 | `False` | (API模式) 启用热重载 |
**支持的说话人角色**(动态加载):
- **中文角色**:`罗翔`, `马保国`, `沈逸`, `杨幂`, `周杰伦`, `马云`
- **英文角色**:`Heart`, `Bella`, `Nicole`
## 高级配置
### 大语言模型 (LLM)
- **模型路径和参数**: LLM 的模型和推理参数目前在代码中硬编码,方便快速启动。
- **文件位置**: `src/VoiceDialogue/services/text/generator.py`
- **自定义**: 你可以修改 `LLMResponseGenerator` 类中的配置。
### 语音识别 (ASR)
- **引擎自动选择**: 系统会根据 `--language` 参数自动选择最合适的 ASR 引擎。
- **模型配置**: ASR 模型的具体配置位于 `src/VoiceDialogue/services/speech/recognizers/manager.py`。
### 系统提示词 (System Prompt)
- **功能**: 定义 AI 角色的行为和说话风格。
- **文件位置**: `src/VoiceDialogue/services/text/generator.py`
- **自定义**: 你可以修改系统提示词变量的值。
## 构建完整应用
项目提供了完整的构建脚本,可以一键构建包含Python后端和Electron前端的完整应用:
1. 首先,激活当前 Python 环境
```bash
source .venv/bin/activate
# 或使用 conda
conda activate voicedialogue
```
2. 使用构建脚本
```bash
# 使用构建脚本(推荐)
bash scripts/build.sh
# 或分别构建
bash scripts/build-python.sh # 构建Python后端
bash scripts/build-electron.sh # 构建Electron前端
# 清理构建产物
bash scripts/clean.sh
``` |