Spaces:
Sleeping
Sleeping
hugh2023
Add multi-modal agent system with media analysis, web scraping, and enhanced configuration management
adec1cb A newer version of the Gradio SDK is available:
6.8.0
多模态智能体系统配置指南
🚀 快速开始
1. 安装依赖
pip install -r requirements.txt
2. 配置API密钥
方法一:使用配置文件(推荐)
- 编辑
api_keys.json文件:
{
"openai": {
"api_key": "sk-your-openai-api-key-here"
},
"huggingface": {
"api_key": "hf-your-huggingface-api-key-here"
},
"search_engine": {
"type": "duckduckgo",
"api_key": null
}
}
- 将你的OpenAI API密钥替换
sk-your-openai-api-key-here
方法二:使用环境变量
# Windows
set OPENAI_API_KEY=sk-your-openai-api-key-here
# Linux/Mac
export OPENAI_API_KEY=sk-your-openai-api-key-here
3. 运行系统
Web界面模式
python run.py --mode web
测试模式
python run.py --mode test
交互式模式
python run.py --mode interactive
🔑 API密钥获取指南
OpenAI API密钥
- 访问 OpenAI官网
- 注册或登录账户
- 进入 "API Keys" 页面
- 点击 "Create new secret key"
- 复制生成的密钥(以
sk-开头)
Hugging Face API密钥(可选)
- 访问 Hugging Face
- 注册或登录账户
- 进入 "Settings" → "Access Tokens"
- 点击 "New token"
- 复制生成的令牌(以
hf_开头)
🔍 搜索引擎配置
DuckDuckGo搜索(默认,无需API密钥)
- 无需配置API密钥
- 免费使用
- 支持文本、图像、视频搜索
其他搜索引擎(可选)
如果需要使用其他搜索引擎,可以修改 api_keys.json:
{
"search_engine": {
"type": "serper",
"api_key": "your-serper-api-key"
}
}
⚙️ 高级配置
模型配置
在 config.py 中可以修改使用的模型:
# 图像描述模型
IMAGE_CAPTION_MODEL = "Salesforce/blip-image-captioning-base"
# 图像分类模型
IMAGE_CLASSIFICATION_MODEL = "microsoft/resnet-50"
# 对象检测模型
OBJECT_DETECTION_MODEL = "facebook/detr-resnet-50"
系统配置
# 调试模式
DEBUG = True
# 日志级别
LOG_LEVEL = "DEBUG"
# 视频处理配置
MAX_VIDEO_DURATION = 300 # 最大视频时长(秒)
FRAMES_TO_ANALYZE = 5 # 视频分析帧数
🐛 常见问题
1. API密钥错误
错误信息: OpenAI API密钥未配置
解决方案:
- 检查
api_keys.json文件是否存在 - 确认API密钥格式正确(OpenAI密钥以
sk-开头) - 验证API密钥是否有效
2. 依赖包安装失败
错误信息: ModuleNotFoundError
解决方案:
# 升级pip
pip install --upgrade pip
# 重新安装依赖
pip install -r requirements.txt --force-reinstall
3. 模型下载失败
错误信息: 模型下载失败
解决方案:
- 检查网络连接
- 使用VPN或代理
- 手动下载模型到本地缓存目录
4. 内存不足
错误信息: CUDA out of memory
解决方案:
- 减少批处理大小
- 使用CPU模式运行
- 关闭其他占用内存的程序
📁 文件结构
Final_Assignment_Agent/
├── api_keys.json # API密钥配置文件
├── config.py # 系统配置
├── app.py # 主应用
├── tools.py # 工具模块
├── test_agent.py # 测试脚本
├── run.py # 启动脚本
├── requirements.txt # 依赖包列表
├── README.md # 项目说明
└── SETUP.md # 配置指南
🔒 安全注意事项
不要提交API密钥到版本控制
- 将
api_keys.json添加到.gitignore - 使用环境变量或配置文件
- 将
定期更新API密钥
- 定期检查API密钥的有效性
- 及时更新过期的密钥
限制API使用
- 设置API使用限制
- 监控API调用次数和费用
📞 技术支持
如果遇到问题,请:
- 查看错误日志
- 检查配置文件
- 运行测试脚本
- 查看常见问题解答
注意: 请确保遵守相关API的使用条款和隐私政策。