设置说明
本文档详细说明了 PhantomVox 的各项设置选项。
设置界面
点击主界面右上角的"设置"按钮进入设置面板。
音频设置
采样率
控制生成音频的采样率,影响音频质量。
- 24000 Hz: 模型默认
提示
模型输出为24000Hz,因此采样率设置为24000Hz
音频格式
选择导出音频的格式。
- WAV: 无损格式,推荐用于编辑
- MP3: 压缩格式,文件较小
- FLAC: 无损压缩,质量和大小平衡
性能设置
CUDA 加速
启用 GPU 加速以提高生成速度。
- 开启: 使用 NVIDIA GPU(推荐)
- 关闭: 使用 CPU(较慢)
要求: NVIDIA 显卡 具体要求取决于安装的Pytorch 版本。
Flash Attention
启用性能优化组件。
- 开启: 更快的推理速度
- 关闭: 更好的兼容
要求: 需要检查显卡是否支持
模型设置
模型路径
设置模型文件的存储位置。
- 默认:
./models - 自定义: 选择其他位置
自动下载
是否自动下载缺失的模型。
- 开启: 便捷但可能占用网络
- 关闭: 手动控制下载
界面设置
主题
选择应用的主题。
- 亮色: 浅色背景
- 暗色: 深色背景
日志级别
控制日志显示的详细程度。
- ERROR: 仅错误
- WARNING: 警告和错误
- INFO: 一般信息(推荐)
- DEBUG: 调试信息
API 设置
端口
API 服务器监听的端口。
- 默认: 8000
- 自定义: 1024-65535
恢复默认设置
如果设置出现问题,可以恢复默认值:
- 打开设置面板
- 点击"恢复默认"按钮
- 确认操作
- 重启应用