设置说明

本文档详细说明了 PhantomVox 的各项设置选项。

设置界面

点击主界面右上角的"设置"按钮进入设置面板。

音频设置

采样率

控制生成音频的采样率，影响音频质量。

24000 Hz: 模型默认

提示

模型输出为24000Hz，因此采样率设置为24000Hz

音频格式

选择导出音频的格式。

WAV: 无损格式，推荐用于编辑
MP3: 压缩格式，文件较小
FLAC: 无损压缩，质量和大小平衡

性能设置

CUDA 加速

启用 GPU 加速以提高生成速度。

开启: 使用 NVIDIA GPU（推荐）
关闭: 使用 CPU（较慢）

要求: NVIDIA 显卡具体要求取决于安装的Pytorch 版本。

Flash Attention

启用性能优化组件。

开启: 更快的推理速度
关闭: 更好的兼容

要求: 需要检查显卡是否支持

模型设置

模型路径

设置模型文件的存储位置。

默认: ./models
自定义: 选择其他位置

自动下载

是否自动下载缺失的模型。

开启: 便捷但可能占用网络
关闭: 手动控制下载

界面设置

主题

选择应用的主题。

亮色: 浅色背景
暗色: 深色背景

日志级别

控制日志显示的详细程度。

ERROR: 仅错误
WARNING: 警告和错误
INFO: 一般信息（推荐）
DEBUG: 调试信息

API 设置

端口

API 服务器监听的端口。

默认: 8000
自定义: 1024-65535

恢复默认设置

如果设置出现问题，可以恢复默认值：

打开设置面板
点击"恢复默认"按钮
确认操作
重启应用