Skip to content

设置说明

本文档详细说明了 PhantomVox 的各项设置选项。

设置界面

点击主界面右上角的"设置"按钮进入设置面板。

音频设置

采样率

控制生成音频的采样率,影响音频质量。

  • 24000 Hz: 模型默认

提示

模型输出为24000Hz,因此采样率设置为24000Hz

音频格式

选择导出音频的格式。

  • WAV: 无损格式,推荐用于编辑
  • MP3: 压缩格式,文件较小
  • FLAC: 无损压缩,质量和大小平衡

性能设置

CUDA 加速

启用 GPU 加速以提高生成速度。

  • 开启: 使用 NVIDIA GPU(推荐)
  • 关闭: 使用 CPU(较慢)

要求: NVIDIA 显卡 具体要求取决于安装的Pytorch 版本。

Flash Attention

启用性能优化组件。

  • 开启: 更快的推理速度
  • 关闭: 更好的兼容

要求: 需要检查显卡是否支持

模型设置

模型路径

设置模型文件的存储位置。

  • 默认: ./models
  • 自定义: 选择其他位置

自动下载

是否自动下载缺失的模型。

  • 开启: 便捷但可能占用网络
  • 关闭: 手动控制下载

界面设置

主题

选择应用的主题。

  • 亮色: 浅色背景
  • 暗色: 深色背景

日志级别

控制日志显示的详细程度。

  • ERROR: 仅错误
  • WARNING: 警告和错误
  • INFO: 一般信息(推荐)
  • DEBUG: 调试信息

API 设置

端口

API 服务器监听的端口。

  • 默认: 8000
  • 自定义: 1024-65535

恢复默认设置

如果设置出现问题,可以恢复默认值:

  1. 打开设置面板
  2. 点击"恢复默认"按钮
  3. 确认操作
  4. 重启应用