
Voicebox
开源本地语音合成工作室,ElevenLabs 的免费替代品,支持 23 种语言
介绍
Voicebox 是一个开源的本地语音合成工作室——ElevenLabs 的免费开源替代品。所有模型和语音数据都保存在本地,无需担心隐私泄露。
主要功能
- 声音克隆: 仅需几秒钟音频即可克隆声音
- 多引擎支持: 5 种 TTS 引擎可选(Qwen3-TTS、LuxTTS、Chatterbox 系列、HumeAI TADA)
- 23 种语言: 英语、中文、日语、阿拉伯语、印地语等
- 音频效果: 音调变换、混响、延迟、合唱、压缩等 8 种效果
- 情感表达: 支持 [laugh]、[sigh]、[gasp] 等副语言标签
- 无限长度: 自动分块 + 交叉淡化,支持长文本(最高 5 万字符)
- Stories 编辑器: 多轨时间线,适合对话、播客、叙事
- REST API: 完整的 API 供集成到自有项目
- 原生性能: 基于 Tauri (Rust),非 Electron
平台支持
- macOS (Apple Silicon/Intel) - MLX/Metal 加速
- Windows - CUDA/DirectML
- Linux - CUDA/ROCm
- Docker
快速开始
下载安装包后,打开应用即可使用:
- 创建声音 Profile(导入音频或录音)
- 输入文本,选择引擎和语言
- 生成语音,应用效果
- 导出或继续编辑
API 文档: http://localhost:17493/docs
暂无评论
