标签「语音」共 7 条内容
GPT-SoVITS - 1分钟数据训练高质量TTS模型
5秒样本零样本TTS,1分钟数据微调即可克隆声音。支持中英日韩粤跨语言推理,集成WebUI工具链,58k Stars
45000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
KrillinAI - AI 视频翻译配音工具,一键生成全平台内容
集成翻译、配音、语音克隆,支持横竖屏,输出适配抖音、小红书、B站、YouTube、TikTok
40000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
Voicebox - 开源 AI 语音工作室,本地替代 ElevenLabs
7 引擎 TTS + 语音克隆 + 全局语音输入,本地运行零隐私泄露
35000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
Whisper — OpenAI 开源语音识别模型
68种语言语音转文字,支持多语言识别/翻译/语种检测,命令行即可使用
62000Xiao.XiXiao.Xi1个月前
点击获取 ^_^
vibevoice-mlx - VibeVoice TTS MLX 推理实现(Mac Studio 部署指南)
微软删除官方推理代码后,社区补上的完整 MLX 实现。支持 1.5B/7B 语音合成、零样本语音克隆、量化加速。
70000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
Voicebox
开源本地语音合成工作室,ElevenLabs 的免费替代品,支持 23 种语言
70000Xiao.XiXiao.Xi2个月前
点击获取 ^_^
VibeVoice - 微软开源语音AI
微软开源的前沿语音AI模型,支持60分钟长音频识别和90分钟多说话人语音合成
59000Xiao.XiXiao.Xi2个月前
点击获取 ^_^