# GPT-SoVITS - 1分钟数据训练高质量TTS模型 > 5秒样本零样本TTS,1分钟数据微调即可克隆声音。支持中英日韩粤跨语言推理,集成WebUI工具链,58k Stars GPT-SoVITS 是一个强大的少样本语音转换与文本转语音 WebUI,仅需 1 分钟语音数据即可训练出高质量的 TTS 模型。 ## 核心能力 - **Zero-shot TTS**:输入 5 秒语音样本,即时文本转语音 - **Few-shot TTS**:1 分钟训练数据微调,显著提升声音相似度与真实感 - **跨语言支持**:支持英语、日语、韩语、粤语、中文的跨语言推理 - **完整 WebUI 工具链**:集成语音伴奏分离、自动训练集分割、中文 ASR、文本标注,零基础也能创建训练数据集和 GPT/SoVITS 模型 ## 推理速度 - RTX 4060Ti:RTF 0.028 - RTX 4090:RTF 0.014(1400 词≈4 分钟,推理耗时 3.36 秒) - Apple M4 CPU:RTF 0.526 ## 安装 ```bash # Windows / Linux / macOS conda create -n GPTSoVits python=3.10 conda activate GPTSoVits bash install.sh --device CU126 --source HF ``` Windows 用户可直接下载集成包,双击 `go-webui.bat` 启动。 ## 在线体验 - [HuggingFace Demo](https://lj1995-gpt-sovits-proplus.hf.space/) - [AutoDL 云镜像](https://www.codewithgpu.com/i/RVC-Boss/GPT-SoVITS/GPT-SoVITS-Official)(国内用户) ## 系统要求 | Python | PyTorch | 设备 | |--------|---------|------| | 3.10-3.12 | 2.5.1+ | CUDA 12.4/12.8 | | 3.9-3.11 | 2.5.1+ | Apple Silicon | | 3.9 | 2.2.2 | CPU | ## 生态 - 58k+ Stars,6.3k+ Forks - 多语言文档:中文、英文、日文、韩文、土耳其文 - 活跃社区,持续更新(v3 已支持 CUDA Graph,推理速度翻倍) --- **分类**:源码 **标签**:语音 · GPT · SoVITS **作者**:Xiao.Xi **链接**:https://octohz.com/p/1752