零成本本地替代ElevenLabs
值得看指数 64.0 NO. 006 · 2026.04.14
Stars16,082
为什么值得看
Voicebox是本地优先的开源语音合成工作室,支持从短音频克隆声线并集成5种TTS引擎与后期制作功能。对于担心云端语音服务隐私泄露或想摆脱订阅成本的团队,这是可直接部署的替代方案。
The open-source voice synthesis studio
媒体预览
编辑判断
之前做语音克隆的团队大多在ElevenLabs和Coqui TTS之间摇摆,前者效果好在云端且贵,后者开源但工程化程度低。Voicebox把完整的语音工作流(克隆、生成、混音、导出)打包成桌面应用,且支持Python API扩展。
与GPT-SoVITS这类纯代码方案相比,Voicebox提供了可视化时间线编辑器,做多角色对话广播剧时不需要写脚本拼接音频。如果你的场景是批量生成带情绪控制的营销语音或内部培训材料,又不想把声纹数据上传到第三方,这个工具省掉了很多胶水代码。
Star History