安岽旭 发表于 2026-3-30 09:46:32

哇塞!开源 TTS 来袭,仅需 3 秒就能克隆任意声音啦!

哇塞!开源 TTS 来袭,仅需 3 秒就能克隆任意声音啦!#科技潮人#

LuxTTS 刚刚开源,它可是一个基于 ZipVoice 架构的轻量语音克隆模型哦。只要有 3 秒的参考音频,就能轻松克隆出任意声音,而且它超厉害,支持 GPU、CPU 以及 Mac MPS 全平台运行呢。
🎤 克隆效果那叫一个绝:官方都说啦,这语音克隆效果能和体积大它 10 倍的模型相媲美,达到了当前的 SOTA 水准哟。
⚡ 速度快得逆天:用单卡能跑出 150x 的实时速度,就算在 CPU 上也能超实时运行。
🔊 音质更是高得没话说:它输出的是 48kHz,可大多数 TTS 模型才 24kHz 呢,同等时长下,信息量直接翻倍啦。
💻 门槛低到尘埃里:只需要 1GB 显存,随便一块本地 GPU 都能让它跑起来。而且它在 GitHub 上完全开源,遵循 Apache - 2.0 协议,在本地运行完全不用交订阅费。
要是你在做播客、配音或者当 AI 主播,那可得好好关注一下这个,在本地运行,使用次数不限制,还没有信息泄露的风险哟。


页: [1]
查看完整版本: 哇塞!开源 TTS 来袭,仅需 3 秒就能克隆任意声音啦!