腾讯LeVo来袭！媲美Suno 4.5的AI唱歌模型，支持零样本音色克隆

显示全部楼层

腾讯AI团队推出了一款令人振奋的AI唱歌模型LeVo，以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。据悉，LeVo在多项关键指标上可媲美行业领先的Suno4.5，为中国AI音乐生成技术赢得一席之地。AIbase整理最新信息，为您深度解析LeVo的突破性功能与潜力。

媲美Suno4.5

eVo的硬核实力

LeVo由腾讯AI实验室研发，采用语言模型（LM）架构，结合LeLM和音乐编解码器，能够并行生成混合音轨(融合人声与伴奏)或双轨音轨(人声与伴奏分开)。在音乐性、音质、人声与伴奏和谐度以及歌词对齐等维度上，LeVo全面超越现有开源学术模型。根据最新评测，LeVo在歌词对齐能力(LYC)上比Suno4.5高出0.21分，展现出卓越的文本控制能力。

项目地址：https://levo-demo.github.io/

零样本音色克隆:个性化音乐创作新高度

LeVo支持零样本音色克隆（Zero-Shot Voice Cloning），仅需3秒音频片段即可精准复制目标音色，包括音调、情感和韵律。这一功能无需大量训练数据，极大降低了音乐创作的技术门槛。无论是为个人定制专属音色，还是模仿知名歌手风格，LeVo都能提供自然流畅的生成效果，赋予创作者无限可能。

分轨生成:专业音乐制作的利器

与传统AI音乐生成模型不同，LeVo支持双轨生成模式，可分别生成人声和伴奏音轨，为后期混音和编辑提供了更大灵活性。这一功能尤其适合专业音乐制作人，能够轻松实现高质量的分轨输出，优化创作流程。相比之下，Suno4.5在音色克隆和分轨支持上略显不足，LeVo的这一特性无疑为行业树立了新标杆。

高保真与多场景应用

LeVo在音质表现上接近Suno4.5的行业标准，尤其在音乐性、人声与伴奏和谐度和音质（MOS评分）等方面表现出色。尽管在歌曲结构清晰度上略逊于Suno4.5和Mureka-O1，但LeVo通过多偏好对齐方法优化了生成结果，确保音乐在各种风格和场景下都能保持高保真效果。无论是流行音乐、影视配乐还是广告制作，LeVo都能提供专业级输出。

开源承诺:推动AI音乐生态发展

腾讯表示，LeVo将以开源形式发布，计划提供完整代码和预训练模型，供全球开发者免费使用。这一举措不仅体现了腾讯在AI音乐领域的雄心，也为全球音乐创作社区注入了新的活力。AIbase注意到，LeVo的开源策略将有效降低创作门槛，助力内容创作者和音乐爱好者实现创意表达。

腾讯LeVo的发布标志着中国AI音乐生成技术迈向全球前沿，其零样本音色克隆和分轨生成功能为音乐创作带来了革命性突破。尽管在部分指标上与Suno4.5仍有差距，但LeVo凭借高性价比和开源优势，已成为AI音乐领域的强有力竞争者。AIbase认为，LeVo的推出不仅提升了中国AI技术的国际影响力，也为音乐创作的民主化进程迈出了重要一步。

腾讯LeVo来袭！媲美Suno 4.5的AI唱歌模型，支持零样本音色克隆

浏览过的版块