返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

腾讯LeVo来袭!媲美Suno 4.5的AI唱歌模型,支持零样本音色克隆

[复制链接]
admin 显示全部楼层 发表于 2025-6-17 15:48:03 |阅读模式 打印 上一主题 下一主题
腾讯AI团队推出了一款令人振奋的AI唱歌模型LeVo,以其强大的音色克隆、分轨生成和高保真音乐表现引发业界热议。据悉,LeVo在多项关键指标上可媲美行业领先的Suno4.5,为中国AI音乐生成技术赢得一席之地。AIbase整理最新信息,为您深度解析LeVo的突破性功能与潜力。
媲美Suno4.5eVo的硬核实力
LeVo由腾讯AI实验室研发,采用语言模型(LM)架构,结合LeLM和音乐编解码器,能够并行生成混合音轨(融合人声与伴奏)或双轨音轨(人声与伴奏分开)。在音乐性、音质、人声与伴奏和谐度以及歌词对齐等维度上,LeVo全面超越现有开源学术模型。根据最新评测,LeVo在歌词对齐能力(LYC)上比Suno4.5高出0.21分,展现出卓越的文本控制能力。
零样本音色克隆:个性化音乐创作新高度
LeVo支持零样本音色克隆(Zero-Shot Voice Cloning),仅需3秒音频片段即可精准复制目标音色,包括音调、情感和韵律。这一功能无需大量训练数据,极大降低了音乐创作的技术门槛。无论是为个人定制专属音色,还是模仿知名歌手风格,LeVo都能提供自然流畅的生成效果,赋予创作者无限可能。
分轨生成:专业音乐制作的利器
与传统AI音乐生成模型不同,LeVo支持双轨生成模式,可分别生成人声和伴奏音轨,为后期混音和编辑提供了更大灵活性。这一功能尤其适合专业音乐制作人,能够轻松实现高质量的分轨输出,优化创作流程。相比之下,Suno4.5在音色克隆和分轨支持上略显不足,LeVo的这一特性无疑为行业树立了新标杆。
高保真与多场景应用
LeVo在音质表现上接近Suno4.5的行业标准,尤其在音乐性、人声与伴奏和谐度和音质(MOS评分)等方面表现出色。尽管在歌曲结构清晰度上略逊于Suno4.5和Mureka-O1,但LeVo通过多偏好对齐方法优化了生成结果,确保音乐在各种风格和场景下都能保持高保真效果。无论是流行音乐、影视配乐还是广告制作,LeVo都能提供专业级输出。
开源承诺:推动AI音乐生态发展
腾讯表示,LeVo将以开源形式发布,计划提供完整代码和预训练模型,供全球开发者免费使用。这一举措不仅体现了腾讯在AI音乐领域的雄心,也为全球音乐创作社区注入了新的活力。AIbase注意到,LeVo的开源策略将有效降低创作门槛,助力内容创作者和音乐爱好者实现创意表达。
腾讯LeVo的发布标志着中国AI音乐生成技术迈向全球前沿,其零样本音色克隆和分轨生成功能为音乐创作带来了革命性突破。尽管在部分指标上与Suno4.5仍有差距,但LeVo凭借高性价比和开源优势,已成为AI音乐领域的强有力竞争者。AIbase认为,LeVo的推出不仅提升了中国AI技术的国际影响力,也为音乐创作的民主化进程迈出了重要一步。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

星点互联 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作