返回顶部
AiGoe.com 首页 AI快讯

通义千问发布Qwen3-LiveTranslate-Flash3秒同传延迟刷新行业纪录

AI快讯 2025-9-30 16:29 47人浏览 0人回复
摘要

9月30日,通义千问发布基于大语言模型的多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash,为跨语言交流带来革命性突破。该系统支持18种语言的离线和实时翻译,覆盖中文、英语、法语、德语、俄语、西班牙语等主流 ...

 9月30日,通义千问发布基于大语言模型的多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash,为跨语言交流带来革命性突破。

该系统支持18种语言的离线和实时翻译,覆盖中文、英语、法语、德语、俄语、西班牙语等主流语言,以及普通话、粤语、北京话、吴语等多种方言,为国际交流提供全方位语言支持。

Qwen3-LiveTranslate-Flash的核心创新在于视觉上下文增强技术。系统不仅能"听懂"语言,还能通过识别口型、动作、文字和实体等多模态信息"看懂"上下文,有效提升嘈杂环境和复杂语境下的翻译准确性,破解一词多译等翻译难题。

在延迟控制方面,该系统采用轻量混合专家架构与动态采样策略,实现最低仅3秒的同传延迟,大幅提升实时翻译流畅性。通过语义单元预测技术,系统还减轻了跨语言翻译中的调序问题,确保接近离线翻译的高质量输出。


测试数据显示,Qwen3-LiveTranslate-Flash在中英及多语言翻译准确率上显著超越Gemini-2.5-Flash、GPT-4o-Audio-Preview和Voxtral Small-24B等主流模型,在多领域和复杂声学环境下表现卓越。

语音合成方面,系统基于海量语音数据训练,能根据原始语音内容自适应调整语气和表现力,生成自然流畅的音色。通义千问表示,未来将持续提升翻译准确性和自然度,扩展语种覆盖范围,增强复杂语音环境下的鲁棒性。

本文暂无评论,快来抢沙发!

推荐阅读
热门问答
AiGoe.com 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2001-2020, Tencent Cloud. |
  • | 营业执照 | |星点互联科技有限公司|鲁ICP备19001237号-21|鲁公网安备 4236902302000354号