9月30日,通义千问发布基于大语言模型的多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash,为跨语言交流带来革命性突破。该系统支持18种语言的离线和实时翻译,覆盖中文、英语、法语、德语、俄语、西班牙语等主流 ...
9月30日,通义千问发布基于大语言模型的多语言实时音视频翻译系统Qwen3-LiveTranslate-Flash,为跨语言交流带来革命性突破。 该系统支持18种语言的离线和实时翻译,覆盖中文、英语、法语、德语、俄语、西班牙语等主流语言,以及普通话、粤语、北京话、吴语等多种方言,为国际交流提供全方位语言支持。 Qwen3-LiveTranslate-Flash的核心创新在于视觉上下文增强技术。系统不仅能"听懂"语言,还能通过识别口型、动作、文字和实体等多模态信息"看懂"上下文,有效提升嘈杂环境和复杂语境下的翻译准确性,破解一词多译等翻译难题。 在延迟控制方面,该系统采用轻量混合专家架构与动态采样策略,实现最低仅3秒的同传延迟,大幅提升实时翻译流畅性。通过语义单元预测技术,系统还减轻了跨语言翻译中的调序问题,确保接近离线翻译的高质量输出。 |
评论