返回顶部
AiGoe.com 首页 AI快讯

阿里巴巴推出紧凑型Qwen3-VL模型,提升多模态AI效率,加速边缘设备部署 ...

AI快讯 2025-10-15 18:02 7人浏览 0人回复
摘要

阿里巴巴人工智能部门今日正式发布Qwen3-VL视觉语言模型系列的紧凑版,推出4亿和8亿参数的变体。此举标志着先进多模态AI技术向边缘设备和资源受限环境更广泛应用的重大飞跃。性能飞跃,小模型媲美巨头此次发布的4B和 ...

 阿里巴巴人工智能部门今日正式发布Qwen3-VL视觉语言模型系列的紧凑版,推出4亿和8亿参数的变体。此举标志着先进多模态AI技术向边缘设备和资源受限环境更广泛应用的重大飞跃。

性能飞跃,小模型媲美巨头

此次发布的4B和8B模型均提供Instruct和Thinking版本,并针对STEM推理、视觉问答(VQA)、光学字符识别(OCR)、视频理解及代理任务等核心多模态能力进行了优化。

根据公布的基准测试结果,这些小型模型在多个类别中表现出色,超越了Gemini2.5Flash Lite和GPT-5Nano等竞争对手。更引人注目的是,其性能在若干领域甚至能与仅六个月前发布的更大规模Qwen2.5-VL-72B模型相媲美,展示出极高的参数效率。

资源优化,推动AI民主化

新模型的关键亮点在于显著降低的VRAM使用率,使其可以直接在消费级硬件如笔记本电脑和智能手机上运行。为进一步提升效率,阿里巴巴还提供了FP8量化版本,在不牺牲核心能力的前提下进一步降低资源消耗。正如一位参与开发的Qwen团队成员所说:“小型VL模型适用于部署,并在手机和机器人领域具有显著意义。”

快速迭代,开源共享

此次紧凑模型的推出,延续了9月首发的Qwen3-VL系列(旗舰模型参数规模达2350亿)的路线图。此前,阿里巴巴在十月初已发布30B-A3B变体,通过仅30亿活跃参数实现了与GPT-5Mini和Claude4Sonnet相当的基准测试结果。这种快速迭代被业内视为阿里巴巴推动高性能AI民主化的有力体现,尤其适用于机器人等具身系统。

地址:

https://huggingface.co/collections/Qwen/qwen3-vl-68d2a7c1b8a8afce4ebd2dbe

https://github.com/QwenLM/Qwen3-VL/tree/main/cookbooks

本文暂无评论,快来抢沙发!

推荐阅读
热门问答
AiGoe.com 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2001-2020, Tencent Cloud. |
  • | 营业执照 | |星点互联科技有限公司|鲁ICP备19001237号-21|鲁公网安备 4236902302000354号