返回顶部
AiGoe.com 首页 AI快讯

BrowserUse发布自研大语言模型BU-30B-A3B-Preview:开创Web Agent自动化新标杆 ...

AI快讯 2025-12-26 17:50 78人浏览 0人回复
摘要

近日,知名开源浏览器自动化项目 BrowserUse 正式发布其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便受到广泛关注,被誉为“网页代理(Web Agent)领域的新标杆”,凭借高性价比和实时响应能力,显 ...

 近日,知名开源浏览器自动化项目 BrowserUse 正式发布其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便受到广泛关注,被誉为“网页代理(Web Agent)领域的新标杆”,凭借高性价比和实时响应能力,显著降低了AI浏览器操作的门槛。

模型架构:MoE设计,智能与轻量兼备

BU-30B-A3B-Preview采用 混合专家(MoE)架构,总参数量达 30B(300亿),但实际推理时仅激活 3B(30亿) 参数。这一设计让模型在保持顶级智能水平的同时,大幅降低资源消耗,仅需单张消费级GPU即可流畅运行。

模型基于阿里云 通义千问 Qwen3-VL-30B-A3B-Instruct 进行深度微调,专为浏览器自动化场景优化,支持多模态输入(视觉+文本),上下文长度高达 32K tokens,能够处理复杂的长网页内容。

核心能力:精准DOM理解与视觉推理

在网页自动化任务中,BU-30B-A3B-Preview表现出色,具备完整的网页交互能力,包括:

  • 精准元素定位

  • 点击与滚动操作

  • 表单填写与提交

其强大的 DOM理解能力视觉推理能力,使AI代理能够像人类一样理解页面布局和截图,实现高度可靠的自动化执行。官方表示,该模型非常适合构建 Web Agent应用,如自动化测试、数据采集和RPA流程,并在内部基准测试中达到业内领先水平。

性能亮点:速度快、成本低

官方数据表明,BU-30B-A3B-Preview在任务速度与成本效益上均超越主流商用模型:

  • 平均每步操作仅需 1.2秒

  • 每1美元计算资源可完成约 200个浏览器任务,远超部分竞品数十倍

小体量设计让开发者可在单GPU本地部署,无需高额云端费用,降低使用门槛。

开源价值:加速Web Agent生态发展

BU-30B-A3B-Preview已完全开源,模型权重上传至 Hugging Face 平台,开发者可免费获取并集成到 BrowserUse 开源库中。这标志着浏览器自动化领域进入 高效开源时代,有望催生更多创新应用落地。

AIbase点评认为,BU-30B-A3B-Preview完美解决了传统大模型在浏览器任务中“贵而慢”的痛点,对于需要大规模网页自动化的企业和开发者来说,是一款性价比极高的选择。未来,随着社区进一步优化,该模型有望成为 Web Agent领域的标准配置

模型下载地址:Hugging Face – BU-30B-A3B-Preview

本文暂无评论,快来抢沙发!

推荐阅读
热门问答
AiGoe.com 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2001-2020, Tencent Cloud. |
  • | 营业执照 | |星点互联科技有限公司|鲁ICP备19001237号-21|鲁公网安备 4236902302000354号