近日,知名开源浏览器自动化项目 BrowserUse 正式发布其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便受到广泛关注,被誉为“网页代理(Web Agent)领域的新标杆”,凭借高性价比和实时响应能力,显 ...
近日,知名开源浏览器自动化项目 BrowserUse 正式发布其首个自研大语言模型——BU-30B-A3B-Preview。该模型一经上线便受到广泛关注,被誉为“网页代理(Web Agent)领域的新标杆”,凭借高性价比和实时响应能力,显著降低了AI浏览器操作的门槛。模型架构:MoE设计,智能与轻量兼备BU-30B-A3B-Preview采用 混合专家(MoE)架构,总参数量达 30B(300亿),但实际推理时仅激活 3B(30亿) 参数。这一设计让模型在保持顶级智能水平的同时,大幅降低资源消耗,仅需单张消费级GPU即可流畅运行。 模型基于阿里云 通义千问 Qwen3-VL-30B-A3B-Instruct 进行深度微调,专为浏览器自动化场景优化,支持多模态输入(视觉+文本),上下文长度高达 32K tokens,能够处理复杂的长网页内容。 核心能力:精准DOM理解与视觉推理在网页自动化任务中,BU-30B-A3B-Preview表现出色,具备完整的网页交互能力,包括:
其强大的 DOM理解能力 和 视觉推理能力,使AI代理能够像人类一样理解页面布局和截图,实现高度可靠的自动化执行。官方表示,该模型非常适合构建 Web Agent应用,如自动化测试、数据采集和RPA流程,并在内部基准测试中达到业内领先水平。 性能亮点:速度快、成本低官方数据表明,BU-30B-A3B-Preview在任务速度与成本效益上均超越主流商用模型:
小体量设计让开发者可在单GPU本地部署,无需高额云端费用,降低使用门槛。 开源价值:加速Web Agent生态发展BU-30B-A3B-Preview已完全开源,模型权重上传至 Hugging Face 平台,开发者可免费获取并集成到 BrowserUse 开源库中。这标志着浏览器自动化领域进入 高效开源时代,有望催生更多创新应用落地。 AIbase点评认为,BU-30B-A3B-Preview完美解决了传统大模型在浏览器任务中“贵而慢”的痛点,对于需要大规模网页自动化的企业和开发者来说,是一款性价比极高的选择。未来,随着社区进一步优化,该模型有望成为 Web Agent领域的标准配置。 |
评论