Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verified 基准拿下72.2% 得分,刷新开源类别最佳成绩;官方宣称「成本效益比 ...
|
Mistral AI 正式推出第二代开源编码模型家族:Devstral2(1230亿参数旗舰版)与 Devstral Small2(240亿参数轻量版)。旗舰模型在 SWE-Bench Verified 基准拿下72.2% 得分,刷新开源类别最佳成绩;官方宣称「成本效益比 Claude Sonnet 低7倍」,并同步开源 CLI 工具 Mistral Vibe,支持自然语言批量改代码。两款模型已上线 API,Devstral2每百万输入 token0.40美元,轻量版 完全免费 。 模型速览:一大一小,开源双轨 性能突破:72.2% 刷新开源代码模型纪录 - SWE-Bench Verified:Devstral2得分72.2%,超越 CodeLlama-70B(53.8%)、DeepSeek-Coder-33B(61.4%),距离 GPT-4-Turbo(73.2%)仅1pp - HumanEval:84.1% Pass@1,领先同类开源模型6-8pp - 成本:官方称「比 Claude Sonnet 便宜7倍」;0.4$/M in 约为 GPT-4-Turbo 的1/5 开源工具:Mistral Vibe —— 自然语言批量改代码 - 功能:一句「把函数改为异步」可自动重写整个仓库,支持 diff 预览与回滚 - 引擎:本地调用 Devstral Small2(Apache2.0),无需联网即可跑 - 集成:VS Code 插件已上架,支持一键修复 ESLint 错误或添加单测 商业策略:轻量免费+旗舰 API,分层收割 - Devstral Small2:Apache2.0,可商用、可微调、可嵌入 - Devstral2:修改 MIT,月营收>2000万美元需购买商业许可或走官方 API,避免「大厂白嫖」 - API 定价:输入0.4$/M、输出1.2$/M;前30天免费额度100万 token 行业信号:开源编码模型进入「70+ 俱乐部」 -2024年主流开源代码模型 SWE-Bench 普遍50-60%;Devstral2直接把门槛拉到72%+ - 低成本+高分数,将冲击 GitHub Copilot、Cursor 等付费插件的性价比 - 轻量版完全免费,有望加速「本地 AI 编码助手」普及,开发者 RTX4090即可跑24B 模型
相关阅读
近期文章
推荐阅读
热门问答
|
评论