Mistral AI 发布 Devstral2507:为代码中心语言建模而生

AiGoe.com › 首页 › AI快讯 ›

Mistral AI 发布 Devstral2507:为代码中心语言建模而生

AI快讯 2025-7-11 20:32 282人浏览 0人回复

删除收藏分享邀请

摘要

近日，Mistral AI 与 All Hands AI 合作，推出了针对开发者的大型语言模型 Devstral2507系列，包含两款新模型:Devstral Small1.1和 Devstral Medium2507。这些模型旨在支持基于智能代理的代码推理、程序合成和结构化 ...

近日，Mistral AI 与 All Hands AI 合作，推出了针对开发者的大型语言模型 Devstral2507系列，包含两款新模型:Devstral Small1.1和 Devstral Medium2507。这些模型旨在支持基于智能代理的代码推理、程序合成和结构化任务执行，适用于大型软件代码库的实际应用。这次发布在性能和成本上进行了优化，使其在开发工具和代码自动化系统中具有广泛的应用潜力。

Devstral Small1.1是一款开源模型，基于 Mistral-Small-3.1基础模型，拥有约240亿个参数。该模型支持128k 的上下文窗口，能够处理多文件代码输入和复杂的长提示，符合软件工程工作流程的特点。此版本特别针对结构化输出进行微调，包括 XML 和函数调用格式，使其与 OpenHands 等代理框架兼容，适合程序导航、多步骤编辑和代码搜索等任务。Devstral Small1.1的许可为 Apache2.0，支持研究和商业用途。

在性能测试方面，Devstral Small1.1在 SWE-Bench Verified 基准测试中获得53.6% 的成绩，证明其在为真实的 GitHub 问题生成正确补丁方面表现优异。虽然其性能不及大型商业模型，但在大小、推理成本和推理能力之间找到了一个平衡点，适合多种编码任务。

此外，该模型以多种格式发布，包括可以在高内存 GPU（如 RTX4090）或32GB RAM 以上的 Apple Silicon 机器上进行本地推理的量化版本。同时，Mistral 还通过其推理 API 提供模型，当前的收费标准与 Mistral-Small 系列模型相同。

Devstral Medium2507则仅通过 Mistral API 或企业部署协议提供，并不开放源代码。该模型在 SWE-Bench Verified 基准测试中得分为61.6%，在长上下文的推理能力上表现出色，能够超越一些商业模型，如 Gemini2.5Pro 和 GPT-4.1。此模型的 API 收费标准高于 Small 版本，但其强大的推理能力使其非常适合在大型代码库中执行任务。

Devstral Small 更适合本地开发、实验或集成到客户端开发工具中，而 Devstral Medium 则在结构化代码编辑任务中提供更高的准确性和一致性，适合需要高性能的生产服务。两款模型的设计都支持与代码代理框架的集成，使其能够简化测试生成、重构和错误修复的自动化工作流程。

通过此次发布，Mistral AI 的 Devstral2507系列为开发者提供了不同的选择，以满足不同的软件工程需求，从实验性的代理开发到商业环境中的实际部署，都能得到有效支持。

huggingface:https://huggingface.co/mistralai/Devstral-Small-2507

上一篇：墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

下一篇：5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公 ...

Mistral AI 发布 Devstral2507:为代码中心语言建模而生

相关阅读

无需CUDA代码！H100加速提升33%-50%，Flash Attention作者新作引发热议 ...

马蜂窝“AI路书”全面开放，AI旅行助手再添实用功能

腾讯混元Hunyuan-A13B模型API上线

谷歌DeepMind开源GenAI Processors：一键构建实时AI工作流

Manus AI官网及社交媒体现变动，中国用户或受影响

墨刀AI重磅上线：输入想法30秒生成高保真、可编辑原型

5分钟生成专业PPT！智谱AI Slides火爆上线，GLM-Experimental带你体验未来办公 ...

谷歌宣布最新一届美国人工智能基础设施学院学员名单

AWS 在 AI 竞争中加码基础设施，SageMaker 平台迎来重大升级

英伟达市值首次突破 4 万亿美元，黄仁勋将与特朗普会面引关注 ...

微软 BioEmu 模型实现蛋白质模拟时间大幅缩短

Llama 被抛弃！Meta转向Claude，内情大揭秘

马斯克的新AI聊天机器人Grok 4：是追求真理还是个人观点的代言？ ...

OpenAI悄然新增Shopify为搜索合作伙伴，强化ChatGPT购物搜索功能

智谱上线了类似Manus的PPT生成功能AI Slides，免费使用无限制

特斯拉申请在亚利桑那州测试Robotaxi，紧追Waymo步伐

Mistral 发布 Devstral2 开源编程模型：1230 亿参数，成本仅 Claude Sonnet 1/7 ...