近日,阶跃星辰正式开源了一款全新深度研究模型 Step-DeepResearch,该模型拥有 320 亿参数,专注于开放式研究环境中的自主信息探索与专业报告生成。官方表示,Step-DeepResearch 在深度研究能力上已接近 OpenAI 的 ...
近日,阶跃星辰正式开源了一款全新深度研究模型 Step-DeepResearch,该模型拥有 320 亿参数,专注于开放式研究环境中的自主信息探索与专业报告生成。官方表示,Step-DeepResearch 在深度研究能力上已接近 OpenAI 的 o3-mini 和 Gemini2.0Flash 等顶级商业模型,但部署成本仅为传统模型的十分之一,单次调用成本低于 0.5 元人民币。原子能力设计:闭环反思与动态校正Step-DeepResearch 采用独特设计理念,将复杂研究任务拆解为可训练的 “原子能力”,包括规划、信息检索、反思和交叉验证等。通过这种方法,模型能够在执行过程中实现 闭环反思和动态校正,大幅提升复杂环境下的自适应与泛化能力。其训练流程涵盖智能体中期训练、监督式微调(SFT)以及强化学习(RL),确保在实际科研任务中表现稳定出色。 卓越性能:测试成绩媲美顶级模型在多项测试中,Step-DeepResearch 展现出强劲实力:
支持科研全流程:单智能体架构与 ReAct 范式Step-DeepResearch 基于 ReAct 范式 构建单智能体架构,实现推理、行动与反思的动态循环。模型内置专有工具集,可高效执行网页搜索、文件管理及交互式命令操作,为科研工作流程提供便利,进一步降低科研门槛。 |
评论