返回顶部
AiGoe.com 首页 AI快讯

DeepSeek“企鹅家族”深夜泄露512 预算Emperor 剑指 GPT-5.2无推理

AI快讯 2025-12-4 17:43 57人浏览 0人回复
摘要

12月4日凌晨,GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”(Penguin)的全新模型矩阵,四档推理预算首次曝光:旗舰 Emperor512、中端 Rockhopper64、轻量 Macaroni16与零推理 Mumble0,覆盖从云端到边缘 ...

 12月4日凌晨,GitHub 与 DesignArena 同步流出 OpenAI 内部代号“企鹅”(Penguin)的全新模型矩阵,四档推理预算首次曝光:旗舰 Emperor512、中端 Rockhopper64、轻量 Macaroni16与零推理 Mumble0,覆盖从云端到边缘的全场景需求 。

512推理预算!Emperor 或成 GPT-5.2核心

内部文件显示,Emperor 拥有512单位“juice”推理预算,为现行模型8-10倍,端到端延迟却控制在80ms 以内,实现“零等待”对话体验;代码路径已嵌入实时剪枝与动态计算分配,疑似为明年 GPT-5.2提供底层架构 。

四档预算=四种 latency:Macaroni 主打极速,Mumble 彻底去推理

- Rockhopper(64)(中端)定位“推理+速度”平衡,目标替代 GPT-4.5

- Macaroni(16)面向移动端,首次在8Gen3芯片跑通70B 模型

- Mumble(0)完全跳过推理步骤,响应时间<50ms,用于高频自动完成与语音打断场景 

记忆搜索同步曝光:一键召回对话上下文

同批泄露的代码显示,ChatGPT 将新增“Memory Search”按钮,用户输入自然语言即可即时检索历史记忆,无需再手动翻找聊天记录;该功能已内测,预计与企鹅家族模型一同上线 。

Shallotpeat & Garlic 接踵而至:OpenAI 拉响红色警报

The Information 补充,OpenAI 下周或发布内部代号 Shallotpeat 的新推理模型,性能已领先 Gemini3;另一款 Garlic 完成预训练,2026年初以 GPT-5.2/5.5形式推出,主打“小参数+高密度知识”路线,直接对标谷歌“预训练飞跃”。

行业震荡:开源与闭源同时提速

- 对于开发者,四档预算意味着同一代号即可调用“延迟-成本-精度”不同组合,API 定价有望下探30%

- 对于竞品,OpenAI 首次把“推理 budget”做成明码标价,迫使 Google、Anthropic 跟进类似分级

- 对于监管,零推理 Mumble 的极速响应可能放大错误率,安全评估或成为发布前最后一道关卡

OpenAI 尚未公布企鹅家族具体发布日期,但已在 DesignArena 开启盲测,获胜模型将直接并入 ChatGPT Plus 与 Enterprise 通道。AIbase 将持续跟踪,第一时间带来基准成绩与 API 定价细节。

本文暂无评论,快来抢沙发!

推荐阅读
热门问答
AiGoe.com 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2001-2020, Tencent Cloud. |
  • | 营业执照 | |星点互联科技有限公司|鲁ICP备19001237号-21|鲁公网安备 4236902302000354号