在月之暗面完成 35 亿元人民币 C 轮融资后不久,大模型竞技场 LmArena 上悄然出现了一款名为 “Kiwi-do” 的神秘模型。由于并未提前官宣,这一模型的现身迅速在技术社区引发热议,被视为月之暗面在多模态方向上的一 ...
在月之暗面完成 35 亿元人民币 C 轮融资后不久,大模型竞技场 LmArena 上悄然出现了一款名为 “Kiwi-do” 的神秘模型。由于并未提前官宣,这一模型的现身迅速在技术社区引发热议,被视为月之暗面在多模态方向上的一次“提前亮相”。意外曝光:Kiwi-do 自称来自“月之暗面”Kiwi-do 的曝光颇具戏剧性。一位博主在 LmArena 测试模型时偶然发现该模型,在追问其背景来源时,Kiwi-do 直接回应称自己来自 “月之暗面”。 更引人注意的是,Kiwi-do 在多项测试中的表现异常突出,尤其是在 视觉物理推理测试(VPCT) 中展现出远超平均水平的能力,这也让不少业内人士开始猜测:它是否正是 Kimi 团队正在研发的 新一代多模态模型 K2-VL? 与官方节奏呼应,多模态发布或近在眼前此前,月之暗面已经多次对外释放信号,表示将 加速视觉与语言融合模型的研发进度。 在这一时间窗口内,Kiwi-do 的突然现身显得格外耐人寻味,也被外界视为正式发布前的“试水”或内部测试版本流出,进一步点燃了市场对 Kimi 多模态能力升级的期待。 测试差异明显,或非 K2-Thinking 同源模型从已公开的测试结果来看,Kiwi-do 与现有的 K2-Thinking 并非同一模型:
这也基本排除了 Kiwi-do 只是 K2-Thinking“换皮版本”的可能性,其底层架构或训练重点很可能已经转向 更深度的视觉—语言—物理联合建模。 多模态+物理推理,直指商业应用场景从能力结构来看,Kiwi-do 的优势并不仅限于“看懂图片”,而是进一步融合了 视觉理解与物理推理能力。这种组合在多个实际场景中具备极高价值,例如:
如果这一能力得以稳定落地,Kiwi-do 或其正式版本将不仅是“展示型模型”,而是具备明确商业化潜力的多模态基础模型。 AiGoe 观察:Kiwi-do 或是 Kimi 多模态时代的前奏在大模型竞争从“文本能力”转向“多模态综合理解”的阶段,Kiwi-do 的出现无疑释放了一个强烈信号: 无论 Kiwi-do 最终是否对应 K2-VL、K2.1 还是 K2.5,它都已经展示出 Kimi 在多模态与物理推理方向上的技术野心。随着正式产品的发布临近,这款神秘模型,很可能只是月之暗面新一轮技术升级的序章。 接下来,真正值得关注的,或许不再是“它是谁”,而是——它何时走向真实应用场景。 |
评论