406B 参量 + 256K 上下文！腾讯混元 2.0 发布，MoE 架构重塑复杂推理新标杆 ...

AiGoe.com › 首页 › AI快讯 ›

AI快讯 2025-12-6 11:45 180人浏览 0人回复

删除收藏分享邀请

摘要

腾讯通过自研混元 2.0 + 接入 DeepSeek V3.2 构建双模型生态，覆盖日常问答、复杂推理到企业级开发全场景，已在核心应用和腾讯云同步开放服务。一、两大模型核心能力亮点1. 腾讯混元 2.0（Tencent HY2.0）核心参数： ...

腾讯通过自研混元 2.0 + 接入 DeepSeek V3.2 构建双模型生态，覆盖日常问答、复杂推理到企业级开发全场景，已在核心应用和腾讯云同步开放服务。

核心参数：采用 MoE 架构，总参数量 406B（激活参数 32B），支持 256K 超长上下文窗口（约 40 万字中文文本）。
推理能力：通过 Large Rollout 强化学习，在 IMO-AnswerBench、HMMT2025 等权威数学竞赛测试中取得一流成绩，HLE 和 ARC AGI 任务表现大幅提升，稳居国内第一梯队。
实用优势：引入长度惩罚策略，相同准确率下 token 消耗更低，智能密度业界领先；RLVR+RLHF 双阶段强化学习减少 “AI 味”，文本创作、前端开发表现突出。
落地能力：规模化可验证环境支撑 Agentic Coding 和复杂工具调用，在 SWE-bench Verified、Tau2-Bench 等真实场景智能体任务中实现跃升。

混元 2.0：腾讯自研核心，聚焦 “通用 + 复杂场景”，主打长上下文、高智能密度和生态深度融合，适合企业级定制、长文本处理和复杂推理任务。
DeepSeek V3.2：生态补充型模型，侧重 “效率 + 开源灵活度”，常规版适配日常问答和通用 Agent 任务，Speciale 版探索推理能力边界，适合开发者二次开发和科研场景。
协同优势：用户可在元宝、ima 等应用中按需切换，开发者可通过腾讯云一站式获取两种模型能力，覆盖从轻量化使用到极致性能的全需求。