国产大模型再迎重磅突破。**中国电信人工智能研究院(TeleAI)**近日正式开源 星辰语义大模型 TeleChat3 系列,包括国内首个基于 全国产算力 训练的 千亿参数细粒度 MoE 模型——TeleChat3-105B-A4.7B-Thinking,以 ...
国产大模型再迎重磅突破。**中国电信人工智能研究院(TeleAI)**近日正式开源 星辰语义大模型 TeleChat3 系列,包括国内首个基于 全国产算力 训练的 千亿参数细粒度 MoE 模型——TeleChat3-105B-A4.7B-Thinking,以及稠密架构的 TeleChat3-36B-Thinking。该系列模型完全依托上海临港 国产万卡算力池 训练,基础训练数据高达 15万亿 tokens,标志着我国在 超大规模AI模型自主可控 领域迈出关键一步。全栈国产化:芯片、算力与框架全链路适配TeleChat3 系列深度适配 华为昇腾生态:
这一举措不仅验证了国产 软硬件栈 支撑 千亿级大模型 的能力,也为行业提供了 安全、可靠、可替代的技术路径,对保障 AI基础设施供应链安全 具有战略意义。 创新Thinking模式:AI推理过程可追溯TeleChat3 全系引入 Thinking(思考模式)机制——通过在对话模板中加入特定引导符号,模型可自动生成 中间推理步骤,显著提升复杂任务的 逻辑性与准确性。 在 知识问答、数学推理、内容创作、代码生成、智能体(Agent) 六大核心维度,TeleChat3 已能比肩国际主流头部模型。 开源赋能产业生态目前,TeleChat3 系列模型权重、推理代码及使用示例 已同步上线 GitHub 与 魔搭(ModelScope) 平台,支持 学术研究与商业应用。 项目地址:https://github.com/Tele-AI/TeleChat3 AiGoe观察:国产大模型进入全栈自研+能力对标新阶段TeleChat3 的发布,不仅展示了技术实力,更体现了 国产AI产业自主可控战略 的落地。当 千亿MoE模型 能在纯 国产算力 上高效训练,当 Thinking模式 逼近国际先进水平,国产大模型正从“可用”走向“好用”乃至“敢用”。 在全球 AI 竞争日益 地缘化 的背景下,中国电信以 TeleAI 为支点,正构建 安全、开放、高性能的国产AI技术栈。这一路径的成败,将直接影响中国在未来 智能时代的技术话语权。 |
评论