返回顶部
AiGoe.com 首页 AI快讯

国产大模型重磅开源:中国电信TeleChat3系列实现千亿参数全栈国产化突破 ...

AI快讯 2026-1-5 18:57 52人浏览 0人回复
摘要

国产大模型再迎重磅突破。**中国电信人工智能研究院(TeleAI)**近日正式开源 星辰语义大模型 TeleChat3 系列,包括国内首个基于 全国产算力 训练的 千亿参数细粒度 MoE 模型——TeleChat3-105B-A4.7B-Thinking,以 ...

 国产大模型再迎重磅突破。**中国电信人工智能研究院(TeleAI)**近日正式开源 星辰语义大模型 TeleChat3 系列,包括国内首个基于 全国产算力 训练的 千亿参数细粒度 MoE 模型——TeleChat3-105B-A4.7B-Thinking,以及稠密架构的 TeleChat3-36B-Thinking。该系列模型完全依托上海临港 国产万卡算力池 训练,基础训练数据高达 15万亿 tokens,标志着我国在 超大规模AI模型自主可控 领域迈出关键一步。

全栈国产化:芯片、算力与框架全链路适配

TeleChat3 系列深度适配 华为昇腾生态

  • 支持 昇腾 Atlas800T A2 训练服务器

  • 基于 昇思 MindSpore 框架 开发;

  • 训练与推理全流程运行于 国产AI算力基础设施

这一举措不仅验证了国产 软硬件栈 支撑 千亿级大模型 的能力,也为行业提供了 安全、可靠、可替代的技术路径,对保障 AI基础设施供应链安全 具有战略意义。


创新Thinking模式:AI推理过程可追溯

TeleChat3 全系引入 Thinking(思考模式)机制——通过在对话模板中加入特定引导符号,模型可自动生成 中间推理步骤,显著提升复杂任务的 逻辑性与准确性

知识问答、数学推理、内容创作、代码生成、智能体(Agent) 六大核心维度,TeleChat3 已能比肩国际主流头部模型。
例如,在数学题求解中,模型不再仅输出答案,而是展示完整思维链:“理解题意 → 拆解步骤 → 公式应用 → 验证结果”,大幅提升 可信度与可调试性

开源赋能产业生态

目前,TeleChat3 系列模型权重、推理代码及使用示例 已同步上线 GitHub魔搭(ModelScope) 平台,支持 学术研究与商业应用
中国电信表示,将持续推动模型在 政务、通信、能源、金融 等关键行业落地,助力 “人工智能+” 行动深入行业核心,推动国产 AI 技术生态发展。

项目地址:https://github.com/Tele-AI/TeleChat3


AiGoe观察:国产大模型进入全栈自研+能力对标新阶段

TeleChat3 的发布,不仅展示了技术实力,更体现了 国产AI产业自主可控战略 的落地。当 千亿MoE模型 能在纯 国产算力 上高效训练,当 Thinking模式 逼近国际先进水平,国产大模型正从“可用”走向“好用”乃至“敢用”。

在全球 AI 竞争日益 地缘化 的背景下,中国电信以 TeleAI 为支点,正构建 安全、开放、高性能的国产AI技术栈。这一路径的成败,将直接影响中国在未来 智能时代的技术话语权

本文暂无评论,快来抢沙发!

推荐阅读
热门问答
AiGoe.com 成立于2014年8月,是目前国内优秀的开源技术社区,拥有超过300万会员,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2001-2020, Tencent Cloud. |
  • | 营业执照 | |星点互联科技有限公司|鲁ICP备19001237号-21|鲁公网安备 4236902302000354号