发布即适配!天数智芯速配 GLM-5,彰显全栈算力适配能力

来源:天数智芯 #天数智芯#
4595

2月12日,智谱 AI 新一代旗舰大模型 GLM-5 正式发布,凭借744B 超大参数规模、架构师级推理、行业领先的编程能力与 202K tokens 超长上下文的核心优势,迅速引爆开发者社区,成为国产大模型在AI Agent 与复杂编程领域的标杆产品。

天数智芯第一时间快速响应,依托全栈自研算力技术体系完成与 GLM-5 的全链路深度适配,实现“发布即兼容、适配即可用”的突破,再度彰显国产算力的高效适配能力与硬核技术实力,为国产 “模型+算力”协同发展再树新标杆。

在全球权威的 Artificial Analysis 榜单中,GLM-5 位居全球第四、开源第一

此次闪电适配,核心源于天数智芯深厚的技术积淀与对MoE(混合专家)架构的深度优化能力。GLM-5 采用深度稀疏 MoE 架构,集成 256 个专家模块、每次推理仅激活 8 个专家,搭配稀疏注意力机制(DSA)与多 Token 预测(MTP)技术,对算力资源的精细化调度提出高要求。

天数智芯以天枢架构为核心支撑,其三大创新设计精准契合 GLM-5 的 MoE 架构特性,针对模型稀疏注意力机制、多Token 预测推理等核心技术设计,实现算力资源的精准调度与高效利用;同时,天垓系列训练芯片、智铠系列推理芯片组成的“训推一体” 算力矩阵,无缝承接 GLM-5 训推全场景需求,搭配自研软件栈针对模型超长上下文、超大输出、稀疏激活的特性定制优化,大幅缩短适配周期,高效支撑模型核心能力充分释放。

GLM-5 在 Agent 能力上实现开源 SOTA,在多个评测基准中取得开源第一

适配过程中,天数智芯聚焦性能与稳定性双重打磨,针对GLM-5编程工程、长上下文推理、智能体长程规划等核心场景优化高性能算子,让模型精度精准对标官方实测水平,在通用Agent助手、全流程编程、办公文档直接输出等实际场景中稳定性优异。借助动态线程组调度机制,天数智芯精准解决MoE 架构推理效率低的行业痛点,将 GLM-5 算力利用率大幅提升,同时成本相较国际方案大幅降低,为这款旗舰模型的规模化商用与落地大幅降低算力门槛。

作为国内领先的通用算力企业,天数智芯此前已实现对GLM 系列大模型的全版本适配,此次与 GLM-5 的发布即适配,实现高吞吐、低延迟的稳定运行,既进一步验证了天数智芯对热门国产大模型的快速响应与深度适配能力,也充分印证了天数GPU 架构的通用性、高效性与场景适配性。

未来,天数智芯将与智谱AI 持续围绕 GLM-5 正式版本迭代打磨场景化算力方案,针对模型编程、智能体、数据处理等核心优势场景做算力深度优化;同时继续深耕全栈自研技术,持续完善算力产品与解决方案,为更多国产爆款大模型提供高效、自主可控的算力支撑,以 “模型 + 算力” 双轮驱动,助力国产 AI 产业高质量发展。

责编: 爱集微
来源:天数智芯 #天数智芯#
THE END
关闭
加载

PDF 加载中...