Day0适配|壁仞科技高效支持智谱旗舰模型GLM-5.2

来源:壁仞科技 #智谱# #壁仞科技#
1212

6月16日晚,智谱正式开源新一代旗舰模型GLM-5.2,壁仞科技壁砺™166系列基于vLLM推理框架完成该模型的“Day0”适配与调优,率先向广大开发者及用户提供快速部署方案,以及高效稳定的长程任务体验。

基于壁砺™166完成GLM-5.2模型vLLM推理

GLM-5.2:专为长程任务能力而生

根据官方介绍,GLM-5.2是智谱迄今能力最强的开源模型。在全球百万用户参与盲测的前端开发评估系统Code Arena 上,GLM-5.2取得全球可用模型第一的表现。

GLM-5.2专为长程任务能力而生,真正实现Solid的1M无损上下文,稳定支撑长程任务;不仅工程体感更强,GLM-5.2在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。此外,GLM-5.1还实现极致Infra优化,在1M上下文长度下,将单位token的FLOPs降低至2.9倍,接受长度(acceptance length)最多提升20%。

全栈技术能力助推大模型落地

凭借自研全栈多智能体编排平台SUPACODE以及成熟的BIRENSUPA™软件栈,壁仞科技快速实现GLM-5.2模型适配与调优。

通过SUPACODE自动化分析、智能算子调优与关键路径优化,壁仞科技能够快速完成模型功能适配与精度对齐工作,并依托vLLM推理框架,充分释放壁砺™166的算力与访存优势。壁仞科技自主设计专家并行调度稀疏注意力算子优化计算图重构等多维优化策略,在精度无损前提下实现大语言模型推理性能显著提升,为MoE类大模型在壁砺™系列产品上的高效部署提供了可复用的优化范式。

BIRENSUPA™软件栈深度兼容PyTorch、vLLM、SGLang、Diffusers等主流AI框架,支持500+AI模型开箱即用,可显著降低开发者的模型部署与应用门槛,加速大模型规模化落地。

随着国产大模型能力持续迭代,应用场景拓宽拓深,AI商业化进程显著提速。壁仞科技作为国内领先的通用智能计算解决方案提供商,持续以全栈化能力助推国产SOTA大模型规模化落地,目前已成功支持智谱GLM系列、阶跃星辰Step系列、MiniMax M系列、DeepSeek-V系列、腾讯混元系列、月之暗面Kimi系列、阿里巴巴千问Qwen系列等多款领先大模型的“Day0”级适配。

责编: 爱集微
来源:壁仞科技 #智谱# #壁仞科技#
THE END
关闭
加载

PDF 加载中...