燧原 L600 Day-0 适配腾讯混元 Hy3 preview

来源:燧原科技Enflame #燧原科技#
1658

腾讯混元Hy3 preview是一个快慢思考融合的混合专家模型,总参数295B,激活参数21B,最大支持256K上下文长度。这是混元重建后训练的第一个模型,也是混元迄今最智能的模型,在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。

在实际适配过程中,燧原L600依托自研软硬件架构,持续提升算子覆盖与生态兼容能力,实现模型性能与算力效率的高效匹配。通过算子融合、通信加速、精度支持、PD分离架构的核心优化,结合KV Cache、编译器、内存管理、推理引擎等辅助优化手段,Hy3 preview已在燧原科技的平台上实现了推理吞吐量显著提升,首包延迟大幅降低,达到SLA(TTFT<2s,TPOT<20ms),且单卡输出吞吐大于1200 tps。在复杂任务与长序列场景下保持稳定高效,同时有效优化了显存占用,并大幅提升了硬件算力利用率,可以适配不同应用场景的部署需求。

Hy3 preview 主打全面实用性,Agent能力大幅提升

多个测评结果显示,Hy3 preview 模型能力全面提升。

1、出色的上下文学习和指令遵循能力

在各种真实的生产与生活场景,理解杂乱冗长的上下文并遵从复杂多变的规则是模型的首要挑战。基于腾讯业务场景的灵感,腾讯混元提出了 CL-bench和 CL-bench-Life 来创新性地评估模型的上下文学习能力,并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。 

2、复杂推理能力突出,清华数学博士资格考试国内分数最高

复杂推理能力是模型解决各种问题的基础。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出,并在最新的清华大学求真书院数学博资考(26春)和 全国中学生生物学联赛(CHSBO 2025) 中取得优异成绩,展现了可泛化的强推理能力。

3、代码与智能体提升最为显著,展现出高性价比

代码和智能体是 Hy3 preview 提升最为显著的方向。得益于预训练及强化学习框架的重建和强化学习任务规模的提升,腾讯混元以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了有竞争力的结果。

目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线,微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外,Hy3 preview 支持接入流行的开源智能体产品,如 OpenClaw、OpenCode、KiloCode 等,并已上架腾讯云大模型服务平台 TokenHub。

责编: 爱集微
来源:燧原科技Enflame #燧原科技#
THE END
关闭
加载

PDF 加载中...