燧原 L600 Day-0 适配腾讯混元 Hy3 preview

作者：爱集微 04-23 20:00

来源：燧原科技Enflame #燧原科技#

1.2w

腾讯混元Hy3 preview是一个快慢思考融合的混合专家模型，总参数295B，激活参数21B，最大支持256K上下文长度。这是混元重建后训练的第一个模型，也是混元迄今最智能的模型，在复杂推理、指令遵循、上下文学习、代码、智能体等能力及推理性能上实现了大幅的提升。

在实际适配过程中，燧原L600依托自研软硬件架构，持续提升算子覆盖与生态兼容能力，实现模型性能与算力效率的高效匹配。通过算子融合、通信加速、精度支持、PD分离架构的核心优化，结合KV Cache、编译器、内存管理、推理引擎等辅助优化手段，Hy3 preview已在燧原科技的平台上实现了推理吞吐量显著提升，首包延迟大幅降低，达到SLA（TTFT<2s，TPOT<20ms），且单卡输出吞吐大于1200 tps。在复杂任务与长序列场景下保持稳定高效，同时有效优化了显存占用，并大幅提升了硬件算力利用率，可以适配不同应用场景的部署需求。

Hy3 preview 主打全面实用性，Agent能力大幅提升

多个测评结果显示，Hy3 preview 模型能力全面提升。

1、出色的上下文学习和指令遵循能力

在各种真实的生产与生活场景，理解杂乱冗长的上下文并遵从复杂多变的规则是模型的首要挑战。基于腾讯业务场景的灵感，腾讯混元提出了 CL-bench和 CL-bench-Life 来创新性地评估模型的上下文学习能力，并在 Hy3 preview 显著地提升了模型上下文学习和指令遵循能力。

2、复杂推理能力突出，清华数学博士资格考试国内分数最高

复杂推理能力是模型解决各种问题的基础。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科推理任务中表现突出，并在最新的清华大学求真书院数学博资考(26春)和全国中学生生物学联赛(CHSBO 2025) 中取得优异成绩，展现了可泛化的强推理能力。

3、代码与智能体提升最为显著，展现出高性价比

代码和智能体是 Hy3 preview 提升最为显著的方向。得益于预训练及强化学习框架的重建和强化学习任务规模的提升，腾讯混元以较快的速度在 SWE-Bench Verified、Terminal-Bench 2.0 等主流代码智能体基准以及 BrowseComp、WideSearch 等主流搜索智能体基准中取得了有竞争力的结果。

目前，Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ浏览器、腾讯文档、腾讯乐享等首发上线，微信公众号、和平精英、腾讯新闻、腾讯自选股、腾讯客服、微信读书等多个主线产品也在陆续上线。另外，Hy3 preview 支持接入流行的开源智能体产品，如 OpenClaw、OpenCode、KiloCode 等，并已上架腾讯云大模型服务平台 TokenHub。