计算机系存储实验室团队获得MLSys 2026大模型推理优化赛事冠军-清华大学计算机科学与技术系

计算机系存储实验室团队获得MLSys 2026大模型推理优化赛事冠军

2026.05.29 15:22次

近日，第九届机器学习与系统会议（MLSys 2026）在美国华盛顿州贝尔维尤举行。由清华大学计算机系存储实验室博士生高世伟、范如文、任庭旭、罗以彬等组成，计算机系教授舒继武、副教授陆游游担任指导教师，腾讯AI系统专家里德（Reed）提供技术支持的参赛团队，在会议举办的混合专家模型内核优化挑战赛中获得冠军。

本次比赛面向Qwen3-30B-A3B混合专家模型的真实解码推理场景，吸引了来自斯坦福大学、麻省理工学院、加州大学伯克利分校、卡内基梅隆大学、加州大学洛杉矶分校、康奈尔大学等高校组队参赛。比赛中，计算机系存储实验室团队成员基于亚马逊AWS提供的NKI编程框架，围绕专家分片、矩阵向量乘特化、片上数据布局重构、跨算子融合和自动化算子优化等关键技术，对推理解码阶段进行了系统优化，将端到端推理时间从14.91秒降至3.56秒，实现约4.1倍加速，最终获得冠军。

这是计算机系存储实验室团队继2025年获得ASPLOS/EuroSys大模型推理优化竞赛冠军后，再次在国际顶级学术会议举办的大模型推理优化赛事中夺冠。

MLSys是机器学习系统领域的国际顶级学术会议之一，聚焦机器学习与计算机系统的交叉研究，涵盖大模型训练与推理、AI编译器、计算机体系结构、分布式系统、专用AI硬件等前沿方向。

上一篇：计算机系教授徐恪荣获第四届全国创新争先奖状

下一篇：计算机系召开警示教育大会

【关闭】

计算机系存储实验室团队获得MLSys 2026大模型推理优化赛事冠军

新闻动态

推荐新闻

热点新闻