首页 > 新闻动态 > 正文

计算机系武永卫教授团队成果入选2025年清华大学最受师生关注年度亮点成果!

2026.01.13 09:28

为充分发挥高等学校作为基础研究主力军、重大科技突破策源地的作用,营造勇于创新的学术氛围,推动科研工作高质量发展,服务高水平科技自立自强,学校组织开展2025年清华大学最受师生关注的年度亮点成果评选活动,经组织提名、专家评选、师生投票,产生10项亮点成果,并在2025年清华大学科研创新工作交流会上发布。其中,计算机科学与技术系武永卫教授团队的“以存换算:高性能大模型推理系统”项目成果入选。

武永卫教授(左五)在年度亮点成果发布现场

成果名称

以存换算:高性能大模型推理系统(计算机科学与技术系武永卫团队)

成果简介:

团队立足系统软件层面的原始创新,提出了“全系统协同”与“以存换算”的大模型推理设计思想,为解决大模型算力难题贡献了重要的“中国方案”。团队攻克了显存墙与传输墙等关键技术瓶颈,与头部企业联合研制了Mooncake、KTransformers等高性能推理系统。该成果大幅提升了推理吞吐量并降低了稀疏模型部署门槛,获系统领域顶级会议FAST 2025最佳论文奖和存储领域全球性大奖“奥林帕斯奖”。目前,相关核心技术已开源(Github社区星标超2万),并被国内多家头部互联网与AI企业采用,在数万张GPU算力集群上实现规模化落地,支撑了万亿参数级模型的超大规模服务。

推荐理由:

该成果紧扣人工智能产业降本增效的需求,在异构计算与存储架构领域取得了突破性进展,不仅在行业龙头企业的生产环境中经过了万卡级别的实战检验,更形成了具有国际竞争力的自主技术体系。该成果与国际主流开源框架及顶尖硬件厂商方案并跑,荣获存储领域全球性大奖及顶级学术会议认可,体现了我国在AI基础软件设施领域的自主创新能力与广泛的产业影响力。

以存换算思想在大模型推理中的落地

关闭