姓名:郑纬民

职称:教授

邮箱:zwm-dcs@tsinghua.edu.cn

教育背景

工学学士 (自动控制), 清华大学, 中国, 1970;

工学硕士 (计算机科学与技术), 清华大学, 中国, 1982.

社会兼职

中国计算机学会: 副理事长 (2004-);

清华大学计算机科学与技术系: 高性能计算机研究所所长 (2000-2008);

清华大学学位委员会: 委员 (2002-2008);

中国教育科研网格ChinaGrid: 副组长 (2002-);

国家自然科学基金: 网格(NSFCGrid)指导委员会委员 (2006-);

ICPP 2011: 程序委员会副主席 (2011);

SOSP 2007: 程序委员会委员 (2007). 

研究领域

并行与分布式计算, 网络存储与容灾

计算机系统结构, CPU设计

编译技术

研究概况

作为清华大学计算机系统结构方向的学科带头人,我确立并领导了集群计算机、 CPU 设计、网格与云计算、网络存储与容灾等四个方向的研究工作,取得了如下研究成果:

1. 在集群计算机方向,我主持研制了“清华探索系列”集群计算机,并已应用于北京、天津等省市的日常气象预报以及网络信息安全等部门。我提出了一套用来设计和测试高性能计算机系统的方法,包括:1)支持文件系统检查点的程序运行卷恢复机制,成果发表于ICS 2008上;2)一种新的并行循环的调度参数优化和并行块扩张与合并算法,并以此为基础研制了目前国际上性能最好的开源OpenMP编译器。OpenMP编译器除了被多所国外大学作为研究平台使用之外,还分别被HP公司和AMD公司选作安腾平台和X86平台上的产品编译器;3)全过程评测的思想,采用分层建模与测试相结合的系统评测方法,能够检测和诊断硬件、软件安装、系统配置、以及驱动程序不匹配等问题引起的系统性能故障。

2. 在CPU设计方向,我领导研制了中国当时运行频率最高的嵌入式CPU——THUMP107。我提出了一种支持高速缓存一致性的片上网络结构,把协议状态一致性和目录的维护工作从处理器和共享Cache中分离出来,在片上网络中实现,实现了计算与通讯相分离,简化了多核处理器的设计,并提高了多核处理器的可扩展性。

3. 在网格与云计算方向,我提出了一种应用程序的网格服务热部署和远程部署方法,克服了传统网格服务部署需要重启服务容器和只能本地部署的两个弊端,已被国际最著名的网格中间件系统Globus Toolkits所采纳。我牵头完成的生物信息学网络计算应用系统已经投入实际运行,每天的用户访问量超过了5万人次。此外,我还提出了一种基于社区概念的网络数据共享和存储技术,以及一种虚拟集群快速构建和软件自动按需部署技术,依托这些技术,我主持研制了国内首个云计算平台“Tsinghua Cloud”,现已对外提供服务,目前注册用户数目超过15000人。

4. 在网络存储与容灾方向,我提出了一种灵活可扩展的网络存储体系结构及其实现方法,并以此为基础研制了清华海量存储网络系统——TH-MSNS,目前已有近百套该系统被成功应用到审计、公安、油田、电信、 教育等行业及部门。我提出了一种存储阵列结构下的条带卷快速扩展方法和一种带外存储架构下的条带卷快速扩展方法,相关成果分别发表于ACM Transactions on Storage和IEEE Transactions on Computers上。我提出了一种匹配码的编码与选择方法,揭示了更高级别上冗余关系的构建途径,并构造出一种高容错、高存储利用率的编码——GRID码,被IEEE Fellow、美国UCSC大学存储系统研究中心主任Darrell D.E. Long列入几大经典纠删码之一。此外,我提出的一套结构无关的快速容灾恢复方法,能够大幅降低容灾成本,提高灾难恢复速度。

研究课题

973二级课题: 结构无关的容灾中心构建理论及实现方法研究 (2008-2012);

国家自然科学基金重点课题: 对等计算及广域网虚拟平台 (2005-2008);

863课题: 高端容错计算机评测技术研究 (2008-2010);

国家科技基础条件平台: 生物信息学网络计算应用系统 (2004-2008);

教育部211课题: 中国教育科研网格公共支撑平台研制 (2002-2008);

Intel科研基金: 云存储安全性研究 (2009-2010);

EMC科研基金: 校园存储云研究 (2008-2010);

HP实验室科研基金: 网格监控 (2006-2009). 

奖励与荣誉

国家科技进步一等奖——信息产业部信息安全管理系统 (2002);

国家科技进步二等奖——高性能集群计算机与海量存储系统 (2007);

国家科技进步二等奖——中国教育科研网格 (2008);

国家级精品课程——计算机系统结构 (2008);

教育部科技进步一等奖—— 高性能计算机性能测试技术 (2009).

学术成果

[1] Weimin Zheng, Binxing Fang. Structure-independent disaster recovery: Concept, architecture and implementations. Science in China Series F: Information Sciences, vol. 52, no. 5, pp. 813-823, 2009

[2] Weimin Zheng. An Introduction to Tsinghua Cloud. Science in China Series F: Information Sciences, vol. 53, no.5, to appear, 2010

[3] Jidong Zhai, Wenguang Chen, Weimin Zheng. PHANTOM: predicting performance of parallel applications on large-scale parallel machines using a single node. Proc. 15th ACM SIGPLAN Symposium on Principles and Practice of Parallel Programming (PPOPP 2010), Bangalore, India, 2010, pp. 305-314

[4] Guangyan Zhang, Jiwu Shu, Wei Xue, and Weimin Zheng. Design and Implementation of an Out-of-Band Virtualization System for Large SANs. IEEE Transactions on Computers, vol. 56, no. 12, pp. 1654-1665, 2007

[5] Xing Zhou, Wenguang Chen and Weimin Zheng. Cache Sharing Management for Performance Fairness in Chip Multiprocessors. Proc. 18th International Conference on Parallel Architectures and Compilation Techniques (PACT 2009), Raleigh, North Carolina, USA, 2009, pp. 384-393

[6] Yongwei Wu, Yulai Yuan, Guangwen Yang, Weimin Zheng. Load Prediction Using Hybrid Model for Computational Grid. Proc. 8th IEEE/ACM International Conference on Grid Computing (Grid 2007), Austin, Texas, USA, 2007, pp. 235-242

[7] Yongwei Wu, Kai Hwang, Yulai Yuan, Weimin Zheng. Adaptive Workload Prediction of Grid Performance in Confidence Windows. IEEE Transactions on Parallel and Distributed Systems, In Press, 2010

[8] Ruini Xue, Wenguang Chen, Weimin Zheng. CprFS: a user-level file system to support consistent file states for checkpoint and restart. Proc. 22nd ACM International Conference on Supercomputing (ICS 2008), Island of Kos, Aegean Sea, Greece, 2008, pp. 114-123

[9] Hongliang Yu, Dongdong Zheng, Ben Y. Zhao, Weimin Zheng. Understanding User Behavior in Large-scale Video Streaming Services. Proc. 1st Eurosys Conference (EuroSys 2006), Leuven, Belgium, 2006, pp. 333-344

[10] 郑纬民, 汤志忠. 计算机系统结构. 第2版. 清华大学出版社, 北京, 1998.