陈挺、王光宇、刘晓鸿、王轲、张轩、陈宁
项目简介:
今年以来,新型冠状病毒席卷我国,给人民的生命安全带来了巨大的威胁。面对严重的新型冠状病毒疫情,清华大学计算机系、清华大学人工智能研究院、北京信息科学与技术国家研究中心陈挺教授团队(王光宇、刘晓鸿、王轲、张轩、陈宁)从1月21日起即启动了应急攻关,通过与疫情一线临床及影像科医生反复电话及会议沟通,结合一线疫情和临床实际需求,研发出“面向新冠肺炎的全诊疗流程的智能筛查、诊断与分级系统”,可以对大量“疑似”肺炎病人进行快速筛查、辅助诊断和住院临床分级预警,实现对COVID-19病人的全生命周期管理。项目具体功能如下:
1、基于X-ray胸片的智能筛查
针对疫情爆发期大量“疑似病人”候诊的拥挤、等待CT影像及核酸检测周较长,容易造成交叉感染等问题。陈挺教授团队与临床医生提出了优化诊疗流程,基于X-ray胸片智能筛查的方案。X-ray胸片具有方便快捷、成本低廉的特点,尤其是对于世界上医疗资源短缺的国家和地区,通过AI技术及X-ray胸片将病毒性肺炎(包含新冠肺炎病人)病人,从细菌性肺炎和其他肺部疾病中快速筛选出来,可以大大节省医疗资源,提高效率。
“基于X-ray胸片的智能筛查”模块,采用了近五万张X-ray胸片训练智能筛查模型,实现细菌性肺炎、病毒性肺炎病人、其他肺部疾病和正常人的快速甄别,模型准确率在95%以上。临床医生可以基于筛查结果,可以对不同类别肺炎的患者实施不同的治疗、隔离模式,并采取相应的院感防止措施。比如对于细菌性肺炎患者实施抗生素治疗,对于病毒性肺炎和疑似病人进一步隔离等。

图1. 基于X-ray胸片的智能筛查模块
2、基于CT影像的病灶识别和定量分析
本系统采用了基于病灶分割的肺炎智能诊断模型。通过医生手工标注的四千余张CT影像的典型病灶,训练语义分割模型,可以对COVID-19肺炎、其他病毒性肺炎及细菌性肺炎的六类典型病灶(磨玻璃影、实变、空腔空洞等)自动进行精准定位,并实现病灶的像素级识,系统可以自动计算不同种类病灶的体积占比等量化特征,为影像科医生提供精准判读建议。此外,通过对患者所有病灶进行定量分析,精准预测每一个病灶的大小和变化,因此可以用来做为药物筛选检测临床试验的一个判别标准。同时考虑实际使用中分析处理几十万CT图像的情况,系统采用了高效的model-agnostic病灶分割加速策略,在不牺牲精度的情况下可以提速约11倍,为后续临床应用和模型迭代争取了很多时间。

图2. CT影像的病灶识别和定量分析
3、基于CT的诊断及临床分级
将NCP病人从病毒性肺炎筛查出来之后,如何进行确诊也是一个难题。由于早期试剂盒的质量不一、操作方式(拭咽子、肺灌洗液)等问题,核酸试剂盒“漏诊”率比较高。1月底,武汉中南医院的影像科张笑春主任提出通过CT联合核酸确诊的方案。2月5日,CT影像作为诊断与临床分型的重要依据,也被收入卫健《新型冠状病毒肺炎诊疗方案-第五版》诊疗指南中。
我们使用了将近40万张CT图像和500多名新冠病毒病人的完整临床资料,进行训练新冠肺炎诊断模型,实现辅助诊断准确率90%以上。在临床分级及分型的环节,通过多模态算法等模型,对患者检验、影像学、体格检查、辅助检查等多个维度进行综合分析住院病人发展为危重症及器官衰竭(肝肾功能、心脏、凝血等)的预测准确率超过80%。

图3. 基于CT和临床资料的智能诊断和分级
(补充:模型迭代细节:系统的诊断模型,随着对新冠影像学特征的认识和应用目的,经过了数轮模型迭代。最开始采用端到端图像分类,做新冠图像与非新冠图像的鉴别诊断,但模型投入实际使用需要可解释和多中心泛化能力,基于端到端的模型容易存在过拟合的风险。后来又采用了基于病灶分割结果的诊断模型,使用了40多万张图像分割结果用于训练。经过不断的数据积累和模型迭代,诊断模型准确率从0.8提高到了0.9。)
系统部署情况:
目前,目前系统已联合中科院、国家生物信息中心、广州再生医学与健康广东省实验室、澳门科技大学,在中山大学孙逸仙纪念医院、中山大学附属第二医院医院、宜昌市中心人民医院等进行部署落地,在武汉金银潭医院部署测试中,并计划向其他疫情危急国家开放使用,贡献清华人的一份力量。
实验室的前期的一个重要研究方向就是医学影像处理和医学电子病历的自然语言处理,对这个领域有扎实的处理经验和工作基础,并与医院团队有密切的合作。在疫情发生后,我们组师生就急切希望能发挥自己的专业知识,为临床一线疫情工作奉献一份力量,主动牺牲春节假期时间,投入了应急科研攻关中。
从2020年1月22日正式建群启动,到3月11日为止,我们与合作医生团队密切合作,日夜艰苦奋战,真正体现了“清华速度”。通过我们扎实的专业技术和结合实际生产环境的灵活创新,实现了系统的落地使用,有效支撑和服务了疫情一线防控,实现科研报国。