249·专家述评·欢迎关注本刊公众号肿瘤影像学2018年第27卷第4期Oncoradiology2018Vol.27No.4刘士远,第二军医大学长征医院影像医学与核医学科主任,主任医师、博士研究生导师。中华放射学分会候任主任委员,亚洲胸部放射学会候任主席,中国医师协会放射学分会副会长。承担国家科技重大专项、国家自然科学基金重点项目及面上项目、上海市科委重大专项等40余项课题。发表论文500多篇,获得国家发明专利12项,获得中华医学奖、军队科技进步奖及上海市科技进步奖等10余项。主编、副主编专著20余部,参编各类专著或教科书30余部。擅长胸部疾病特别是肺癌的影像学诊断。主要研究方向:①早期肺癌筛查,肺癌的早期诊断及鉴别诊断,中晚期肺癌的综合介入治疗;②肺部机遇性感染的基础和临床研究;③慢性阻塞性肺疾病的功能影像学研究;④分子影像学;⑤人工智能在医学影像学中的应用。肺结节影像人工智能技术现状与思考萧 毅,刘士远第二军医大学长征医院影像科,上海200003[摘要]我国是肺癌高发国家,面对影像科医师匮乏与患病人数日益增长的医疗需求问题,肺结节人工智能技术的应用有望有效地平衡当前的医疗资源。本文旨在陈述肺结节影像人工智能技术发展的现状,探讨如何正确看待肺结节人工智能技术及其核心要素和目前面临的挑战等问题。指出肺结节人工智能技术已经初见成效,跨学科的深度合作、规范标注的影像大数据训练集及适合临床场景的多任务模型是其未来发展的核心推动力。[关键词]肺癌;人工智能;影像组学DOI:10.19732/j.cnki.1008-617X.2018.04.001中图分类号:R734.2 文献标志码:A 文章编号:1008-617X(2018)04-0249-04CurrentstatusandthinkingonartificialintelligencetechnologyinpulmonarynoduleimagingXIAOYi,LIUShiyuan(DepartmentofRadiology,ChangzhengHospital,SecondMilitaryMedicalUniversity,Shanghai200003,China)Correspondenceto:LIUShiyuanE-mail:Liushiyuan@smmu.edu.cn[Abstract]LungcancerhashighincidenceinChina.Facedwiththelackofimagingphysiciansandthegrowingmedicalneedsoflargepatientpopulations,theapplicationofartificialintelligencetechnologyinpulmonarynodulesimagingcaneffectivelybalancecurrentmedicalresources.Thispaperexpoundsthecurrentsituationofthedevelopmentofartificialintelligencetechnologyinpulmonarynoduleimaging,discusseshowtocorrectlytreatthistechonologythecoreelementsandthefacedchallenges.Itispointedoutthattheartificialintelligencetechnologyinlungnoduleimaginghasachievedinitialsuccess.Thestandardizedimagedatatrainingsetandthemulti-taskmodelsuitableforclinicalscenesarethecoreelementsoffutureproductlanding.[Keywords]Lungcancer;Artificialintelligence;Radiomics上海市科学技术委员会基金项目(17411952400);国家重点研发计划政府间合作项目(2016YFE0103000); 上海市卫计委智慧医疗项目(2018ZHYL0101);科技部国家重点研发计划(2018YFC0116404)。通信作者:刘士远 E-mail: liushiyuan@smmu.edu.cn250萧 毅,等肺结节影像人工智能技术现状与思考 大数据、算力及算法的进步为人工智能(artificialintelligence,AI)开发及应用带来了重大突破。目前,基于AI的研究已广泛涉及放射影像、病理图像、超声影像及内镜影像等多个不同医学影像领域[1]。AI在许多医学领域正迅速从实验阶段过渡到应用阶段,在一些任务场景中AI已展现出与医师相当甚至超越医师的能力。一旦AI协助影像科医师提高了阅片的速度,医疗过程中的基础环节和瓶颈环节将不断优化,医疗供给与需求的差异将逐步缩小,将令更多的患者从中受益。 受环境、吸烟、油烟及遗传等因素的影响,肺癌的发病率、致死率已位列我国常见恶性肿瘤的第1位[2],且随着我国人口老龄化,罹患肺癌的总人数呈现持续升高态势[3]。循证医学数据显示,早期肺癌5年生存率显著高于中晚期肺癌[4],早发现、早诊断及早治疗是改善预后的重要途径。肺癌防治的重要手段是早期筛查,其中胸部低剂量CT是国际公认的有效手段。但是随着胸部CT筛查人群的日益增多,影像科医师的压力也日趋增大。一方面影像科医师缺口较大,不能匹配日益增长的工作量;另一方面随着薄层低剂量CT的应用,图像数量的倍增、小结节显示率的提高及结节的定量测量等使得读片的难度显著增加。此外,繁重、枯燥的阅片工作使影像科医师的疲劳度增加,同时漏诊、误诊的风险也在增加。 近年来,计算机硬件水平的提升和深度学习等核心技术的发展推动了AI向社会各领域渗透。在我国,医疗领域是AI发展相对蓬勃的领域之一。基于深度学习的AI应用目前已经覆盖病灶检测、病理诊断、放疗规划和术后预测等各临床阶段[5-7]。鉴于在中国肺癌的高发病率、高病死率和高筛查率的现状,影像医生人员匮乏和劳动疲劳度等需求端的存在,以及国外的胸部公开数据集给了创业者起步的机会,利用公开数据集建立各自模型,并在中国大数据集下进行训练等技术端的便利,使得肺结节人工智能技术如火如荼地发展起来,肺结节筛查模型也成为大多数人工智能创业公司的标配。在早期的研究中,AI算法模型能自动分割胸腔区域,快速准确地定位疑似肺结节的病灶,从大数据集学习所得到的算法模型可以避免主观偏差,虽然部分模型筛选的结果中包含了一些假阳性结节,但明显降低了假阴性的发生,大大减轻了影像科医师的工作量[8]。除此之外,AI算法模型不仅能提取肺结节的位置、形态信息,还能进一步提供肺结节分类(实性、亚实性及钙化等)乃至肿瘤良恶性分级等一些决策意见供医师参考。据文献报道,一些模型的筛查结果从统计学上看要优于经验丰富的影像科医师[9-11]。多家三级甲等医院已经合作研发了各种肺结节AI模型,并将其应用于临床工作中,均取得了较好的效果。 尽管深度神经网络在诊断问题的有效性上已初步得到验证,但是医学影像临床工作中往往交织着多种不同任务。以肺结节的筛查为例,医师需要在影像上识别出所有的肺结节,对结节的大小、密度及形态等进行完整的描述,并且根据指南对所发现的结节采取不同的随访方案。在随访过程中,医师需要对比观察结节大小、密度的变化,判断结节的生长规律与良恶性,为临床干预做决策准备。从肺结节的筛查与诊断方面不难看出,AI需要在发现异常、量化测量、随访跟踪和鉴别诊断中发挥可靠作用,最终才能具有临床应用价值。除了将深度神经网络应用于医学影像的分类问题(诊断),研究者们还需要继续探索AI技术在医学影像检测问题(发现异常)、分割问题(量化测量)及配准问题(随访跟踪)中的应用。 肺结节AI技术依靠强大的图像识别和深度学习技术,极大提高了数据分析的效率和准确性,减轻了医师的压力,同时提高了诊疗的效率和准确性。近年来,不同医学专业纷纷举办了各类人机竞赛,结果显示AI技术在这类竞赛中表现优异,能够快速准确地识别病变。也有初步的应用体验显示,肺结节影像AI技术在发现5mm以上磨玻璃结节、钙化结节及0~3mm结节筛查方面要优于影像科医师。姑且不论人机大赛的测试集、金标准等赛制设计问题,单论技术本身,影像AI技术目前在个别单项任务的确弥补了医师肿瘤影像学2018年第27卷第4期251的先天不足。如小结节的检出,医师因为精力、视力等有限,确实不如模型找得准、找得快;对病灶体积的测量,模型可以做得更快、更精准。AI作为放射科医师的助理,能够在影像阅片中起到多重审核的作用,减少漏诊的发生,为临床医师及患者提供更高水平的服务,使得影像科医师有望从一些枯燥、繁琐的工作中解脱出来,将精力投入到疑难病例的会诊等需要人类智慧的工作中。目前,肺结节人工智能模型已经能够实现极高的灵敏度,对于微小结节的检出达到了瞬间全识别。与此并行的是特异度的平衡,怎样的灵敏度和特异度之间的平衡是临床所认可的,可能是影像界需要形成应用共识的一个方面,也是技术公司需要了解并为之改进的一个方面。 合适的医疗流程的改变能帮助缓解当前医疗资源发展不平衡的现状,解决影像科医师匮乏与庞大病患人群日益增长的医疗需求矛盾。那么是否意味着影像科医师将要被AI技术取代了呢?答案显然是否定的,除去伦理和法律问题,仅就技术本身而言,现在的单一任务模式取代医师日常工作还有很长的路要走。 AI技术立足于深度学习神经网络,与以往传统的算法相比,这一算法并无多余的假设前提,而是完全利用输入的数据自行模拟和构建相应的模型结构[12-15]。这一算法特点决定了AI是更为灵活的技术,且具有根据不同的训练数据进行自我优化的能力。高速并行运算、海量数据及更优化的算法共同促进了AI发展的突破。对影像AI技术来说,除了算法、算力之外,现阶段最核心的是大数据,尤其是规范标注的大数据。如果将AI看成一个婴儿,影像数据就是喂养这个婴儿的奶粉。奶粉的数量决定了婴儿是否能长大,而奶粉的质量则决定了婴儿后续的智力发育水平。 然而,海量的规范标注数据恰是目前影像AI发展的瓶颈,数据的获取及标注都存在很多困难。①数据的获取方面:以肺结节为例,数据是深度学习算法所需的核心资源,仅掌握算法而缺乏数据无法获得较好的训练效果。但是目前医院之间的数据共享和互通程度较低,获取大规模的多样性数据对研发公司是一个考验。来自于单一医院的训练集无疑会导致模型的过拟合现象,使得产品在其他医院难以直接应用。同时,由于疾病的多样化,发病率低的病变集数量可能过少,出现模型诊断偏倚。②在数据标注方面:深度学习要结合先验知识对模型进行训练,训练集需要事先标注,而大多数标注依赖人工识别,因此数据标注将耗费大量的人力、物力和时间。除此之外,医学影像标注的标准往往存在较多争议,不同的国家、国际组织、学会和医院可能执行各自的体系,不同的医师对征象的认识也不够统一。因此,建立中国的标准影像数据库势在必行,只有建立标准数据库才能在质量上解决图像的临床代表性、图像多样性、标注的权威性与规范性及数据的可溯源性等问题,提高产品的鲁棒性,加速AI医疗器械产品的研发和应用。 从新技术落地的角度看,新的技术需要得到医师反复使用和反馈从而逐步优化模型,因此必须适应医院的日常流程,如产品是否与医院信息化系统无缝衔接、产品自身是否包含了完整的信息化处理单元。相对而言,大型医疗企业具有丰富的市场经验和医疗信息化系统整合能力,互联网企业能借助自身的网络平台为基层医院、社区卫生服务中心等提供远程医疗影像检测和诊断服务。但许多初创公司在快速推出产品抢占市场与优化产品性能间陷入两难境地。 从临床应用角度看,仅仅单一的肺结节筛查模型甚至肺癌诊断模型都不能满足临床诊断场景的需求。日常影像诊断工作中,影像科医师需要对一份肺部影像资料进行全面的评估和诊断,包括判断是否有肺结节、肺气肿、肺炎、支气