医疗人工智能技术与应用白皮书(2018年)互联网医疗健康产业联盟2018年1月互联网医疗健康产业联盟医疗人工智能技术与应用白皮书1版权声明本白皮书版权属于互联网医疗健康产业联盟,并受法律保护。转载、摘编或利用其它方式使用本白皮书文字或者观点的,应注明“来源:互联网医疗健康产业联盟”。违反上述声明者,本院将追究其相关法律责任。互联网医疗健康产业联盟医疗人工智能技术与应用白皮书2前言2017年医疗人工智能发展迅速,产业格局风起云涌。人工智能在医疗领域中的应用已非常广泛,包括医学影像、临床决策支持、语音识别、药物挖掘、健康管理、病理学等众多领域。人工智能技术呈现与医疗领域不断融合的趋势,其中数据资源、计算能力、算法模型等基础条件的日臻成熟成为行业技术发展的重要力量。在新形势下,我国医疗人工智能的发展面临着机遇和挑战,技术能力不断增强,但产品和服务仍需完善。本白皮书梳理和研究国际、国内医疗人工智能的发展状况,总结医疗人工智能行业及基础设施领域国内外的技术发展特点和趋势,分析我国医疗人工智能产业面临的政策环境,为政府及产业界决策提供参考。互联网医疗健康产业联盟医疗人工智能技术与应用白皮书3目录一、人工智能的发展................................................................................................................4(一)人工智能的技术演变............................................................................................4(二)人工智能发展的三大因素.....................................................................................6(三)人工智能上升为我国国家战略...........................................................................10二、医疗人工智能的宝贵价值..............................................................................................12(一)辅助医生诊断,缓解漏诊误诊问题...................................................................12(二)提高诊断效率,弥补资源供需缺口...................................................................13(三)疾病风险预警,提供健康顾问服务...................................................................14(四)支持药物研发,提升制药效率...........................................................................15(五)手术机器人,提升外科手术精准度...................................................................15三、国内外医疗人工智能发展状况及分析..........................................................................16(一)市场规模及发展趋势..........................................................................................16(二)国内外行业发展热点分析...................................................................................17四、我国医疗人工智能细分领域..........................................................................................21(一)虚拟助理..............................................................................................................22(二)病历与文献分析..................................................................................................25(三)医疗影像辅助诊断..............................................................................................27(四)药物研发..............................................................................................................33(五)基因测序..............................................................................................................35五、面临的问题与挑战..........................................................................................................37(一)数据是行业发展的瓶颈,积累与创新是解决问题的关键...............................37(二)医疗AI产品需要实现从试验向临床应用的突破............................................38(三)加深合作,可持续的商业模式亟待建立...........................................................39(四)明确医疗责任主体,划清权责范围...................................................................40(五)制定人才培养计划,抢占战略制高点...............................................................41互联网医疗健康产业联盟医疗人工智能技术与应用白皮书4一、人工智能的发展(一)人工智能的技术演变从上世纪八九十年代的PC时代到二十一世纪的互联网时代,信息技术改造了人类的生产方式,提高了生产效率,改善了我们的生活。在进入移动互联网时代后,万物互联成为趋势,但技术的限制导致移动互联网难以催生出更多的新应用和新业态。如今,人工智能俨然已经成为这个时代昀炙手可热的技术,甚至将成为未来十年内信息技术产业发展的焦点。人工智能的概念诞生于上世纪50年代,从昀初的神经网络和模糊逻辑,到现在的深度学习、图像搜索,人工智能技术经历了一系列的起伏。在1956年的一次科学会议上,人工智能的概念被首次确立:让机器像人那样思考和认知,用计算机实现对人脑的模拟。上世纪50年代至70年代是人工智能的早期发展阶段,该阶段人工智能主要用于解决一些小型的数学问题和逻辑问题。此时人工智能出现了一些代表性应用,如机器定理证明、机器翻译、专家系统、模式识别等,但是该阶段人工智能仍可以被归纳为“弱人工智能”时代,其发展和应用还远远不能达到人类的智慧水平。互联网医疗健康产业联盟医疗人工智能技术与应用白皮书51972年,用于传染性血液诊断和处方的知识工程系统MYCIN研发成功,该事件标志着人工智能进入“专家系统”时期。专家系统的出现使得计算机可以和人进行结合,通过对数据的分析解决一些实际的问题。但是专家系统的发展并不顺利,也并未得到广泛的应用。其原因主要有两个方面。一是专业知识的获取需要行业内长时间的积累,大量的行业数据在彼时难以全部植入专家系统。二是专家系统的程序主要由解释性语言“LIPS”编写,其开发效率和易用性较低,难以实现实际应用。人工智能技术发展在彼时陷入的瓶颈使得人类开始思考,如何让计算机自发理解和归纳数据,掌握数据间的规律,即“机器学习”。上世纪90年代末,IBM“深蓝”计算机击败国际象棋大师卡斯帕罗夫再次引发了全球对人工智能技术的关注。但是受限于当时的技术条件,人工智能尚无法支撑大规模的商业化应用。2006年,GeoffreyHinton教授发表的论文《AFastLearningAlgorithmforDeepBeliefNets》中提出了深层神经网络逐层训练的高效算法,使当时计算条件下的神经网络模型训练成为了可能。互联网医疗健康产业联盟医疗人工智能技术与应用白皮书6(二)人工智能发展的三大因素人工智能的概念虽然在上世纪已经出现,但由于彼时软硬件条件的不成熟,数据资源的短缺,人工智能并未实现广泛的应用。如今,随着算法、算力等基础技术条件的日渐成熟,行业数据的积累,人工智能得以应用在各个领域。算力。GPU(图形处理器)显著提升了计算机的性能,拥有远超CPU的并行计算能力。由于处理器的计算方式不同,CPU擅长处理面向操作系统和应用程序的通用计算任务,而GPU擅长完成与显示相关的数据处理。CPU计算使用基于x86指令集的串行架构,适合快速完成计算任务。GPU拥有多内核处理并行计算,适合处理3D图像中上百万的图像像素。此外,FPGA也在越来越多地应用在AI领域。FPGA(FieldProgrammableGateArray)是在PAL、GAL、CPLD等可编程逻辑器件的基础上进一步发展的产物。它是作为专用集成电路领域中的一种半定制电路而出现的,既解决了全定制电路的不足,又克服了原有可编程逻辑器件门电路数有限的缺点。一方面,FPGA是可编程重构的硬件,相比GPU有更强大的可调控能力;另一方面,与日增长的门资源和内存带宽使得它有更大的设计空间。由于深层神经网络包含多个隐藏层,大量神经元之间的联系计算具有高并行性的特点,具互联网医疗健康产业联盟医疗人工智能技术与应用白皮书7备支撑大规模并行计算的FPGA和GPU架构已成为了现阶段深度学习的主流硬件平台。FPGA和GPU架构能够根据应用的特点定制计算和存储的结构,方便算法进行微调和优化,实现硬件与算法的昀佳匹配,获得较高的性能功耗比。算法。深度学习是当前研究和应用的热点算法,也是人工智能的重要领域。深度学习通过构建多隐层模型和学习海量训练数据,可以获取到数据有用的特征。通过数据挖掘进行海量数据处理,自动学习数据特征,尤其适用于包含少量未标识数据的大数据集。深度学习采用层次网络结构进行逐层特征变换,将样本的特征表示变换到一个新的特征空间,从而使分类或预测更加容易。深度学习驱动图像识别精度大幅度提升。2012年,深度学习模型首次被应用在图像识别大赛(ImageNet),将错误率降至16.4%,一举夺冠。2015年,微软通过152层的深度网络,将图像识别错误率降至3.57%,而人眼的辨识错误率约在5.1%,DeepLearning模型的识别能力已经超过了人眼。在2017年的ImageNet挑战赛中,Momenta团队利用SENet架构夺魁,他们的融合模型在测试集上获得了2.251%的错误率,对比于去年第一名的结果2.991%,获得了将近2