机器学习在放射学中的应用及其未来影响Abstract:机器学习技术的最新进展和未来前景在医学成像中提供了有前途的应用。机器学习具有改善放射工作流中各个步骤效果的潜力,包括订单调度和分诊、临床决策支持系统、结果及其解释、后处理和剂量估算、检查质量控制、放射学报告。在本文中,作者回顾了机器学习和人工智能技术在诊断放射学中的应用实例。此外,针对这些技术在放射学中的未来影响和自然延伸进行了讨论。1、机器学习的最新进展为包括医学影像学在内的工业和应用提供了希望。在数据科学的创新中,机器学习是一类使计算机能够像人类一样学习和提取或分类模式的技术和研究,机器可以进一步分析更多的数据集,并从人类可能无法做到的数据中提取特征。机器学习最近的研究和发展方向是,在现在和未来将其用于诊断成像。在这篇综述中,首先介绍机器学习的“广义”和“狭义”定义,然后介绍如何将机器学习应用于成像解释并使其得到发展。第二,我们将提供机器学习在诊断放射学中的应用实例。第三,我们将讨论机器学习技术在临床应用中的主要障碍和挑战。最后,我们将讨论机器学习在放射学和除了放射学以外的其他医学领域中未来的发展方向。2、(1)机器学习的定义:机器学习是一种使电脑具备学习能力却又不依赖于直接的编码规则的数据科学方法。机器学习可以创建能够进行学习和预测的算法。与基于规则的算法相比,机器学习利用了对大数据集和新数据集的增加的曝光,并具有根据经验进行改进和学习的能力。(2)机器学习策略:根据任务的不同,机器学习通常分为三大类:监督、无监督和强化学习。3、在监督学习过程中,需要将数据标签提供给训练集(在训练过程中有监督),预期输出通常先由使用者提供数据标签,作为算法的真实答案(类似金标准)。算法的目标通常是使机器学习将输入映射到输出的一般规则(即让机器学会传递函数)。算法的目标通常是学习将输入映射到输出的一般规则。在机器学习中,地面真理指的是假定为真的数据。在无监督学习中,不给学习算法提供数据标签。机器学习任务的目标是在数据中找到隐藏的结构,并将数据分离成簇或组。在强化学习中,计算机程序在动态环境中执行特定任务,与此同时,计算机接受正和负强化(如与对手玩游戏)的反馈。强化学习是指,在没有明确的规则指导下,机器通过自身与环境的交互结果进行自我学习和提升。监督和unsupervisedexamplesof学习技术是提供在图2。机器学习范式可以使用合成的监督和unsupervised方法与增强反馈环。有监督和无监督学习技术的实例如图2所示。一种机器学习模式也可以同时使用有监督反馈和无监督方法的与增强反馈回路的组合。()人工神经网络4、人工神经网络是机器学习中的重要应用,是一种统计和数学的方法。该网络是在生物神经系统处理大量信息的方式的基础上发展起来的,网络中有大量高度互连的处理元件,称为互连处理元件,称为神经元、结点或细胞。一个人工神经网络的结构包括:一个输入层,一个或者多个“隐层”,以及一个输出层。每一个隐层由一套神经元组成,其中的每一个神经元都与前一层的所有神经元相连接。每个连接用加权值来量化。为了使网络产生正确的输出(例如,对图像的检测结果进行正确的检测和分类),需要通过输入训练集对网络进行训练,给每一个神经元之间的连接一个恰当的权重。人工神经网络中的学习可以是监督的、部分监督的或者完全无监督的。深度学习和卷积神经网络5、深度学习(也称为深度结构化学习、分层学习或深度机器学习)是人工神经网络算法的一个子集,它包含不止一个隐层(通常更多,因此是“深”)。换言之,深度学习算法是基于一种试图在数据中提取更高级抽象的特征进行学习的算法。机器学习的一个典型应用是图像目标识别。可在网上获得具有深度学习的目标识别的例子以及神经网络中的不同层次的分析细节。6、深度学习模型可以被归类为典型的(或正常的)网络,其采取向量形式(一维)输入(例如:非结构化输入)或卷积神经网络(CNNS),其采取二维或三维形状输入(即结构化输入)。考虑到图像中相邻像素或体素之间的结构信息,CNNs医学图像分析中得到了极大的关注(成为研究热点),特别是对图像的特征提取。7、卷积是一种在信号或滤波信号中寻找模式的数学运算。卷积神经网络由一个输入、输出层和多个隐层构成,这些隐层(卷积)对输入进行滤波从而获得有用的信息。卷积神经网络的隐层通常由卷积层、池化层、完全连接层和归一化层组成。8、CNNs的主要参与者是卷积层,它由被称为核的过滤元件组成。池化层(或降采样)用于减少空间维度,进而改善计算性能,同时也减少了过度匹配的机会。CNNs(图4)是目前医学成像中最常用的机器学习技术。迁移学习9、迁移学习是一种把处理先前任务获取的知识,应用于新的、不一样但是相关任务中的机器学习方法。迁移学习使得我们可以将已经存在的标注数据用于一个新的相关任务。例如:在ImageNet网站中(),一个预先训练来进行非医学图像的分类和识别的CNN,已被用于CT扫描结果中对肺肿瘤的特征提取和病人的生存预测。ImageNet是一个大型图像数据库,库中的图像已经过手工标注图像中的对象。ImageNet大规模视觉识别挑战赛是一个年度的竞赛,该比赛中各类软件通过正确识别和区分图像中目标的方法进行竞争。非医学图像分析得到的知识被迁移用于医学图像的分析。迁移学习为机器学习在不同领域的快速发展创造了良好的契机。机器学习数据集10、通常情况下,机器学习的应用需要采用一个训练-测试系统。理想条件下,需要训练、测试和验证三个数据集。其中,训练数据集用于拟合模型。在训练过程中,算法通过样例进行学习。验证集采用单独的数据评估进行模型拟合的评估和模型参数的调整。大多数培训方法倾向于过度训练数据,意味着能够找到适合训练数据集的的模型,但是通用性不好。因此,通过执行训练和验证的连续迭代来优化算法并避免过拟合。在测试集中,在最初机器学习算法建模完成之后,最终模型可以应用于独立的测试数据集,以评估算法的性能、准确性和通用性。用于深度神经网络机器学习的开放源代码工具11、在掌握了适当的基础知识后,可以采用相对简单的低成本软件来进行机器学习。现在又许多可以进行深度学习的开源工具。机器学习在独立软件开发人员、数据科学家和企业实体中变得流行,如谷歌将机器学习技术民主化。为什么是现在?计算能力和数据的收敛性12、基于大规模并行并行处理芯片架构的主要图形处理单元,与并行计算方法(历史上可用于图形渲染和游戏)相结合,使人工神经网络的性能大幅度提高,使真正的深度学习成为可能。此外,企业积累了包括医学图像在内的大量数字数据,数字化已经发展几十年。而且,还有许多可用于机器学习的开源的算法,如CAFE、TRAP和TUNSOFLUM(见表1)。而且有大量的训练数据可以使用,例如generalizedImageNet。为什么机器学习很强大13、从根本上说,机器学习是强大的,因为它不是“易碎的”。一种基于规则的方法暴露于现实世界时可能会被打破,因为真实世界经常会出现一些程序员使用的规则所定义算法中未包含的示例。利用机器学习,系统可以基于它的训练集简单地使用统计来逼近响应最多的结果,这意味着它是灵活的。此外,机器学习是一种强大的工具,因为它是通用的,用于自驾车汽车的方法和用于医学影像判读是相同的。机器学习的通用性使其能够在包括医学在内的不同领域快速扩展。机器学习与人工智能13、与机器学习相比,人工智能(或机器智能)可以通过计算机执行更广泛的人工智能,如问题解决,规划,知识表示,语言处理,或“学习”。因此,机器学习是人工智能的一种。例如,基于规则的算法,如计算机辅助诊断就是一种人工智能,它在乳腺摄影中已经使用了几年,但其并不是机器学习的一种类型。然而,计算机辅助诊断包含很广泛,可以将机器学习也纳入其中。根据定义来看,机器学习算法是通过经验而非规则来自动改善。机器学习在越来越多的例子中得到应用,事实上,目前有许多人工智能的应用都用到了机器学习。机器学习在诊断影像学中的应用14、虽然大多数文献都集中研究机器学习在检测放射学结果中的作用,但机器学习也有可能改善放射学工作流中的不同步骤(表2),如下章节所述。病人登记和筛选15、机器学习技术促进智能调度可以优化患者的排班并降低患者的由于不参加医疗和放射学预约而错过护理可能性。EfrenFlores博士在马萨诸塞州总医院(波士顿,Mulk)领导的一个项目是使用机器学习和预测分析来识别那些因为未能如约参加放射治疗的高危患者。该小组正在开发个性化的解决方案,以减少错过护理的机会。16、此外,有研究提出将机器学习应用于病人安全检查(17)或加强安全报告(18),这在放射学实践中有潜在的应用价值(例如,MRI安全检查或对比剂的管理)。图像获取17、机器学习可以使图像系统智能化。基于机器学习的数据处理方法具有可以减少成像时间的潜力。还有,智能成像系统可以减少不必须的图像、改善位置、同时帮助优化结果的特征。例如,一个智能MR成像系统可以识别病变,并建议修改检查的序列,从而优化结果中的病变特征。结果的自动检测18、机器学习可以很快地在放射医学影像领域的结果自动检测中产生反响。例如,有研究证实了可以将机器学习应用于类似肺结节和甲状腺结节等偶然的结果提取。进一步的研究证明,机器学习可被用于检测一些关键性的结果,如气胸(图6)、骨折、器官裂伤和中风。19、机器学习算法被用于计算机辅助检测和计算机辅助诊断已经有几十年。在乳腺X线摄影中,计算机辅助诊断已经显示出其有效性。但矛盾的是,计算机辅助诊断可能会被一些乳腺癌患者忽视,限制其临床应效益。20、乳腺癌筛查是最有望将机器学习纳入放射学实践的第一个领域。多项研究结果已经表明其诊断价值,机器学习技术在不同乳房成像中得到应用,包括:乳腺X线摄影、美国、MRI、断层合成。21、人们对于机器学习在肺结节的检测、分类和管理中的作用越来越感兴趣。例如,肺结节分类的深度学习系统是在经验丰富的人类观察者之间的差异中进行的。机器学习算法也有助于减少检测肺结节的假阳性结果(20)。最近的Kakle数据科学碗看到将近10000名参加者争夺100万美元的奖金;竞争者通过识别可能在1年内被诊断为肺癌的候选者来获得高水平的表现()。一项后续挑战已经被提出,目的是将这些模型引入经验丰富的人类观察者的临床观察差异()。22、骨龄分析和基于医学成像的解剖年龄的自动确定对于儿科放射学和内分泌学具有相当大的实用价值。Synho博士和他的同事们创建了一种算法,根据输入的儿科患者的手部照片准确地描述骨龄。23、机器学习的其他潜在应用场景包括:线检测(43)、MRI中的前列腺癌检测(44~46)、冠状动脉钙化分数的测定(47)、或脑损伤的检测和分割。检查结果的自动解释24、对医学成像(正常或异常)检测结果的解释需要高水平的专家知识,经验以及基于每一种临床情况下的临床判断。一个简单的例子是腹腔内游离空气,对于术后患者这可能是一个正常的发现,但对于一个最近没有手术的病人则是关键的发现。对于机器来说,作为独立的图像解释器,需要广泛获取数据导出的知识。基于解释的系统已经得到开发,用于发现危及生命的异常的图像(如颅内出血),虽然该系统是用于优先研究一个工作清单,而不是通过最后的阅读进行研究。25、一些研究结果表明,机器学习可以改善对检查结果的解释,从而辅助放射科医生工作。基于机器学习的乳腺MR图像特征提取可以改善对检查结果的解释,进而改善对乳腺癌的诊断。基于肺结节的影像学特征(如轮廓、纹理、边缘等语义特征)的机器学习方法,可以提高肺癌结节的预测和诊断的准确性。自动临床决策支持和检查协议26、机器学习技术可以进一步增强放射学决策支持工具。研究表明,即使在复杂和不确定的环境