APP下载

大规模深度学习为女性带来的医疗之变

2017-04-17编译张含阳

机器人产业 2017年2期
关键词:X光科研人员卷积

□编译/张含阳

大规模深度学习为女性带来的医疗之变

□编译/张含阳

研究人员证明,在乳腺X光影像的大数据集上训练以卷积神经网络(CNN)形式的深度学习模型,超越了计算机辅助检测(CAD)最先进的系统。

最近,机器学习领域揭示了训练深层神经网络的最新技术,这使得在许多模式识别任务(如物体检测和语音识别)中的应用非常成功。

在机器学习应用于医疗领域的最新研究中,科研人员利用手动设计的特征集和卷积神经网络(CNN),与最先进的乳腺影像CAD系统进行了比较。目的是为了建立一套智能系统,使得该系统最终可以独立地 “读懂”女性乳房的X光照片。当两个系统均在约45000张图片的大型数据集上训练时,结果表明,在低灵敏度下,CNN胜过传统CAD系统,而在高灵敏度下,二者表现相当。

通过持续研究,科研人员试图探究在多大程度上,这些特征仍可对CNN进行补充,比如位置、患者信息,以及常用的手动特征。同时,研究人员试图研究CNN在高特异性上的改善,特别是对于包含那些CNN上不可用的位置及配置指令特征的信息。此外,科研人员还进行了一项实验,他们将该CNN网络与专业的放射科医生进行比较,结果显示,它们之间没有明显差异。

在美国,每年对近4000万个女性乳房进行X光照相检查,这主要是因为X光照相作为早期检测乳腺癌的筛选程序,被证明可以大大增加患者生存的机会。许多西方国家都实施了类似的筛查方案。但是,这些数据必须要由一个或多个经验丰富的医生来检查是否存在癌症病变的迹象,这是耗时、昂贵的过程,最重要的是,很容易出错。

为了达到最佳、精准的医疗效果,科研人员正不断开发计算机辅助检测和诊断(CAD)系统,作为医生诊断的辅助工具。来自美国的数据显示,在筛选程序中,CAD系统在医院设施中占比近70%,而在私人机构中则高达85%。因为,计算机不会存在注意力下降的困扰,当输入数据相同时,结果也是一致的,并且可以用大量的训练样本来训练,远远超过任何放射科专家在他的一生中所经历的影像样本。

上图为候选检测的流水线。候选检测器通过五个像素特征来训练,并应用于所有图像中的所有像素,生成似然图像。似然图像中的局部最优被用作参考系统和CNN的种子点。

直到最近,那些依赖于经过人工精心筛选的特征集的CAD系统和许多其他模式识别应用程序的有效性,或许要被学习算法终结了。通常,在特征设计过程中,科研人员需要咨询放射科医生,如损伤的对比,毛刺特征的样式和边缘的锐度。这些特征上的改变虽然给医生们了解病理知识提供了丰富的土壤,却使得科研人员对于人脑如何看待识别过程被执行,产生了很大的偏差。自人工智能(AI)作为一门科学学科诞生以来,研究已逐渐从基于规则的、问题特定的解决方案,越来越向基于学习未知的、通用的问题上转变,其中深度学习是AI领域的最新进展。

通过直接从训练样本中提炼信息,而不是通过该领域的权威专家,深度学习使得科研人员能够更好地利用不断增加的数据量,尽可能减少人为偏见。对于许多模式识别任务,它已被证明是成功的,以至于现在有些系统可以达到人类,甚至超越人类的性能。

术语“深度”通常指的是学习系统中的分层非线性,这使得模型能够以更少的参数来表示函数,并且促进更有效的学习。这些模型并不是才诞生,自20世纪70年代末以来,相关的科研工作就已经在进行了。然而,两篇有关深度网络的论文发表(一篇是在2006年,由Hinton,Osindero撰写,另一篇是在2007年,由Bengio,Lamblin,Popovici,Larochelle撰写),论文发现,深度网络可以通过贪婪算法、分层的方式训练,重新引燃了人们对人工智能的热潮。

上图为两个系统的比较。候选检测器生成一组候选位置。传统的CAD系统(左)使用这些位置作为图像分割算法的种子点。这些分割图像用于计算基于区域的特征。第二个系统基于卷积神经网络(CNN)(右),以相同的位置为中心。

受限玻尔兹曼机器(R BM)、概率生成模型和自动编码器(AE)、单层神经网络,当把它们堆叠起来分别形成深信度网络(DBN)和栈式自编码神经网络(SAE)后,便成为了很好的模式识别器。目前,全监督的卷积神经网络(CNN)占据着主导位置,相对于过去几十年,AI这些年得到了高速发展,在很大程度上归因于更有效的训练方法、硬件上的进步(如多核心计算的应用),以及最重要的——大量的注释训练数据。

在本论文中,科研人员通过一系列人工设计的特征,将卷积神经网络(CNN)和计算机辅助检测和诊断系统(CAD)之间进行了比较,结果显示,CNN胜过最先进的乳腺X线影像CAD系统,数据集大约在45000张图像。科研人员将检测范围集中在固体恶性病变,包括结构扭曲,治疗良性异常,比如假阳性的囊肿或纤维腺瘤。在该论文中,研究人员的目的并不是给出最简特征集,而是使用一个完整的集合,其中包含所有通常应用于乳房X光照相的描述符,并与深度学习的方法进行公平比较。

病变(a),其分割图像(b),用于计算对比特征(c),以及用于计算边缘锐度(d)的区域

过去两年,对象识别的成功,可以部分归功于科研人员明智地将卷积神经网络(CNN)与经典计算机视觉技术相结合。本着这种理念,研究人员采用候选检测器以获得一组可疑位置,这些位置通过传统系统或者CNN进行进一步检查。我们随后通过将学习的表示与诸如位置、对比度和患者信息等特征结合,来研究CNN到底在何种程度上仍然与传统描述符是互补的。

在该论文中,研究人员证明,在乳腺X光影像的大数据集上训练的以卷积神经网络(CNN)形式的深度学习模型,超越了计算机辅助检测(CAD)最先进的系统。因此,该网络具有非常巨大的潜力,有助于推动科研水平的发展。其中,主要的优点便是CNN利用数据学习,而不依赖领域内的专家,这使得医疗水平发展更简单、更快捷。同时,该论文表明,添加位置信息和配置指令可以轻松地添加到该网络中,并且几个手动设计的特征可以进行一些小的改进。除此之外,科研人员将CNN与三个有经验的医生进行了比较,其中两个是专业的放射科医生,结果证明,人类读取X光片的能力和卷积神经网络具有类似的性能。

手机扫码阅读

上图为网络架构的图示,数字表示的是使用的内核的数量。科研人员采用了VGG模型的缩小版本。为了看到常规特征仍然可以起作用的程度,网络采用全监督方式训练,随后从最终层提取学习到的特征,并且与人工特征连接,并使用第二级分类器再训练。

猜你喜欢

X光科研人员卷积
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
基于全卷积神经网络的猪背膘厚快速准确测定
科研人员揭示油桃果实表皮不长毛的奥秘
科研人员破译黑猪肉特征风味物质
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
仿生武器大揭秘
X光下的物体
企业科研人员激励问题及对策研究