基于稀疏自编码神经网络的肺结节特征提取及良恶性分类

2015-12-20王姗姗罗举建

医疗卫生装备 2015年12期

巩萍，王姗姗，罗举建

巩萍，王姗姗，罗举建

目的：针对目前计算机辅助诊断中肺结节特征提取单纯依靠人工设计，分类结果存在很大差异这一问题，提出一种新的肺结节特征自动提取及良恶性分类方法。方法：首先通过阈值概率图从肺部CT图像中分割肺结节图像，然后通过一个2层的稀疏自编码神经网络自动提取肺结节图像的特征，最后利用Logistic回归分类器对提取到的特征进行良恶性分类。结果：肺部图像数据库联盟（lung image database consortium，LIDC）数据库上的实验结果表明，与目前基于人工设计的特征提取方法相比，该提取方法获得了最高的分类精度与曲线下面积（area under curve，AUC）值。结论：稀疏自编码神经网络能够直接从肺结节图像本身自动提取肺结节特征，避免了人工提取及选择的差异性，提高了肺结节良恶性分类的准确度，能够为临床诊断提供参考依据。

肺结节；特征提取；稀疏自编码神经网络；良恶性分类

0 引言

肺癌被认为是对人类健康与生命威胁最大的恶性肿瘤[1]，如何有效地诊断肺癌成为全人类关心的课题。早期发现与诊断是提高肺癌患者存活率的关键。临床研究表明，肺癌早期的表现形式是肺结节。在医学上，最终确定肺结节良恶性的方法是通过组织切片检查，也称活检。据统计，大约有70%～90%做活检的病例检查结果是良性，这给患者带来了不必要的手术风险、身体伤害和心理负担。因此，研究肺结节的计算机辅助诊断（computer aided diagnosis，CAD）良恶性分类方法对肺癌的早期发现与诊断具有重要意义[2]。

目前，CAD肺结节良恶性分类主要是利用各种机器学习的方法通过提取肺结节CT图像的形状、大小、纹理、密度等底层特征进行的。如Iwano[3]利用结节的充实度与二阶中心矩通过判别分析对CT图像进行了良恶性分类。Shen[4]利用结节的密度特征通过多变量回归分析进行了分类研究；Krewer[5]利用结节的纹理与几何特征通过支持向量、近邻等分类器对良恶性结节进行了分类。这种基于底层特征的分类方法在提高肺结节诊断准确率、减轻医生劳动强度、减少漏诊等方面起到了积极作用，但底层特征的提取一般是人工设计，而不是机器自动学习的。因此，选取什么样的特征来表示肺结节图像对于分类结果影响很大，很大程度上靠经验和运气，且底层特征与医生描述肺结节的语言存在很大差异，只能被计算机理解，不能被人理解。如果能通过无监督的方式让机器自动地从肺结节图像中学习到表征肺结节的特征，会使人们更好地利用计算机来进行辅助诊断。

近年来，深度学习（deep learning，DL）被广泛关注，成为机器学习与模式识别领域的一个研究热点。深度学习是2006年由Hinton等人[6]提出的，主要是通过神经网络来模拟人类大脑的学习过程，希望借鉴人脑的多层抽象机制来实现对对象或数据的抽象表达，使学习到的特征相似于生物视觉的特征，从而最终提升分类的准确性。相对于传统的神经网络，深度学习可以让机器自主学习特征，从而简化了烦琐的人工提取特征的步骤。常见的DL模型有深度神经网络（deep neural networks，DNNs）、受限玻尔兹曼机（restricted Boltzmann machine，RBM）、自动编码器（auto-encoders，AE）、卷积神经网络（convolutional neural networks，CNNs）等。这些模型在语音识别[7]、手写体分类[8]、车标识别[9]、疲劳状态识别[10]等方面都不同程度地提升了分类准确率，取得了优于过去的方法，这证明了深度学习作为特征提取及分类方案是非常成功的。目前，深度学习在医学图像方面的[11]研究应用还很少，在肺结节的特征提取及分类上未见研究报道。

针对目前计算机辅助诊断中，肺结节特征提取单纯依靠人工设计，分类结果存在差异性这一问题，提出一种肺结节特征自动提取及良恶性分类方法。首先，从肺部CT图像中分割肺结节感兴趣区域，得到肺结节图像；其次，利用2个稀疏自编码神经网络的堆叠提取肺结节图像的深层特征；最后，利用Logistic回归分类器对提取到的特征进行良恶性分类。肺结节特征提取及良恶性分类流程如图1所示。本文所有肺部CT图像来自于美国肺部图像数据库联盟（lung image database consortium，LIDC）[12]。

图1 基于深度学习的肺结节特征提取与良恶性分类图

1 LIDC数据库及肺结节感兴趣区域分割

为了给各种图像处理和CAD技术的相互比较和测评提供一个参考数据库，美国国家癌症研究会（National Cancer Institute，NCI）于2001年4月起陆续颁布了LIDC。数据库中的每个病例对应一个文件夹，包括完整的肺部CT扫描图像100～300张以及一个注释文件。注释文件中对直径大于3 mm的结节给出了由4名放射学专家标注的结节轮廓上每个点的坐标。如何由专家标注分割肺结节区域，目前最常用的方法有阈值概率图（threshold probibility maps，TPM）[13]和STAPLE（simultaneous truth and performance level estimation）[14]2种。STAPLE方法认为图像分割算法的敏感性和特异性以及真实的分割结果都是未知参数，它使用最大期望算法同时对算法的敏感性、特异性及金标准进行估计。TPM方法根据专家的专业经验为每名专家的标注设置一个权重值来表示该专家标注的可信程度，将相应专家标注的肺结节区域中的每个像素设置为相同的权重值，最后各像素值为所有专家对该像素标记的权重值之和。相对于STAPLE方法，阈值概率图方法实现更为简单方便。因此，采用阈值概率图方法来分割肺结节图像。假设专家经验一样，每个专家的权重值为0.25，如果区域中的某个像素被4名专家标记为结节的组成部分，则该像素为结节像素的概率值为1；如果只被1名专家标注，则该像素为结节像素的概率值为0.25。这样将肺结节区域转化为一个值在0～1之间的概率映射图，分割肺结节区域时只要设置一个阈值T，低于T的像素设置为0，高于T的像素设置为1，就生成了相应的二值图像。此二值图像与原始图像进行与运算，即得到肺结节图像。

2 基于稀疏自编码神经网络的肺结节特征提取

自编码神经网络（auto-encoder neural network，AENN）是一种输入层与隐含层“全连接”的神经网络，其基本结构如图2所示。包括输入层、隐含层和输出层，其中+1为偏置项系数。由图2可以看出，输出层跟输入层的神经元个数是一样的，即AENN尝试学习一个hW，b（x）≈x的函数，使输出xˆ接近于输入x。如果隐含层单元个数比输入层少的话，AENN学到的是输入数据的压缩表示，相当于对输入数据进行降维。AENN是一种数据驱动的无监督地学习数据特征的神经网络。

图2 自编码神经网络的基本结构图

对一个包含N个样本的图像集（x1，x2，…，xi，…，xN）。AENN的代价函数可表示为

研究表明，人脑在感知视觉信号的时候每次只有一部分神经元被激活，即神经元的响应是稀疏的[15]。因此，稀疏的表达更符合人的视觉系统，具有更好的学习数据特征的能力。在自编码神经网络隐含层神经元数目较多的情况下，通过加入稀疏性限制能够更好地表达数据的特性。当神经元输出接近于1，表示被激活，接近于0则表示被抑制，要使数据尽量稀疏就要使被抑制的值远多于被激活的值。设aj为神经元j的激活度，则隐含层中每个神经元j的稀疏程度可表示为

假设期望的隐含层稀疏性程度为ρ，ρ是一个接近于0的较小的常数值。对于所有的节点j，希望ρˆj= ρ。采用相对熵[16]来衡量二者之间的差别，相对熵定义如下：

在目标函数（1）的基础上加上惩罚因子相对熵即可进行稀疏性限制。加入相对熵惩罚因子后，目标函数（1）变为：

式（4）中，β是控制相对熵惩罚因子的权重，s是隐含层中神经元的数量。

通过多个稀疏自编码的堆叠可以构成栈式稀疏自编码（stacked sparse auto encoder，SSAE）。栈式稀疏自编码可以逐层地提取图像的特征，得到深层更抽象、更具可分性的特征[17]。本文将2个稀疏自编码神经网络堆叠在一起，结构如图3所示。其中输入层为肺结节图像，h与h分别表示第一个稀疏自编码神经网络与第二个稀疏自编码神经网络学习到的特征。隐含层2的输出作为分类器的输入，标签L= {0，1}，其中“0”代表良性，“1”代表恶性。采用梯度下降法更新每层的参数，并利用反向传播算法进行参数微调。

图3 基于稀疏自编码神经网络的肺结节特征提取图

3 肺结节良恶性分类

LIDC数据库中，专家把结节的恶性度量化为1、2、3、4、5 5个等级，其中1表示极不可能，2表示适度不可能，3表示不确定，4表示适度怀疑，5表示高度怀疑，对5个等级进行良恶性划分时，选取阈值T，肺结节的良恶性判别如下：

选用逻辑回归（logistic regression，LR）对稀疏自编码神经网络提取到的肺结节图像特征进行良恶性分类。LR主要用于二分类问题，它是从训练数据特征学习一个0/1的分类模型。假设稀疏自编码神经网络提取到的肺结节的特征LR模型以样本特征的线性组合作为自变量，使用Logistic函数将自变量映射到（0，1）上，通过求解权值θ1，θ2，…，θm，构造预测函数。Logistic函数表达式如下：

肺结节为恶性和良性的概率分别为：

当对测试样本进行类别判断时，首先求出新样本的gθ（H）值，然后根据该值的大小来判断良恶性。

4 实验结果及分析

4.1 肺结节图像分割

从LIDC数据库中选取结节直径大于或等于3mm的且恶性度至少由3名放射学专家定义一致的肺部CT图像。采用多专家标注的阈值概率图法提取阈值大于0.75的像素分割肺结节图像，分割过程如图4所示。

4.2 肺结节特征提取

由于肺结节大小不一致，本文把4.1得到的所有肺结节图像统一转化为32像素×32像素的大小，然后通过2个稀疏自编码神经网络进行肺结节图像深层特征提取。稀疏自编码神经网络的输入数据为32×32=1 024维，设置第一个稀疏自编码神经网络的隐含层节点数为200，第二个稀疏自编码神经网络的隐含层节点数为100，β=2，神经元的平均激活度设为0.1。图5（a）与（b）分别为第一个与第二个稀疏自编码神经网络提取到的肺结节特征的可视化显示。

图4 基于阈值概率图的肺结节图像分割过程图

图5 由稀疏自编码神经网络提取到的特征图

4.3 肺结节的良恶性分类

将4.2中自动提取到的特征通过Logistic回归进行良恶性分类，肺结节良恶性阈值设为3。为了得到更好的分类结果，利用反向传播法对参数进行微调。在临床的辅助诊断中，仅依靠分类精度有时难以准确反映分类模型的诊断价值。为了更客观、全面、准确地评价分类结果，目前国际上较为流行的是采用受试者操作特性（receiver operating characteristics，ROC）曲线和曲线下面积（area under curve，AUC）对分类作定量分析。ROC曲线是以假阳性率（false positive rate，FPR）为横坐标、真阳性率（true positive rate，TPR）为纵坐标绘制而成的。曲线越靠近左上，AUC值越大，说明分类效果越好。表1给出了不同特征下肺结节良恶性分类精度及AUC值，相应的ROC曲线如图6所示。

表1 不同特征提取方法及分类器下肺结节良恶性分类精度及AUC值

由表1可以看出，不同的人工特征提取方法其结果存在差异性，本文方法获得了最高的分类精度与AUC值。文[5]的分类精度虽然高于文[3]，但AUC值低于文[3]的结果，因此对于一个二分类，不能仅以分类精度来评价其分类效果。

5 结论

针对目前计算机辅助诊断中，肺结节特征提取单纯依靠人工设计，分类结果存在差异性这一问题，结合深度学习的思想，提出一种基于稀疏自编码神经网络的肺结节特征自动提取方法。该方法利用2个稀疏自编码神经网络的堆叠来分层地提取肺结节的高层特征，并基于Logistic回归进行良恶性分类，从而避免人工特征提取与选择的烦琐与差异。LIDC数据库上的实验结果表明，本文所提方法无论是分类精度还是AUC值均是最高的，能够有效地提高肺结节良恶性分类准确度，为临床诊断提供参考依据。

[1]Jemal A，Bray F，Ferlay J，etal.Global cancer statistics[J].CA：Cancer J Clin，2011，61（2）：69-90.

[2]李彬，田联房.恶性肺结节早期诊断智能识别相关技术综述[J].生物医学工程学杂志，2009，26（5）：1 141-1 145.

[3]Iwano S，Nakamura T，Kamioka Y，et al.Computer-aided differentiation of malignant from benign solitary pulmonary nodules imaged by high resolution CT[J].Comput Med Imaging Graph，2008，32（5）：416-422.

[4]Shen W C，Yu Y H，Chuang C H.2011 IEEE Eighth International Conference on Computer graphics，Imaging and Visualization，Singapore，Aug 17-19，2011[C].Piscataway：IEEE Press，2011.

[5]Krewer H，Geiger B，Hall L O，et al.2013 IEEE International Conference on Systems，Man，and Cybernetics，Manchester，Oct 13-16，2013[C].Piscataway：IEEE Press，2013.

（▶▶▶▶）（◀◀◀◀）

[6]Hinton G E，Salakhutdinov R.Reducing the dimensionality of data with neural networks[J].Science，2006，313（5 786）：504-507.

[7]Dahl D，Yu D，Deng L，et al.Context-dependent pre-trained deep neural networks for large-vocabulary speech recognition[J].IEEE Transactions on Audio，Speech and Language Processing，2012，20（1）：30-42.

[8]Girshick R，Donahue J，Darrell T，et al.2014 IEEE Conference on Computer Vision and Pattern Recognition，Columbus，June 23-28，2014[C].Piscataway：IEEE Press，2014.

[9]彭博，臧笛.基于深度学习的车标识别方法研究[J].计算机科学，2015，42（4）：268-271.

[10]周慧，周良，丁秋林.基于深度学习的疲劳状态识别算法[J].计算机科学，2015，42（3）：191-194.

[11]Xu Y，Mo T，Feng Q，et al.2014 IEEE International Conference on Acoustic，Speech and Signal Processing，Florence，May 4-9，2014[C]. Piscataway：IEEE Press，2014.

[12]Armato S G，McLennan G，McNitt-Gray M F，et al.Lung image database consortium：developing a resource for the medical imaging research community[J].Radiology，2004，232（3）：739-748.

[13]Meyer C R，Johnson T D，McLennan G，et al.Evaluation of lung MDCT nodule annotation across radiologists and methods[J].Acad Radiol，2006，13（10）：1 254-1 265.

[14]Warfield S K，Zou K H，Wells W M.Simultaneous truth and performance level estimation（STAPLE）：an algorithm for the validation of imagesegmentation[J].IEEETransaMedImag，2004，23（7）：903-921.

[15]Poultney C，Chopra S，Cun Y L.The 20th Annual Conference on Neural Information Processing Systems，Vancouver，British Columbia，Canada，December 4-7，2006[C].Cambridge：MIT Press，2006. [16]Ngiam J，Coates A，Lahiri A，et al.The 28th International Conference on Machine Learning，Washington，June 28-July 2，2011[C].New York：ACM Press，2011.

[17]王勇，赵俭辉，章登义，等.基于稀疏自编码深度神经网络的林火图像分类[J].计算机工程与应用，2014，50（24）：173-177.

（收稿：2015-05-15 修回：2015-09-12）

Feature extraction and benign or malignant classification of lung nodules based on sparse auto-encoder neural network

GONG Ping,WANG Shan-shan,LUO Ju-jian
（School of Medical Imaging,Xuzhou Medical College,Xuzhou 221004,Jiangsu Province,China）

Objective To put forward a method for feature extraction and benign or malignant classification of lung nodules to solve the problems due to manual operation.Methods Firstly,lung nodule images were segmented using the threshold probability-maps method from lung CT images.Secondly,sparse auto-coding neural network was applied in feature extraction and high level features of lung nodules were extracted through multiple auto-encoder.Finally,logistic regression was used to classify benign or malignant nodules by the extracted features.Results Experimental results based on lung image database consortium (LIDC)data set showed that the proposed method had higher classification accuracy and area under curve(AUC)value when compared with manual method.Conclusion Sparse auto-encoder neural network can extract the features from image level directly,avoid the difference due to manual extraction and selection,improve the classification accuracy and provide references for clinical diagnosis. [Chinese Medical Equipment Journal，2015，36（12）：7-10，14]

lung nodule;feature extraction;sparse auto-encoder neural network;benign or malignant classification

R318；TP391.41

1003-8868（2015）12-0007-05

10.7687/J.ISSN1003-8868.2015.12.007

徐州市科技计划项目（KC14SM089）；江苏省大学生科研训练计划项目（201410313062X）；徐州医学院振兴计划项目

巩萍（1980—），女，博士研究生，讲师，研究方向为医学图像处理、机器学习，E-mail：gongpingcumt@126.com。

221004江苏徐州，徐州医学院医学影像学院（巩萍，王姗姗，罗举建）