基于小波变换的多神经网络胸片骨骼分离
2015-12-20璩心波
陈 胜,璩心波
(上海理工大学光电信息与计算机工程学院,上海 200093)
近年来,肺癌的死亡人数已经占到所有癌症死亡人数的第一位。美国癌症协会统计,在过去几年,肺癌占整个癌症病例的29%。而肺癌病人在5年内的存活率约14%,但若能检测到作为早期肺癌的肺结点,再配合适当的治疗,病人的存活率可以提高到50%。CT被认为是检测肺结点的最佳方法,然而因为经济、方便与放射剂量等原因,X光胸片更为常用[1]。
虽然医学上通常使用CXR来诊断肺结点,但胸片上肺结点出现假阳性的比率仍较高。研究表明,胸片中高达30%的肺结点会被放射科医生误诊。其中,82%~95%的漏诊结点是被叠加的肋骨或锁骨遮挡[2-4]。然而,在结合了双能量互减技术的软组织图像中就能清晰地看到这些被漏诊的结点[5]。Kido等人提出了一种基于单次曝光的双能量X线摄影技术[4-5]。双能量互减技术[6-7]是用两次不同能量级的曝光参数,将软组织从胸片中分离出来。这种技术能得到不含骨骼结构的软组织图像,有助于医生更好地诊断,但这种技术需要特殊设备,且其所需的放射剂量在理论上也是通常标准所需剂量的两倍,因此只能在部分医院使用这种系统。
Ahmed等人提出了一种基于独立分量分析的技术来抑制肋骨与锁骨结构,这可以增强结点的清晰度,从而有助于医生诊断。Loog等人提出了一种使用有监督滤波器学习技术来抑制肋骨[8]。该过程基于K-最近邻域回归,从一系列训练的双能量影响及相应的剪影图像获得信息,且用这些信息从最初的标准图像中重建出软组织图像。
1 多分辨率分析
本文的目的是从胸片图像中分离出肋骨、锁骨等骨骼结构,胸腔中各个空间频率下的骨骼显示出不同的细节,单个神经网络的作用有限。为此,本文提出一种基于小波变换的人工神经网络的方法。利用小波变换得到特定的子区域图像,对应原图像不同等级的近似分量、水平细节、垂直细节和对角细节。利用这些子图像来训练人工神经网络(Artificial Neural Network,ANN),并经过小波反变换输出河涌图像,从而形成虚拟双能量(Virtual Dual Energy,VDE)复合骨骼图像。通过原图像减去相应的骨骼图像就可得到软组织图像。
2 方法
2.1 胸片图像数据库
本文采用的数据库由119幅X胸片组成,包括118幅有肺结点的异常胸片和1幅肺结点正常的胸片。文中选取正常的胸片和7例异常胸片作为训练集,剩下的胸片用于作为测试集。
2.2 抑制骨骼的多分辨率人工神经网络
对于抑制骨骼来说,大量训练的人工神经网络[9](Massive Training Artificial Neural Network,MTANN)有一个基于机器学习的回归模型——线性输出的神经网络回归模型,该模型使用线性函数而不是双曲函数作为输出层的激活函数,能够直接处理像素数据。当神经网络应用与连续映射的值是线性关系时,能够大幅提高神经网络的性能。
在该模型下,胸片被分为相互叠加的像素子区间,如图1所示,单个像素的像素值以及相应子区间被从训练图像中提取出来。神经网络的输出与相应子区域的中心像素的像素值相关,如式(1)
其中,ML是机器学习回归模型的输出,I(x,y)是输入图像的像素值,R表示输入图像。通过神经网络的训练误差被最小化为
其中,Tc是期望的标准输出;Oc是神经网络的输出;p对应于训练号;对应于总的训练像素数。
该神经网络有一个线性的输出层,从胸片中提取的自取件的像素值作为神经网络的输入,从标准图像中提取的单个像素值作为对应区域的标准值。
图1 用于训练的神经网络的结构
2.3 基于小波变换的多分辨率分解
胸片中的骨骼结构例如肋骨、锁骨包含不同的空间频率,单一神经网络的效果有限,因此不能较好地抑制不同频率下的骨骼。神经网络的性能与输入子区的尺寸大小有关,但单个神经网络输入区域的尺寸有限。因此,为解决这一问题,使用离散小波变换分解与反变换合成来完成图像多分辨率的合成与分解,多分辨率小波分解如图2所示,本文使用两层小波变换来进行图像分解。
图2 依次经过两层离散小波变换
离散小波变换可用如下矩阵形式表示
其中,F是一个N×N的哈尔变换矩阵;T是一个N×N的变换结果;H包含哈尔基函数hk(z)。它们定义在连续闭区间 z∈[0,1],k=0,1,2,…,N -1 上,其中 N=2n。
为生成矩阵H,定义整数k,即k=2p+q-1,其中0≤p≤n-1,当 p=0 时,q=0 或 1,而当 p≠0 时,1≤q≤2p。因此,哈尔基函数为
与
其中,N×N的哈尔变换矩阵的第i行包含了函数hi(z),其中 z=0/N,1/N,…,(N -1)/N。
在图3中,从左往右,从上到下依次为小波分解第二层近似分量、第二层水平细节、第二层垂直细节、第二层对角细节;第一层水平细节、第一层垂直细节、第一次对角细节。这些子图像将成为神经网络的输入。
图3 两层变换后的各个细节
2.4 神经网络训练分解后的图像
应用线性输出层的MTANN训练小波分解后的7幅子图像。由双能量互减技术得到的骨骼图像,应用相同的小波变换形成的分解图像为标准图像作为训练集输出结果的修正,以达到满意的结果,如图4所示。这里通过神经网络训练得到的是骨骼图像而不是软组织图像,这是因为软组织有如气泡、血管等复杂结构。骨骼图像在胸片中相对较明显,且直接处理软组织图像,可能会导致一些肺结点的偏移或消失。
图4 训练阶段:训练相应阶层的神经网络
实验中用于对比的标准图像由双能量互减技术得到,但当MTANN训练完成后,则不再需要,训练后的神经网络可用于直接处理标准的胸片图像,即所谓的“虚拟双能量”(Virtual Dual-Energy,VDE)技术。相比真正的双能量技术,无需特殊设备,且无需附加的放射剂,执行阶段如图5所示。
图5 执行阶段
在执行阶段期间,未经过处理的胸片图像先经过小波变换分解为7幅不同分辨率的子图像,作为7个对应的训练好的MTANN的输入,将这7个MTANN的输出,经过小波反变换重建,形成完整的骨骼图像。
采用基于像素的图像融合规则来合成完整的骨骼图像。图5中,原始图像首先经过两层小波变换分成相应的7幅子图像,这7幅图像作为训练好的对应的神经网络的输入,将7个神经网络的输出应用小波反变换合成完整的骨骼图像。经小波变换将图像分为不同的分辨率,这恰好解决了肺区内肋骨、锁骨等骨骼结构方向和密度的不同。
2.5 获得软组织图像
将上述最初的胸片图像减去执行阶段的输出就可以得到完整的软组织胸片图像,在相减前需要用总变分最小化平滑的方法来确保肋骨边缘不被损坏[10]。这是由于不是用神经网络直接得到软组织图像,而是间接得到。因此,可将该图像叫做虚拟软组织图像,如图6所示。
图6 得到虚拟软组织图像
3 讨论
本文经过两层小波变换将胸片图像分成7幅子图像,通过7个神经网络训练得到各个子图像的骨骼图像,再经过小波反变换处理7个神经网络的输出系数来得到完整的骨架图像。虽然人体的肺部区域大致相同,但不同地域、人种、性别的人的肺区形状大小各异,该神经网络不能精确地识别肺区,因此可能会导致肺部边缘部分骨骼不能精确处理。
4 结束语
本文给出了一种基于小波变换的多分辨率处理人工神经网络的方法。采用这种方法,胸片中的肋骨结构被很好的抑制,且也能较好地保存肺结点及血管等软组织。其处理效果要优于传统的单神经网络。因此,在检测胸片图像中的肺结点时,这种在肺片中的处理方法对放射科医生会有帮助。
[1]Murphy GP.American cancer society textbook of clinical oncology[M].2nd ed.Atlanta,Ga:The Society,1995.
[2]Austin JH.Missed bronchogenic carcinoma:radiographic findings in 27 patients with a potentially resectable lesion evident in retrospect[J].Radiology,1992,182(6):115 -122.
[3]Shah P K.Missed non - small cell lung cancer:radiographic findings of potentially resectable lesions evident only in retrospect[J].Radiology,2003,226(2):235 -241.
[4]Kido S,Kuriyama K,Hosomi N,et al.Detection of simulated pulmonary nodules by single-exposure dual-energy computed radiography of the chest:effect of a computer-aided diagnosis system[J].Europe Journal of Radiology,2002,44(5):205-219.
[5]Kido S,Nakamura H,Ito W,et al.Computerized detection of pulmonary nodules by single-exposure dual-energy computed radiography of the chest[J].Europe Journal of Radiology,2002,44(1):198 -204.
[6]Clocker R,Frohnmayer W.Uber die rontgenspektroskopische bestimmung des gewichtsanteiles eines elementes in gememgen und verbindumgen [J].Annalen der Physik,1925,76(6):369-395.
[7]Jacobson J,Mackay R S.Radiological contrast enhancing methods[J].Advances in Biological and Medical Physics,1958(6):201-261.
[8]Loog M.Filter learning:application to suppression of bony structures from chest radiographs[J].Medical Image Analysis,2006(10):826 -840.
[9]Suzuki K.Image- processing technique for suppressing ribs in chest radiographs by means of massive training artificial neural network(MTANN)[J].IEEE Transactions on Medical Imaging,2006,25(3):406 -16.
[10]Sheng Chen.Separation of bones from chest radiographs by means of anatomically specific multiple massive-training ANNs combined with total variation minimization smoothing and consistency processing[J].IEEETransactions on Medical Imaging Publication Information,2014,33(7):233 -246.