CT三维最小类内散度多分类支持向量机在肺结节识别中的应用
2015-03-15范小波王义云
范小波,董 莹,王义云
(1.山东省莱芜市人民医院 271199;2.山东省莱芜市牛泉中心卫生院 271124)
·论 著·
CT三维最小类内散度多分类支持向量机在肺结节识别中的应用
范小波1,董 莹1,王义云2
(1.山东省莱芜市人民医院 271199;2.山东省莱芜市牛泉中心卫生院 271124)
目的 分析CT三维最小类内散度多分类支持向量机(MC-SVM)对肺结节的识别能力及优点。方法 选择2012年1月至2014年1月确诊的肺结节病患者50例,根据基于三维矩阵模式的感兴趣体(VOI)的构成,分为结节样和非结节样;采用自动提取算法提取感兴趣区(ROI),分为结节ROI和非结节ROI;采用受试者工作特征(ROC)曲线比较大规模训练人工神经网络(MTANN)、基于矩阵模式的模糊最小二乘SVM(matFLSSVM)、三维矩阵模式MC-SVM和三维最小类内散度MC-SVM的识别精度,同时比较各种方法在不同截断点时的真阳性率和假阳性率。结果 三维最小类内散度MC-SVM的识别精度、真阳性率均高于其他算法,而假阳性率低于其他算法(P<0.05)。结论 三维最小类内散度MC-SVM对肺结节的识别精度较高,值得临床推广应用。
最小类内散度; 多分类支持向量机; 三维矩阵; 肺内结节
肺结节病属于肉芽肿性疾病,极易侵犯肺、双侧肺门淋巴结及皮肤等多种组织、器官[1]。计算机辅助诊断(CAD)检查可有效地辅助发现半径过小或与周围组织灰度对比度较低的肺结节[2]。支持向量机(SVM)是机器学习计算中的最新发现,主要应用于行为识别及目标检测领域,可有效提高识别精度[3]。本研究以肺结节病患者为研究对象,分析了计算机断层扫描(CT)三维最小类内散度SVM对肺结节的识别能力及优点。现将研究结果报道如下。
1 资料与方法
1.1 一般资料 2012年1月至2014年1月于山东省莱芜市人民医院确诊的肺结节病患者50例。根据基于三维矩阵模式的感兴趣体(VOI)的构成,将50例患者分为结节样31例、非结节样19例。结节样患者包括孤立型8例,与血管粘连型10例,与胸膜粘连型6例,与肺门粘连型4例,磨玻璃影结节3例。非结节样患者包括大型血管10例,中型血管6例,小型血管3例。所有患者均在CT检查后,通过支气管镜、肺活检或开胸活检获得病理学明确诊断。
1.2 方法
1.2.1 候选结节提取算法 采用圆点滤波器逐层对CT序列进行滤波增强,提取孤立性结节和粘连型结节;采用滚球法逐层进行修复,进一步提取粘连型结节;在三维空间内进行26-连接,构成候选结节的三维VOI[1]。
1.2.3 三维最小类内散度SVM 1个三维矩阵可以被展开为3个不同方向的二维矩阵A(1)、A(2)、A(3),而Al,(r)代表第l个三维矩阵的第r种展开模式。三维最小类内散度多分类SVM(MC-SVM)的决策函数如下:
r=1,2,3
1.3 统计学处理 采用SPSS18.0软件进行数据处理和统计学分析。计数资料以百分率表示,两组间比较采用χ2检验。采用受试者操作特征(ROC)曲线比较4种CAD算法的识别精度。P<0.05表示比较差异具有统计学意义。
2 结 果
2.1 4种CAD算法结果比较 4种CAD算法结果比较见表1。三维最小类内散度MC-SVM的真阳性率高于其他算法,而假阳性率低于其他算法(P<0.05)。
表1 4种CAD算法结果比较[%(n/n)]
注:ROI为感兴趣区。
2.2 4种CAD算法的识别精度比较 采用ROC曲线比较4种CAD算法的识别精度结果,MTANN、matFLSSVM、三维矩阵模式MC-SVM、三维最小类内散度MC-SVM曲线下面积分别为0.975、0.982、0.991、0.996。三维最小类内散度MC-SVM识别精度高于其他算法(P<0.05)。
3 讨 论
肺结节主要是指肺内部类球形且半径3~30 mm的病灶[4]。由于肺结节的半径较小,结节模糊不清,灰度与周围组织的对比度较低,难于被发现,极易被忽略[5]。肺结节是引发肺部恶性肿瘤的重要因素,也是诊断肺部肿瘤的重要依据。尽早检出肺结节可以有效缓解患者病情的进一步恶化,提高治疗效果[6]。目前,临床检测肺结节的方法包括MTANN、MatFLSSVM、三维矩阵模式MC-SVM及三维最小类内散度MC-SVM。由于神经网络自身的缺陷,存在对初始值较为敏感、局部最小化、不收敛等问题,直接影响了神经网络方法在CAD诊断结节中的应用效果[7]。三维最小类内散度MC-SVM是机器学习方法中最为先进的一种。该方法基于统计学习和结构风险最小化原则,不仅兼顾了学习算法的经验风险与推广能力,有效结合了模型的复杂性与学习能力,还可以转化为1个二次型寻优问题,解决了神经网络中局部极值问题,避免了神经网络拓扑结构所需要的经验试凑的方法[8]。MC-SVM提出了一种基于相邻断层限制的区域生长法,用于提取候选结节并构成三维VOI;通过提取所获得的孤立型与浅度粘连型结节,不断修复相邻层中因正常组织粘连程度较大而被漏提取的候选结节,并将候选结节所在的连续断层内ROI构成三维矩阵模式VOI,为三维矩阵模式的识别奠定了基础。三维最小类内散度MC-SVM有效提高了检测肺结节的精确度,为临床治疗提供了可靠的依据[9]。
本研究以50例肺结节病患者为研究对象,比较了4种CAD算法对肺结节的检测效果及检测价值,并分析了4种算法的临床检测特征。结果显示,三维最小类内散度MC-SVM的真阳性率高于其他算法,而假阳性率低于其他算法(P<0.05);MTANN、matFLSSVM、三维矩阵模式MC-SVM、三维最小类内散度MC-SVM ROC曲线下面积分别为0.975、0.982、0.991、0.996,三维最小类内散度MC-SVM的识别精度高于其他算法(P<0.05)。这表明三维最小类内散度MC-SVM对肺结节的检测效果优于其他方法,具有更高的临床检测价值,和相关文献报道的数据相一致[10]。因此,对于肺结节病的诊断,可以采用三维最小类内散度MC-SVM,以提高疾病的检测效率。
综上所述,三维最小类内散度MC-SVM检测肺结节效果明显,其识别精度高于其他检测方法,安全性较高,值得推广。
[1]王青竹,康文炜,王新竹,等.基于三维最小类内散度SVM的肺CT中的结节识别[J].模式识别与人工智能,2011,24(5):700-706.
[2]王仲楚,方克灶,苏缪广,等.16层螺旋CT诊断肺内结节临床分析[J].医学影像学杂志,2013,23(4):627-628.
[3]单立群,胡坚,李明东,等.胸腔镜在肺部微小结节诊治中的应用[J].中国肺癌杂志,2013,16(7):369-372.
[4]Sengur A.Multiclass least-squares support vector machines for analog modulation classification[J].Exp System Applica,2009,36(3):6681-6685.
[5]史华莉,孙琼芳,涂蓉,等.CT三维重建技术对肺内孤立性结节的诊断价值[J].中华临床医师杂志:电子版,2014,8(5):88-93.
[6]张梦龙,孙峰,王雅莹,等.数字合成体层成像和X线数字摄影在肺内结节探测中敏感度的比较[J].医学影像学杂志,2013,23(4):597-600.
[7]向林峰,文石兵,夏发明.原发周围型肺内孤立小结节的微创诊治[J].临床肺科杂志,2011,16(6):961.
[8]Gangeh MJ,Sørensen L,Shaker SB,et al.A texton-based approach for the classification of lung parenchyma in CT images[J].Med Image Comput Comput Assist Interven,2010,13(3):595-602.
[9]张文玉,黄勇,申洪明,等.肺癌患者肺内小结节良恶性的CT诊断价值[J].临床放射学杂志,2011,30(11):1604-1608.
[10]颜志红,于武江,万云飞.CT扫描对诊断肺癌肺内转移的临床意义[J].实用医学影像杂志,2011,12(2):79-81.
Application of CT images based 3D minimum within-class scatter multi-class support vector machine in the identification of lung nodules
FANXiao-bo1,DONGYing1,WANGYi-yun2
(1.LaiwuCityPeople′sHospital,Laiwu,Shandong271199,China;2.HealthCenterofNiuquan,Laiwu,Shandong271124,China)
Objective To analyze the value of CT images based 3D minimum within-class scatter multi-class support vector machine (MC-SVM) in the identification of lung nodules.Methods During Jan.2012 and Jan.2014,a total of 50 cases with pulmonary sarcoidosis were enrolled.Lung CT based 3D matrix pattern volume of interest (VOI) structure were divided into nodules samples and non-nodule samples.Region of interest (ROI) was extracted by using automatic extraction algorithm,which was further divided into nodules and non-nodular ROI.Then the recognition accuracy,true positive rate and false positive rate of large-scale massive training artificial neural network (MTANN),fuzzy ′one on one′ multi-class SVM (matFLSSVM),3D matrix model MC-SVM and 3D minimum within-class scatter MC-SVM were compared by using receiver operating curve (ROC).Results 3D minimum within-class scatter MC-SVM was with the highest recognition accuracy and true positive rate,and the lowest false positive rate,compared with the other algorithms (P<0.05).Conclusion 3D minimum within-class scatter MC-SVM might be accurate for the recognition if long nodules.
minimum within-class scatter; multi-class support vector machine; 3D matrix; lung nodules
范小波,男,医师,本科,主要从事医学影像学研究。
10.3969/j.issn.1672-9455.2015.07.026
A
1672-9455(2015)07-0940-02
2014-10-15
2014-12-20)