彩色多普勒超声肾动脉血流信号曲线分类研究
2013-07-20张本奎李宏益张晓东李建初
张本奎,唐 娉,李宏益,张晓东,李建初
1.中国科学院 遥感应用研究所,北京 100101
2.中国科学院大学,北京 100039
3.中国医学科学院 北京协和医院超声诊断科,北京 100730
彩色多普勒超声肾动脉血流信号曲线分类研究
张本奎1,2,唐 娉1,李宏益1,张晓东3,李建初3
1.中国科学院 遥感应用研究所,北京 100101
2.中国科学院大学,北京 100039
3.中国医学科学院 北京协和医院超声诊断科,北京 100730
1 引言
彩色多普勒超声根据肾动脉狭窄的血流动力学改变来诊断肾动脉狭窄,且具有无创、价格低廉、方便和无辐射的优点,是肾动脉狭窄的首选筛查工具[1]。大多数情况下,多普勒超声诊断设备将血流信号时间序列以图像形式输出,图1为GE公司彩色超声多普勒诊断仪L9输出的多普勒超声血流信号图像,其中横轴表示时间,单位是s,纵轴表示血流速度,单位是cm/s,图像下方较亮区域的轮廓就是血流信号时间序列,从肾动脉一次收缩开始(图1(a)中A点)到肾动脉下一次收缩开始(图1(a)中D点)称为一个周期,包括肾动脉收缩和舒张两部分。
根据血流动力学原理,正常肾动脉血流信号在一个周期内为低阻型,如图1(a)所示,收缩早期血流信号上升陡直(图1(a)中A点到B点之间部分),收缩晚期之后血流信号下降缓慢,一般情况下在收缩早期会有一切迹,称为收缩早期切迹,此切迹使得血流信号收缩期部分形成双峰,第一峰称为收缩早期波峰(图1(a)中B点),第二峰称为收缩晚期波峰(图1(a)中C点)。
图1 GE公司L9肾动脉超声多普勒血流信号图像
当肾动脉存在明显狭窄时,肾动脉血流信号表现为小慢波[2],如图1(b)所示,小慢波是指收缩期血流信号呈缓慢充盈现象,且波峰呈低振幅状态。小慢波的主要特征有:(1)收缩早期血流信号上升缓慢,呈现相对均匀的倾斜,可近似为直线或抛物线;(2)收缩早期波峰消失。
临床上主要依据收缩期开始到收缩早期波峰的时间[3]AT判断是否存在肾动脉狭窄,通用的临界值为0.07 s,即AT>0.07 s为肾动脉狭窄,AT<0.07 s为正常。然而实际应用中,计算AT所需的收缩期起始点和收缩早期波峰是由人工选取的,由于多普勒超声输出图像含有大量噪声,图像本身灰度也分布不均匀,且个体差异(年龄、血压、心率等)导致不同个体的血流信号图像差别很大(有些肾动脉正常个体却不存在收缩早期波峰),这些因素不仅使得收缩早期波峰点的选取特别困难,也使得依据多普勒超声诊断肾动脉狭窄具有很强的操作者依赖性,另外判别指标过于单一也容易产生误检或漏检的现象。
计算机辅助诊断不仅可以提高医生的工作效率,也有利于多普勒超声诊断肾动脉狭窄技术向基层医院推广,具有重要的实用意义。本文采用计算机技术从超声多普勒图像中提取肾动脉血流信号曲线进行分析,在分析曲线特征的基础上,利用SVM对正常肾动脉血流信号曲线和肾动脉狭窄血流信号曲线进行分类,对肾动脉狭窄的计算机辅助诊断进行初步探索;并与最常使用的最大似然分类器进行了分类实验比较,实验表明选择合适的特征利用SVM区分正常肾动脉血流信号曲线和肾动脉狭窄血流信号曲线有比较高的精度。
2 SVM原理
支持向量机SVM(Support Vector Machine)是由Cortes和Vapnik[4]于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,现已广泛应用于诸多领域。
SVM的基本原理[5-6]可以结合图2阐述。图2表示简单的两类样本的分类问题,方形和圆形分别代表一类样本,且这两类样本线性可分。假设有N个样本,任一样本Si由样本特征向量xi和类别标记yi组成,即Si=(xi,yi),其中yi∈{-1,1},i=1,2,…,N。图2中H表示分类超平面,表达式为:
式中w表示超平面参数向量,当g(xi)>0时,对应样本Si属于类别C1,当g(xi)<0时,对应样本Si属于类别C2。能够将两类样本分开的超平面有多个,将使得两类样本间隔最大的分类超平面称为最优分类超平面,SVM分类器建立的过程即是寻找最优分类超平面的过程。一个样本点到某个超平面的间隔定义为:
一个样本点到某个超平面的几何间隔定义为:
式中,‖w‖表示向量w的范数,同样可以把某类样本到某个超平面的几何间隔定义为该类样本中所有样本点到超平面几何间隔的最小值。图2中,H1为经过距离H最近的类别C1的样本点且平行于H的直线,H2为经过距离H最近的类别C2的样本点且平行于H的直线,由此可知,H1到H的距离为样本类别C1的几何间隔,H2到H的距离为类别C2的几何间隔。
图2 SVM分类原理
由公式(3)可以看出,几何间隔与‖w‖成反比,因此最大化几何间隔等价于最小化‖w‖,目前常用的方法为固定间隔,求取最小的‖w‖,假设间隔固定取值为1,则两个样本类别的几何间隔为2/‖w‖,从而上述分类问题就可以转化为求带约束的最小值问题:
目标函数:
约束条件:
依据公式(4)和公式(5)可以求得最优参数w′、b′,从而得到最优分类超平面:
对于非线性分类问题,SVM先通过核函数将非线性问题映射到高维空间,转化为线性分类问题再求解。
3 分类特征提取
3.1 血流信号曲线提取
多普勒超声肾动脉图像下方较亮区域的轮廓即是血流信号曲线,上方较亮区域为干扰信息,本文称下方较亮的区域为前景区域,剩余的区域(上方较亮区域及黑色区域)为背景区域。由于图像中存在大量噪声,并且前景区域灰度分布不均匀,采用边缘检测等常规方法无法有效提取前景区域轮廓,本文采用局部自适应的置信连接分割算法,有效地将前景与背景分离,具体步骤参见文献[7],然后提取前景轮廓,再使用Mean Shift[8]方法对前景轮廓曲线进行平滑,即可得到所需的血流信号曲线。图3(a)为多普勒超声肾动脉图像,图3(b)中蓝色曲线即为提取的血流信号曲线。
图3 血流信号曲线提取
3.2 血流信号有效周期提取
图4 血流信号有效周期提取
多普勒超声设备输出图像是包含多个血流信号周期的,且每次测量起始时刻在周期中的位置是随机的,即使同一个体两次测量结果也只能轮廓形状基本相同,起始位置却是不同的,因此,直接使用3.1节提取的血流信号曲线进行比较是没有意义的,而必须从中提取一个有效周期。
观察血流信号曲线可以发现,一个周期的血流信号类似于正弦曲线的前半部分,因此周期起始点处的斜率应该是最大的,经过多次实验也验证了这一结论。图4(a)上半部分蓝色曲线是血流信号曲线,下半部分青色曲线是血流信号曲线的一阶差分曲线,可以看出,在血流信号每个周期起始点处,该点在差分曲线上的对应点为局部极大值。据此,在一固定长度区间求取差分曲线的两个峰值即可确定一个血流信号周期的起点和终点(区间的长度依据经验值确定),从而可以得到一个有效周期的血流信号,图4(b)为从图4(a)表示的血流信号曲线提取的第一个有效周期。
3.3 分类特征提取
根据血流动力学原理,正常肾动脉和肾动脉狭窄多普勒超声血流信号在曲线整体形状、收缩早期上升速率、波峰幅度、曲线波动程度等方面存在比较明显的差异,依据这些差异,在3.2节提取的血流信号的有效周期的基础上,提取如下8维特征。
(1)曲线矩[9]
曲线矩是一种轮廓描绘子,在一定程度上能够反映血流信号曲线的形状。本文采用了血流信号曲线的三个低阶矩:一阶矩、二阶矩、三阶矩。计算公式为:
上式中,Μ1、Μ2、Μ3分别表示血流信号曲线的一阶矩、二阶矩、三阶矩,fi表示血流信号曲线第i个点处取值,mˉ表示血流信号曲线均值,N表示曲线长度。
(2)血流信号收缩期部分二次拟合参数
正常肾动脉血流信号曲线在收缩早期上升陡直,而肾动脉狭窄血流信号曲线在收缩早期上升缓慢,并且收缩早期曲线类似于二阶曲线,但是由于多普勒超声图像含有大量噪声,无法有效提取收缩早期波峰。观察血流信号曲线可以发现,收缩早期和整个收缩期的上升趋势几乎是一致的,因此,本文近似地截取整个收缩期曲线(收缩起始点到收缩晚期波峰部分)进行二次拟合,设拟合所得二次参数为a,一次参数为b,常数参数为c,则a表征曲线的陡峭程度,b、c表征曲线中心点的位置。
(3)血流信号波动面积占比
血流信号波动面积占比R定义为血流信号曲线波动部分的面积占曲线覆盖总面积的比例,计算公式为:
上式中,fi表示血流信号曲线第i个点处取值,fmin表示曲线最小值。
正常肾动脉血流信号曲线为低阻型,波动幅度较大,而肾动脉狭窄血流信号曲线波动较为平缓,因此,正常肾动脉血流信号曲线的波动面积占比取值较大,而肾动脉狭窄血流信号曲线的波动面积占比取值较小。
(4)峰值
正常肾动脉血流信号曲线峰值一般比较大,而肾动脉狭窄血流信号曲线峰值一般较小。
4 SVM分类及实验结果
4.1 实验数据与实验环境
选取GE公司L9肾动脉多普勒超声血流信号图像173幅作为实验数据,其中肾动脉正常图像91幅,肾动脉狭窄图像82幅。按照第3章中的步骤提取每幅图像的8维分类特征(分别为曲线矩Μ1、Μ2、Μ3,血流信号收缩期部分二次拟合参数a、b、c,血流信号波动面积占比R,峰值H),并加入类别标记,将正常类别标记为1,肾动脉狭窄类别标记为 -1,将每个类别的2/3作为训练样本集,剩余1/3作为测试样本集。为防止某一维分类特征在分类过程中所占比重过大,在SVM分类器构建之前,将训练样本集的8维分类特征分别压缩到[0 1]取值区间,测试样本集依据训练样本集的缩放比例同等压缩。
本文基于MATLAB平台和LIBSVM-3.12构建SVM分类器。LIBSVM[10]是台湾大学林智仁教授等开发的一个简单易用的SVM开源包,提供了MATLAB接口,在MATLAB平台下经过编译可以直接调用相关函数。
4.2 核函数选择
核函数将特征向量从低维空间映射到高维空间,从而使得SVM能够解决非线性可分的分类问题[11]。SVM常用的核函数有三种:
(1)多项式核函数:K(x,xi)=[γ(x,xi)+1]d。
(2)RBF核函数:K(x,xi)=exp(-γ|x-xi|2)。
(3)Sigmoid核函数:K(x,xi)=tanh(γ(x·xi)+1)。
当选定了某种核函数,在建立SVM分类器之前,除了需要确定惩罚因子C,还要确定核函数的参数,本文采用网格搜索法[12]确定未知参数。以RBF核函数为例,需要确定的未知参数有C和γ,将C的取值区间设置为[C1,C2],变化步长为Cs,将γ的取值区间设置为[γ1,γ2],变化步长为γs,每次针对C和γ的具体取值(C′,γ′)构建SVM分类器,遍历完所有取值之后,分类精度最高的(C′,γ′)就是所需的参数值。通常,C1、C2的经验取值分别为2-5、215,γ1、γ2的经验取值分别为2-15、23。另外,每次构建分类器都采用K折交叉验证的方法,所谓K折交叉验证是将训练样本等分为K份,每次取其中一份作为测试数据,剩余K-1份作为训练数据建立分类器,重复K次之后,选取分类误差最小的分类器作为最终分类器,K折交叉验证的好处是在一定程度上可以减少过度拟合,本文实验中K取值为10。
分别使用多项式核函数、RBF核函数、Sigmoid核函数,采用全部8维分类特征,按照上述步骤建立SVM分类器,并分别使用训练数据、测试数据进行分类精度检验,结果如表1所示。
由表1可以看出,RBF核函数针对训练样本集和测试样本集都取得了很好的分类精度,多项式核函数和Sigmoid核函数分类精度相近,其训练样本集分类精度低于RBF核函数。
4.3 分类特征选择和分类精度
本文总共提取8维分类特征,重复叙述如下:曲线矩Μ1、Μ2、Μ3,血流信号收缩期部分二次拟合参数a、b、c,血流信号波动面积占比R,峰值H。分别采用全部分类特征或则选取部分分类特征建立SVM分类器,核函数均采用RBF核函数,并分别使用训练数据、测试数据进行分类精度检验,结果如表2所示。
由表2可以看出,删除二次拟合参数b、c和曲线三阶矩之后,曲线分类精度依然保持不变,而删除除此之外的其他任何一个参数,分类精度均有不同程度的下降,这是因为二次拟合参数b、c表征曲线的位置信息,与曲线陡峭程度无关,血流信号曲线形状并不复杂,一阶矩、二阶矩已能够表征曲线形状,三阶以上高阶矩的作用微乎其微。
表1 不同核函数分类性能
表2 不同分类特征分类性能 (%)
4.4 与最大似然分类器的分类精度比较
最大似然分类方法是最常用的监督分类方法之一[13-14],它用于分类的隐含条件是随机变量呈正态分布。采用4.3节用于SVM分类的五维特征肾动脉曲线一阶矩Μ1、二阶矩Μ2、峰值H、波动面积占比R、收缩期二次拟合参数a作为分类特征,对173幅实验数据提取特征矩阵,统计特征矩阵每维特征的直方图分布发现,每维特征直方图分布基本符合正态分布,满足最大似然分类器使用前提。为此,使用训练样本数据集构建最大似然分类器[15]并分别使用训练样本数据集和测试样本数据集进行分类精度检验,结果如表3所示。对比基于RBF核函数的SVM分类器的分类结果,可以看出,基于RBF核函数的SVM分类器训练数据集分类准确率和测试数据集分类准确率均优于最大似然分类器。
表3 不同分类器分类性能比较(%)
5 结束语
本文在肾动脉多普勒超声图像上,提取了肾动脉血流信号曲线的有效周期,结合肾动脉狭窄在血流信号上的表征特征,分析提取了血流曲线的特征,并基于SVM构建分类器,讨论了不同的核函数及不同分类特征的分类效果,并与最大似然分类器进行了分类实验比较。实验证明,采用RBF核函数,选取曲线一阶矩Μ1、二阶矩Μ2、峰值H、波动面积占比R、收缩期二次拟合参数a这五维特征作为分类特征,使用SVM分类器,能够比较有效地对肾动脉血流信号曲线进行分类,这是对肾动脉狭窄进行计算机辅助诊断的有意义的探索。
[1]Li J C,Wang L,Jiang Y X,et al.Evaluation of renal artery stenosis with velocity parameters of Doppler sonography[J]. Ultrasound in Medicine&Biology,2006,25:735-742.
[2]李建初.小慢波频谱诊断肾动脉狭窄的现状和进展[J].中华医学超声杂志,2007,4(6):321-324.
[3]Oliveira D,Widman A,Molnar L J,et al.Color Doppler ultrasound:a new index improves the diagnosis of renal artery stenosis[J].Ultrasound in Medicine&Biology,2000,26:41-47.
[4]Cortes C,Vapnik V.Support-Vector networks[J].Machine Learning,1995,20:273-297.
[5]Vapnik V.The nature of statistical learning theory[M].张学工,译.统计学习理论的本质[M].北京:清华大学出版社,2000:100-101.
[6]邓乃扬,田英杰.数据挖掘中的新方法——支持向量机[M].北京:科学出版社,2004:164-208.
[7]王杰,杨萌.鲁棒的超声多普勒肾动脉血流信号提取方法[J].计算机科学,2010,37(2):274-276.
[8]Comaniciu D,Meer P.Mean shift:a robust approach toward feature space analysis[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(5):603-619.
[9]李炳成,沈俊.曲线矩不变性的研究[J].电子科学学刊,1992(5):262-270.
[10]Chang C C,Lin C J.LIBSVM—a library for support vector machines[EB/OL].[2012-12-01].http://www.csie.ntu.edu.tw/~cjlin/libsvm/.
[11]奉国和.SVM分类核函数及其参数选择比较[J].计算机工程与应用,2011,47(3):123-124.
[12]Hsu C W.A practical guide to support vector classification [EB/OL].[2012-12-01].http://www.csie.ntu.edu.tw/~cjlin/papers/ guide/guide.pdf.
[13]骆剑承,王钦敏.遥感图像最大似然分类方法的EM改进算法[J].测绘学报,2002,31(3):234-239.
[14]陈富龙,王超.改进最大似然遥感影像分类方法[J].国土资源遥感,2008(1):75-78.
[15]Maselli F,Conese C.Inclusion of prior probabilities derived from a nonparametric process into the maximum likelihood classifier[J].Photogrammetric Engineering&Remote Sensing,1992,58(2):201-207.
ZHANG Benkui1,2,TANG Ping1,LI Hongyi1,ZHANG Xiaodong3,LI Jianchu3
1.Institute of Remote Sensing Applications,Chinese Academy of Sciences,Beijing 100101,China
2.University of Chinese Academy of Science,Beijing 100039,China
3.Department of Ultrasound,Peking Union Medical College Hospital of the Chinese Academy of Medical Sciences,Beijing 100730,China
CDS(Color Doppler Sonography)is the first choice to screen RAS(Renal Artery Stenosis).Currently,to diagnose RAS clinically mainly relies on manual evaluation,which has a great dependency on operators.Blood signal curves of the renal artery and features of classification are extracted from CDS images,and then classifier is created based on SVM to classify blood signal curves of the renal artery with a high accuracy of classification.Besides,the result of SVM classifier is compared with that of maximum likelihood classifier.It has positive effect for diagnosing RAS with computer-aided diagnosis.
Color Doppler Sonography(CDS);blood signal curve of renal artery;Support Vector Machine(SVM);classification
彩色多普勒超声是肾动脉狭窄的首选筛查工具,目前临床上主要依靠人工判别来诊断肾动脉狭窄,对操作者具有很强的依赖性。在肾动脉多普勒超声图像的基础上,通过提取肾动脉血流信号曲线、提取曲线特征,继而基于SVM构建分类器,对肾动脉血流信号曲线进行分类,取得了较高的分类精度,并与最大似然分类器进行了分类实验比较,在肾动脉狭窄的计算机辅助诊断方向进行了有意义的探索。
多普勒超声;肾动脉血流信号曲线;支持向量机(SVM);分类
A
TP391
10.3778/j.issn.1002-8331.1301-0260
ZHANG Benkui,TANG Ping,LI Hongyi,et al.Research on classification of blood signal curves of renal artery from CDS.Computer Engineering and Applications,2013,49(18):125-129.
国家自然科学基金(No.60971050)。
张本奎(1986—),男,硕士,研究领域为图像处理;唐娉(1968—),女,博士,研究员,研究领域为图像处理;李宏益(1985—),硕士,研究领域为图像处理;张晓东(1975—),男,博士,研究领域为血管超声检查;李建初(1965—),男,博士,教授,研究领域为血管超声检查。E-mail:zhangbk0566@126.com
2013-01-23
2013-04-09
1002-8331(2013)18-0125-05
CNKI出版日期:2013-04-26 http://www.cnki.net/kcms/detail/11.2127.TP.20130426.1018.009.html