APP下载

集成支持向量机在OCT血管内斑块分割中的应用与研究

2019-04-15张立泽清

计算机应用与软件 2019年4期
关键词:内壁分类器斑块

杨 云 张立泽清 齐 勇 王 妮

(陕西科技大学电气与信息工程学院 陕西 西安 710021)

0 引 言

动脉粥样硬化作为一种血管内壁的增生病变组织,患者在临床上无明显的特征病理,仅会出现部分非特异性表现,当硬化斑块增大并脱落后会成为危及生命的急性心脑血管疾病的病理基础[1]。临床的诊断过程中分别由动脉的宽窄程度和斑块所处部位及其形态学特征来进行稳定性与风险评估。光学相干断层扫描技术OCT在眼科相关疾病的诊断中占重要地位[2]。该断层成像技术在心血管成像的过程中对于人体的损伤较小,并已经在心脑血管等疾病方面的医学活体生物组织的成像领域进行了初步应用,且取得了较好的效果。在整个OCT血管诊断过程,血管内壁及其外壁的一定厚度内病变组织都会在视频图像中表现出相应的特征,为医生的诊断提供了更为可靠与客观的信息。但目前一次诊断过程会生成大量的图像信息,为辅助诊断进行信息处理,如何更好地使用图像处理手段、机器学习、深度学习等一系列行之有效的方法对大批量数据进行处理成为现在相关研究的热点[3]。

在相关的OCT图像分割领域主要以监督学习为主。其中文献[4]提出了使用一种利用随机森林分类器进行OCT视网膜血管分层分割的新方法,并从OCT数据中共提取了7个特征,用于同时对9个层边界进行分类。文献[5]提出了使用基于卷积神经网络(CNN)和图搜索方法(CNN-gs)的光学相干断层扫描图像九层边界自动分割框架。文献[6]使用了一种神经网络方法,通过训练神经网络来识别每一层中的点,从而估计OCT图像中视网膜层之间的边界。但上述方法在训练的过程中均需要准确且详细的标签作为支撑,且仅在OCT视网膜图像的分割领域有着较好的效果,在面对OCT血管斑块这种仅能进行范围化标记的图像无法进行有效的判断。

OCT血管内斑块极坐标图像的范围化标记,是在极坐标图像上划分出病变斑块组织所处图像长度方向的范围,且无法提供详细且准确的病变组织位置,因此本文通过对图像进行合适的预处理工作,并通过判断图像中每一像素列所属类别对病变组织进行区域划分。本文在进行OCT血管内斑块图像的处理过程中主要分为三个步骤,即图像预处理、模型调参、图像分割。

1 图像预处理

1.1 伽马变换与灰度标准化

在OCT血管内斑块图像的采集过程中,一方面对于图像中病变斑块的筛选、分析与评估依赖于极坐标图像中条带状的血管内壁组织特征,另一方面血管内壁外围的斑点噪声作为影响OCT图像质量的主要原因之一,对于像素列的分类结果有着较为明显的干扰。为凸显图像中血管内壁的特征,防止血管内壁外围阴影干扰对实验过程造成影响,在尽可能保留图像原有特征的基础上对极坐标图像进行伽马变换,在增强血管内壁区域的对比度同时去除外围阴影噪点,其伽马变换的表达式如下所示:

s=crγ

(1)

式中:c、r均为正常数,γ表示伽马系数,在进行伽马变换的过程中伽马系数取值为1.5;经过伽马变换的图像如图1所示,(a)为原始血管图像(720×352像素),(b)为伽马变换后图像,其中白色条带为血管内壁,柱状阴影截断为导丝遮挡部位。

(a)

(b)图1 伽马变换结果

由图1可知,经伽马变换后在极坐标图像下血管内壁下方的区域中的斑点噪声得到了有效的抑制,并且变换后的图像有效地保留了评价与划分血管内壁斑块区域的细节与边缘。

OCT血管图像的图像采集结果来自不同患者以及不同部位的血管,这会导致血管内壁图像的灰度产生较大波动,为进一步减少差异,屏蔽因灰度波动带来的影响,将灰度的取值范围进行标准化处理。其处理过程可表达为:

(2)

式中:xnew表示经过灰度取值范围标准化计算后的值,xroiginal表示待标准化的输入灰度,E表示灰度均值(血管内壁与背景区域),L表示图像中灰度值较大部分的均值,其取值主要在血管内壁附近。

1.2 斑块区域的检测与划分

考虑到极坐标的病变斑块标记与划分方法,其标签图像在标记的过程中所提供的斑块的信息能够表达斑块在该段血管中的前后一定范围,并且以像素列的信息为基础进行划分可以较好且直观地与标签图像进行对比与匹配。如图2所示,(a)为原始图像,(b)为斑块标记图像,其中灰色部分为病变斑块,黑色部分为正常区域,病变斑块区域为横向1~264像素列与634~720像素列部分。

(a)

(b)图2 原始图像与标记图像

从图2中可以明显发现在图像采集过程中不同结构的血管之间存在较大差异,为尽可能地减少差异,根据图像所采集的血管部位与时间点将其前后图像按组进行划分,在后续的训练与测试过程也同样采用以组为单位的方式。

2 集成支持向量机模型构建

2.1 支持向量机

机器学习领域中,支持向量机SVM在分组后的小样本数据集中可表现出较为优越的性能,我们给定一组被提前标记的OCT血管训练数据,每一个训练数据都可以将其表示为在n维空间中的点,SVM模型为了将不同类别的数据进行准确的区分,将会在空间中寻找一个n-1维的超平面来对不同的数据进行分隔。对于线性可分的数据集(xi,y),其中i=1,2,…,n,xi∈Rd,y包含两个值其中yi=-1,yj=1,其分类超平面可表达为:

ω·x+b=0

(3)

(4)

在支持向量机分类问题在经过拉格朗日乘子法后,最优化分类函数表达为:

(5)

2.2 遗传算法参数选择优化

SVM在训练的过程中,核函数参数σ的选择与惩戒参数C的选择尤为重要。因为核函数参数能够将模型的特征从低维度提升到高纬度,从而使SVM在进行分类的过程中具有较好的高维空间非线性拟合能力;惩戒参数C表示SVM在分类的过程中对于错误分类结果的容忍程度,在选择惩戒参数的过程中过大或者过小的结果都会对模型的泛化能力造成影响。因此合理的参数选择对于SVM模型显得至关重要。

本文结合OCT血管内斑块图像的特点,提出了使用GA优化SVM预测像素列模型参数的方法,遗传算法在全局寻优方面有着较强的能力,GA主要借鉴自然选择过程中生物进化的思想进行计算和迭代,将参数抽象为染色体形式,以0和1编码的方式进行表示,通过选择最优个体使得种群在筛选的过程中向最优化方向进化,从而寻求最优解。其计算步骤如下所示。

(1) 参数设置 在参数设置阶段首先需要对GA算法的参数范围进行确定和设置,其中主要包括初始化过程中的种群数量,遗传操作中的选择概率、交叉概率、变异概率以及终止条件。此处我们设置终止条件为遗传代数。

(2) 编码与种群初始化 在遗传算法编码过程中,求解最优化问题的结果被称为染色体,将带求解参数给定一个求解范围并将其转化成为能够进行遗传迭代的所使用的染色体形式,染色体通常被表示为一个0和1组合成的向量序列,最终随机生成第一步中设置的种群数量。

(3) 种群适应度判定 在每一次遗传迭代后都需要对种群中每一个个体进行适应度的判定,并按照适应度的高低进行排序,适应度高的个体的排序次序优先与适应度低的个体。本文结合OCT图像在分割过程中的实际情况,使用模型训练过程中像素列分类结果百分比误差作为种群适应度判定标准。

(4) 遗传操作 简单地对具有高适应度的个体进行选择可能会导致算法快速收敛至局部最优解,而非全局最优解。所以在对排序次序高的个体进行优先选择后,被选择的个体将进行下一步的繁衍过程。通常采用交叉和变异的方式生成新的个体。交叉过程将两个个体通过随机交换染色体上的基因序列从而产生新的下一代。变异改变染色体上基因序列的一个位(0与1的转换)来完成变异操作。

通过上述操作后,优秀个体会继续进行繁衍,而不能较好适应的个体将被淘汰,其流程图如图3所示。

图3 遗传算子计算步骤

2.3 AdaBoost

AdaBoost算法在机器学习与模式识别领域有着较为成功的应用,其核心思想是在反复迭代计算的过程中寻找和拟合出最优的权重分布,并在此基础上将多个弱分类器进行合理的组合,构建出一个强分类器。开始时训练数据中每一个样本都会被赋予一个相同的权重,在迭代的过程中,如果其中一个样本在训练的过程中被正确地进行分类,那么在下一次迭代开始时,该样本的权重就会变小,相反错误的样本分类会导致权重增加。通过这种权重的更新,AdaBoost将大权重的数据作为重点分析对象。其训练过程步骤如下所示。

(2)k=0。

(3) foriin 1,2,…,Kmax。

(4) 通过训练在训练集Train中获得以Wk(i)进行权重赋值的弱分类器Ck。

(5) 计算Ck使用Wk(i)的训练误差,记为Errork。

(6) 计算Ck权重ωk:

(6)

(7) 重新计算样本权重分布:

(7)

(8)k=k+1。

(9) untilk=Kmax;returnCkandωk。

(10) 最终输出分类结果的判定为:

(8)

式中:Zk表示归一化系数,hk(xi)表示当输入352维特征向量时分类器Ck的分类结果。

在本文中,主要使用SVM作为弱分类器,首先通过GA算法对SVM参数进行选择优化,并在训练集Train上进行学习,经过迭代法的方式不断更新权重从而使未能正确分类的数据更加突出。最后,AdaBoost算法采用合理的线性组合方式构建出最终的强分类器。其整体结构如图4所示。

图4 整体结构图

3 实验结果与分析

为验证本文方法在OCT血管内斑块图像病变部位分割效果,实验平台采用Python 2.7进行搭建。

实验环境:计算机CPU:Intel(R) Xeon(R) CPU E5-2620 v4 @ 2.10 GHz;32 GB内存。

3.1 模型训练中参数设置

采用百分比误差的方式对模型精度进行评估,在核函数的人为选择过程中径向基核函数(RBF)的效果最为优越。在训练集上的测试结果如表1所示。

表1 GA优化结果

从表1中可以看出,经过GA参数优化过后的在测试集上的测试结果优于通过主观判断。通过固定σ=8.57与C=21.67,可进一步确定弱分类器SVM数量对于实验结果的影响,实验结果如图5所示。

图5 弱分类器数量与分类结果

由图5可知,当以SVM作为弱分类器的数量增长时整体分类错误呈下降趋势。当弱分类器数量达到60个左右时趋于稳定。

3.2 评价标准

为进一步用客观的衡量方法对分割结果进行评价,本文采用两种评价系数:Dice系数以及精确度P,由于在极坐标标注的OCT血管内斑块图像中仅存在两个分类,既斑块区域与正常区域,没有进行背景的标记过程,不会出现将背景当作目标区域的错误分割,所以不选用灵敏度系数S进行评估。两种评价标准公式如下:

(9)

(10)

式中:Y′表示分割结果,Y表示标注结果,Tp表示正确分割的像素列集合,Fp表示错误的病斑区域像素列合集。

3.3 实验分析

集成支持向量机模型对于OCT血管内斑块的分割结果如图6所示。图中像素列的划分可对图像中病变斑块进行较好的表示。其中黑色代表病斑区域,白色代表正常区域。

图6 分割结果

通过采用相同的数据对经过GA参数优化的标准SVM、BP神经网络进行训练,并于本文方法进行对比。BP神经网络与标准SVM的分割结果如图7所示。各模型的分割结果客观评价如表2所示。

图7 各模型分割结果

表2 各模型评估结果

4 结 语

本文提出了一种基于像素列划分的AdaBoost-SVM图像分割模型,该模型克服了目前OCT血管内斑块图像分割过程中范围化病变斑块标注的问题,并将该分割模型分别于标准SVM和BP神经网络进行对比分析,并使用客观的评价标准对分割结果进行评判,实验结果表明集成支持向量机模型具有更为优越的性能。但该模型存在泛化能力较弱的问题,以及在对不同时间点以及不同部位的血管进行训练过程中表现出了其容错能力较弱的问题,后续将考虑寻找能够将OCT数据对标签进行细化,提升分割效果。

猜你喜欢

内壁分类器斑块
学贯中西(6):阐述ML分类器的工作流程
软斑危险,硬斑安全?不一定
颈动脉的斑块逆转看“软硬”
一篇文章了解颈动脉斑块
垣曲北白鹅墓地出土的青铜匽姬甗(M3:10)
基于朴素Bayes组合的简易集成分类器①
一种自适应子融合集成多分类器方法
有颈动脉斑块未必要吃降脂药
浅谈多分类器动态集成技术
气缸内壁温度分布和机油温度对活塞摩擦的影响