自适应控制下图像分割及并行挖掘算法*

2020-04-11王春华

沈阳工业大学学报 2020年2期

王春华，韩栋

(黄淮学院 a. 动画学院，b. 信息工程学院，河南驻马店 463000)

图像分割及特征挖掘[1-4]是图像处理和模式识别的重要问题及难点，决定着图像处理最终结果的精度和准确度.相关研究人员已经提出了OTSU最大类间方差分割法、基于聚类分析分割法和基于小波变换分割法等多种图像分割算法.这些算法从不同侧面对图像进行分割处理，虽然解决了一些问题，但是自身都有不能克服的缺陷.图像的模糊性质使模糊理论在图像处理领域得到广泛应用，模糊阈值分割算法成为主流图像分割算法之一.传统的模糊阈值分割算法根据图像直方图得到分割阈值，其中隶属度函数的窗口宽度计算是最关键的问题，利用隶属度函数的约束条件可以得到与图像直方图最优匹配的窗口宽度.但是图像的直方图规律变化丰富，传统方法得到的隶属度函数窗口宽度在图像直方图变化时不能进行自动调整，最终使图像误分概率变大.随着图像数据的增加，对分割结果进行人工识别越来越难[5-7]，基于机器学习的自动识别挖掘方法成为研究热点，其中，基于BP神经网络的识别方法最具有代表性[8-9].但是传统的BP神经网络方法具有运算速度慢、容易收敛于局部最小值等缺点.本文提出了一种自适应控制下图像分割及并行挖掘算法，通过采用自适应控制的模糊阈值图像分割方法，实现隶属度函数窗口宽度自适应调整，结合图像直方图的变换，克服了图像分割错误率较大的缺点.基于OpenMP并行处理模型开发目标分割识别算法，利用BP神经网络算法[10]对分割后的图像进行训练和目标识别，同时采用共轭梯度法消除BP神经网络收敛于局部极小值的缺陷.

1 自适应控制下模糊阈值分割

自适应控制下模糊阈值分割方法从模糊模型出发，通过图像隶属度函数实现图像直方图到模糊域之间的转换，将图像转换成模糊阵列，然后计算图像模糊率并求极值来最终实现图像分割.隶属度函数窗口宽度能够自适应选择，较好地克服了传统模糊阈值分割中存在的单峰或双峰不明显情况下误分概率较高的缺点.该方法采用直方图变换的思想，将双峰条件不明显的直方图进行变换实现双峰的锐化，进而确定波峰区域及波峰之间的距离，然后计算隶属度函数窗口宽度大小来实现分割阈值的自适应选择.算法包括直方图预处理、波谷检测、波峰确定、自适应计算隶属度函数窗口宽度和计算分割阈值等步骤.图1为自适应控制模糊阈值分割流程图.

图1 自适应控制模糊阈值分割流程图Fig.1 Flow chart of adaptive control fuzzy threshold segmentation

直方图预处理包括图像直方图平滑和变换两部分.直方图平滑用于消除直方图中的孤立点和毛刺等影响.直方图变换判断直方图的形状，对呈现单峰状态的直方图采取反变换，将直方图中的波峰和波谷相互转换来实现双峰特征.波谷检测利用梯度检测的方法确定预处理后直方图的波谷位置，其可能的波谷位置灰度值i满足

(1)

式中，N(i)为灰度值为i的像素的个数.将满足式(1)的所有灰度值组成集合{KN}，如果集合中元素KN+1与KN之间的差满足提前设定的宽度值η，则将KN+1作为初始阈值点，否则将其删除.重复上述过程得到波谷检测结果.通过波谷检测的结果确定直方图中各波峰所在的区域.由于直方图的波峰在形态上由波谷点、上升段、峰值点、下降段和波谷点几部分组成，则直方图的峰值点处于上升段和下降段之间.对图像直方图采用微分和直线扫描相结合的方法，利用直方图的一阶微分结合坐标轴上的逐点扫描确定波峰Fj.相邻波峰之间的距离为

Dj=Fj+1-Fj

(2)

如果直方图的灰度范围为d，自适应选择隶属度函数的窗口宽度c为

c=λDj

(3)

(4)

设图像的尺寸为W×H，共有L个灰度等级{0，1，…，L-1}，像素点(w，h)的灰度值为μ(w，h)，其隶属度函数为

(5)

灰度值为i的像素的个数为N(i)，则图像的模糊率为

(6)

利用得到的波峰位置将直方图分成多个部分，使每个部分的模糊率最小的k值即为分割阈值，其表达式为

kthre=argminv

(7)

2 基于BP神经网络的并行特征提取

当图像比较复杂时，利用传统处理方法进行特征提取时会消耗大量时间，本文采用基于OpenMP模型的图像多特征并行提取算法来提取图像的特征信息，并通过BP神经网络对图像特征进行训练，达到识别图像目标的目的.OpenMP是一种具有高度可移植性的并行处理编程模型，利用计算机的多核技术来实现并行处理，提高图像处理速率.OpenMP并行模型采用Fork-Join并行执行模型，程序执行中维持一个主线程.主线程执行到并行域时开始并行执行，执行流程如图2所示.主线程在整个运行过程中会创建多个并行线程来保证并行域中的代码在不同的线程中同时执行，此时程序相当于特定情况下的共享存储模型.通过OpenMP并行模型来对图像的几何不变矩、边缘、直线和纹理等特征进行同时提取，然后将提取的特征输入BP神经网络进行训练.

图2 OpenMP并行模型原理图Fig.2 Principle of OpenMP parallel model

BP神经网络相对于普通神经网络具有自学习、容错率大和非线性映射等优点.BP神经网络只用三层神经网络就可以以足够的精度逼近需要的非线性连续函数，通过对样本进行训练实现较好的自主学习和自适应能力.即使在部分单元受损的情况下也能够正常工作.BP神经网络的学习过程包括以下步骤：

1) 网络初始化.假设网络的输入层个数为n，隐含层个数为p，输出层个数为q，系统设定误差为e，系统最大学习次数为M，样本个数为k，激活函数选择S函数，其定义为

(8)

定义输入向量为n维向量x，隐含层输入向量和输出向量分别为hi和ho，输出层输入向量和输出向量分别为yi和yo，期望输出向量为do，初始输入层和隐含层连接权值为wih，初始隐含层和输出层连接权值为who，隐含层和输出层的阈值分别为bh和bo，则误差函数定义为

(9)

2) 输入样本训练.选择第k个输入样本x(k)和对应的期望输出do(k)计算隐含层和输出层的输入、输出及误差.输出层输入为

(10)

输出层输出为

yo(k)=f(yi(k))

(11)

隐含层输入为

(12)

隐含层输出为

ho(k)=f(hi(k))

(13)

3) 根据期望输出和实际输出计算误差函数，修正连接权值who和wih.计算神经网络的全局误差，即

(14)

式中，m为样本数量.

判断神经网络的误差是否满足要求，如果满足则结束学习，否则继续选择样本回到步骤2)继续执行.为了解决BP神经网络收敛于局部最小值的问题，采用共轭梯度法对权值进行调整，避免了收敛于局部最小值的情况.

基于BP神经网络的特征提取分为训练和识别两阶段.训练阶段通过对训练样本集进行并行特征提取并输入神经网络进行分类器训练.识别阶段将分割后潜在区域的特征输入分类器，并根据分类结果在原图像上对目标进行标记，实现目标识别的目的.两个阶段的具体步骤为：

1) 训练阶段.通过特征的并行提取得到训练集的几何不变矩、纹理、边缘和颜色等底层特征集合，然后对这些底层特征采用BP神经网络进行训练，建立分类器.①随机产生各初始连接权值和阈值；②训练样本，计算隐含层和输出层各单元输出，把每次输出结果与预期结果比较并计算误差；③通过反向传播修正权值和阈值，利用共轭梯度法寻找最佳搜索方向上最优步长并改变搜索方向；④选取下一输入并返回步骤2)反复训练，直到输出误差达到结束训练的要求.

2) 识别阶段.①输入待处理图像并预处理，对待处理图像进行自适应分割，划分出目标的潜在区域；②对分割出的潜在区域提取其几何不变矩、颜色、纹理和边缘等特征；③将各潜在区域的特征输入到训练好的分类器进行运算，将符合目标特征的目标在原图像中进行标记，实现对目标的识别.

3 实验及结果分析

本文利用Matlab进行编程，选取具有不同类型直方图的机场遥感图像对所提算法进行分割测试，并与四种传统算法比较执行结果.选择的SAR图像如图3所示.

图3 SAR图像Fig.3 SAR image

3.1 图像分割实验

传统方法通过模糊率曲线极值点数量与图像己知像素类别的个数进行对比计算窗口宽度，当图像直方图呈单峰分布或双峰不明显时，分割效果较差.本文算法中图像分割阈值是通过图像模糊率曲线中极小值确定.根据不同直方图类型选择性地进行直方图变换，将没有明显双峰分布的图像变换使其峰值更明显.通过新直方图的波谷确定波峰区域，从而确定两临近波峰间的距离，最后计算得到不同图像的隶属函数窗口宽度大小并确定分割阈值.在图3的测试图像中，直方图呈多峰分布，利用本文算法计算出相应的最佳分割阈值分别为105和187，自适应窗口宽度分别为51和32，最终分割结果如图4所示.由图4可知，虽然结果中包含两块虚警区域，本文算法较好地分辨出了遥感图像中的目标区域.

图4 分割处理结果Fig.4 Results of segmentation treatment

为了直观衡量本文算法的性能，采用基于偏移场的模糊C均值(法1)、灰度波动变换自适应阈值(法2)、自适应最小误差阈值(法3)与本文方法(法4)进行对比，分别对具有单峰、明显双峰和不明显双峰的直方图图像进行分割，各自的分割准确度如图5所示.分割准确度为分割准确的像素数除以目标区域总的像素数.

图5 分割准确度Fig.5 Segmentation accuracy

图像编号1～3为直方图单峰的图像，4～6为直方图明显双峰的图像，7～9为直方图不明显双峰的图像.由实验结果可知，采用各种方法进行图像分割时，分割结果中直方图明显双峰的图像分割准确度优于直方图不明显双峰的图像分割准确度，直方图不明显双峰的图像分割准确度优于直方图单峰的图像分割准确度.除了在图像编号6中法2的分割准确度优于法4的分割准确度外，在其他图像中法4的分割准确度均优于法1～法3的图像分割准确度.该结果表明本文图像分割算法具有最优的分割效果.

3.2 图像识别实验

选择机场和桥梁两种图像作为识别实验的对象.利用图像分割算法得到潜在目标区域后，采用基于BP神经网络的并行特征提取方法训练分类识别器并利用测试样本进行测试.机场和桥梁目标特征包括边缘特征、直线特征、纹理特征、几何不变矩和颜色特征.两种目标各个特征的识别准确率、误分率和漏检率如表1所示.

由表1可知，对机场和桥梁目标进行识别时，直线特征的正确识别率最高，这是由于机场和桥梁存在明显的直线结构，并且直线与周围的景物区别明显，因此，边缘特征的正确识别率也较高.由于机场和桥梁目标主要采用混凝土和钢材等材料构建，其与周围景物的颜色也存在明显差异，因此颜色特征的正确识别率也较高.而纹理特征和几何不变矩的正确识别率较低，由于几何不变矩在图像旋转和平移等情况下的不变特征，可以与其他特征结合提高对目标的综合识别率.对指定区域的几何不变矩和纹理特征的提取结果如表2、3所示.其中M1矩、M2矩和M3矩分别为图像的一阶、二阶和三阶Hu中心不变矩.

表1 不同特征识别结果Tab.1 Recognition results of different features %

表2 几何不变矩提取结果Tab.2 Extraction results of geometric invariant moment

表3 纹理特征提取结果Tab.3 Extraction results of texture features

由表1～3可知，在潜在区域几何不变矩具有较好的不变性.机场和桥梁的纹理特征比其他区域变化更为缓慢，清晰度更高.

为了衡量本文算法对目标的识别能力，采用传统神经网络算法作为对比算法.分别对训练集的边缘特征、直线特征、纹理特征、几何不变矩和颜色特征采用两种算法进行分类训练，然后利用测试集测试最终的识别效果.采用多组数据进行多次实验，每次实验的综合识别率和运行时间如图6、7所示.

图6 不同目标识别准确度Fig.6 Recognition accuracy of different targets

图7 不同目标运行时间Fig.7 Running time of different targets

由图6、7可知，将机场和桥梁目标图像的边缘特征、直线特征、纹理特征、几何不变矩和颜色特征输入传统神经网络和本文BP神经网络进行训练得到分类器时，本文分类器对两种目标的正确识别率明显高于传统神经网络方法的识别率，平均识别率提高了8个百分点.通过采用OpenMP并行处理机制，本文算法的运算速率也明显高于传统方法的运算速率，运算时间平均减少了2.5 s.因此，本文算法无论从识别准确率还是运行速率上都有较大优势.

4 结论

本文提出了一种自适应控制下图像分割及并行挖掘算法.利用自适应控制下模糊阈值分割法对目标图像进行分割，选取感兴趣的潜在区域.然后利用BP神经网络算法对分割后的图像进行训练和目标识别，同时采用共轭梯度法消除BP神经网络收敛于局部极小值的缺陷.识别算法基于OpenMP并行处理模型开发，有效地减少了运行时间，提高了执行效率.实验结果表明，算法相对于基于偏移场的模糊C均值、灰度波动变换自适应阈值和自适应最小误差阈值具有更高的分割准确率，与传统神经网络算法的识别结果相比，平均识别率提高了8个百分点，运行时间减少了2.5 s.