APP下载

一种小波域K-Means遥感图像分类标注算法

2019-10-18彭金喜苏远歧薛笑荣

软件导刊 2019年9期
关键词:图像分割语义

彭金喜 苏远歧 薛笑荣

摘 要:由于合成孔径雷达图像(遥感)的相干斑噪声数据丰富,导致传统的遥感图像分割方法分割效果不佳,采用学习理论和神经网络改善图像处理性能。根据图像统计特征,采取神经网络语义提出一种高效的图像纹理特征分割方法。首先,利用K-means聚类提取遥感图像的纹理特征,然后根据遥感图像在小波域中的分布特征对其进行滤波,最后利用语义对滤波后的遥感图像纹理特征和灰度组成的矢量进行分割归类,在遥感图像分割中快速标注分类以便于视觉分析。利用区域一致性分割分类,由聚类样本特征匹配进行图像分类标注,对变化检测进行统计分析,过分割或欠分割误差聚类样本不做標注,选取最佳样本聚类k值标注分类结果。

关键词:合成孔径雷达;图像分割;纹理特征;语义;K-means聚类

DOI:10. 11907/rjdk. 191913 开放科学(资源服务)标识码(OSID):

中图分类号:TP317.4 文献标识码:A 文章编号:1672-7800(2019)009-0202-05

A Remote Sensing Image Semantic Classification Label of

K-means Clustering on Wavelet Transform

PENG Jin-xi,SU Yuan-qi,XUE Xiao-rong

(1. South China Institute of Software Engineering, Guangzhou University, Guangzhou  510990, China;

2. Department of Computer Science and Technology & AI, Xian Jiaotong University, Xian 710049, China;

3. School of Computer and Information Engineering, Anyang Normal University, Anyang 455000, China)

Abstract: Because of the large amount of noise data of polarized remote sensing image, the traditional remote sensing image segmentation method has a poor effect on obtaining better segmentation images. The remote sensing image contains rich texture  information to facilitate the classification of remote sensing images. Therefore, the learning method uses the advantages of theory and neural network to improve the performance of image processing. According to the statistical characteristics of the image, this paper proposes an efficient image literary feature and semantic analysis based on neural network semantics. Firstly, the texture features of remote sensing images are extracted by K-means clustering, and then filtered according to the distribution characteristics of remote sensing images in the wavelet domain. Finally, the texture features of the filtered Remote Sensing image and the vector of the gray component are segmented and classified by semantics. The algorithm quickly labeled the classification in remote sensing image segmentation for visualization-analysis. Using regional consistency segmentation classification, finally image classification labeling based on cluster sample feature matching, statistical analysis before and after change detection, over-segmentation or under-segmentation error clustering samples are not labeled, and the best sample clustering value k is selected to label classification results.

Key Words: synthetic aperture radar; image segmentation; texture feature; deep learning semantic; K-means clustering

0 引言

图像分割是目标自动识别的关键步骤,然而由于遥感图像中噪声的存在,导致传统的图像分割方法效果不佳, 对此许多专家进行了深入研究[1-2]。语义分类是根据隐含信息(texture)进行特征匹配的方法[3-5]。

遥感图像分割包括灰度值和纹理特征值,如果不同的地面物体有相同或相似的反向散射系数,则会表现出相同或相似的灰度值,易产生混淆。此外,噪声进一步加剧了图像紊乱。因此,在实际应用中,仅依据灰度值进行分割效果不佳。而在原始遥感图像中,由于遥感图像相干斑噪声数影响,灰度像素分布不均,纹理信息多元复杂,一般结合纹理特征的优点和过滤的灰度值分割遥感图像,进行分类并获取图像特征。通常采用小波域图像处理,再用k-means聚类方法对遥感图像进行分割,采用深度学习分析的优势得到较好的分割和聚类性能,满足目标分类需求。

1 K-means聚类分析

K-means是一种基于距离的迭代式算法,它将[n]个观察实例分类到[k]个聚类中,以使每个观察实例距离它所在的聚类中心点比其它聚类中心点距离更小。找到这些聚类中心点初始位置。将聚类分析作为一种无监督机器学习算法看待[6]。通过数据中实例的特征值相似度,将相似的实例划分到一类中,同时计算合适的[k]值以免过度分割或者分割不到位,选择最佳的聚类迭代法,进行分割后的分类标注。

1.1 K-means神经网络语义区域一致性分割

K-means是一种神经网络分类器,由一个三层前向反馈网络组成[7]。第一层为输入层,假设输入样本是一个[n]维特征向量[x],隐含有[n]个神经元,计算聚类的边界点到聚类中心质心距离:

中心点选取有部分差异(第一个[λ] 在[?0-1] 之间)。稳定性方法由一个数据集进行二次重采样,然后迭代出两个数据子集,对相同聚类的两个数据子集进行归类,两个[k]聚类的子集成员结果相似度概率分布趋于一致性,且具有高的相似度。由[k]的数值决定稳定聚类概率密度函数和分布式函数特征,再计算参数估计,迭代[k]值得到最佳聚类分类策略。本文利用公式(3)进行计算效率较高。

(4)初始化质心计算。

方法1:选一个样本并多层分解,每层提取[k]个簇集聚类,并用这些样本质心作为初始质心:①样本相对较小,纹理细节较多(层次聚类开销较大);②[k]相对于样本较小。随机选择第一个点作为初始化聚类质心计算。

方法2:取第一个像素样本的质心作为初始值,对于其后样本再初始质心,选择离初始质心最远的点,确保选择的初始质心不仅是随机的,而且也是分散的,但这种方法可能会偏离种群样本点造成误差较大。

(5)质心距离度量: 目标函数达到最优或者达到最大迭代次数即可终止。对于不同的距离度量,目标函数往往不同。当采用欧式距离时,目标函数为对象样本到其簇集质心的距离平方和最小。

如果所有的点在指派聚类中未获得某个簇集,则会产生空簇集,若存在空簇,继续重复多次迭代直到为非空数簇集为止。

1.2 聚类语义分析

图片分类对图片语义而言是粗粒度计算,将图片直接转化为类似文本数值或符号来描述成为一个选项。预先对大量种子图片做语义分析,然后利用相似图片搜索,根据相似输入图像元产生新图像元(texture),利用神经网络隐含层底层特征语义对图像中的聚类样本、边缘信息、识别目标、学习方法进行目标分类。

1.3 选择神经网络初始化语义参数

假设每个类的特征空间向量中各维呈正态分布,相对于该聚类中心,由于不同特征维度之间的特征向量彼此相互独立,因此需要调节神经网络参数。

2 K-means聚类算法

K-menas聚类算法[8-9]试图找到使误差准则函数最小的簇。当潜在的簇形状是凸面时,簇之间差异较明显。若簇大小相近时,其聚类结果误差最小,与样本数量呈线性相关。所以,对于大数据集合处理,该算法非常高效且伸缩性较好。但该算法除要事先确定簇数K和对初始聚类中心敏感外,经常以局部最优值迭代终止,同时对“噪声”、“孤立点”不灵敏,因此该方法不适于发现非凸面形状的簇或大小差别很大的聚集。该算法时间复杂度为[O(tKmn)],空间复杂度为[O((m+K)n)],其中,[t]为迭代次数,[k]为簇成员数量,[m]是聚类个数,[n]为样本维度。

输出聚类簇向量[C={C1,C2,?,Ck}]的等价类样本。显然,对样本向量进行正交變换后,对更新的样本均值进行优化迭代、降维,迭代最佳适应度的[k]值,可达到最佳分类效果。

3 小波滤波

将小波分解[10]的高频分量与基于子区域方差进行变换,因小波变换低频分量能量集中,根据特征匹配规则对小波变换的低频分量进行特征匹配,计算小波能量特征[E(x,y,k)],进行二维分解:水平的高频元件得到图像垂直方向上的高频分量、图像对角的高频分量。其中:

为提高遥感图像分割性能,将基于语义分割方法[11-13]结合小波域向量特征,对变化目标前后的图像进行分类对比。分割分类方法步骤如下:

(1) 改进后算法利用小波滤波方法对遥感图像进行滤波。在相应的[8×8]窗口尺寸图像中,平均灰度值为像素的灰度特征。

(2) 将纹理特征和灰度特征作为像素的特征向量,根据所有特征向量将遥感图像分割为神经网络,通过图像语义分析计算出[k=2,3?],进行分割,以免均值[k]计算误差超出预期范围造成过分类或欠分类。计算适度的[k]值,选择初始聚类样本质心,应用机器学习和深度学习方法,分割后标注精确度显著提高。

4 实验结果分析

图3是初始化遥感图像,为了验证新方法效果,本文采用一些传统的分割方法对遥感图像进行分割。用k-means聚类均值[k=2]进行图像分割。对原图像、灰度图像图3和图4、全彩色图像图5和图6,分别采用新方法3种分割结果,再进行标注,显示结果见封三彩图。

5 结语

采用k-means聚类与小波域分析相结合,可以得到更好的图像变化检测效果。选择适当的[k]值可以避免过分割或者欠分割。采用新方法可以较好地抑制相干斑噪声,提高遥感图像分割分类标注精确度。

参考文献:

[1] ARSENAULT H H,APRILL G. Properties of speckle integrated with a finite aperture and logarithmically transformed[J]. Journal of the Optical Society of America, 1976,66(11):1160-1163.

[2] BARALDI A, PARMIGGIAN F. An investigation of the texture characteristics associated with gray level co-occurrence matrix statistical parameters[J].  IEEE Transaction on Geoscience and  Remote  Sensing,1995, 33(2):293-303.

[3] LIU F,JIAO L  C,HOU B,et al. POL-remote sensing image classification based on wishart DBN and local spatial information[J]. IEEE Transactions on Geoscience and Remote Sensing,2016,54(6):3250-3308

[4] HARALICKR M. Statistical and structural approaches to texture[J]. Proceeding of IEEE,1975, 67(5):780- 804.

[5] HUAXIE, LELAND E,PIERCE  FAWWAZT. Remote sensing speckle reduction using wavelet denoising and markov random field modeling[J]. IEEE Transaction on Geoscience and Remote Sensing, 2002,40(10):2196-2212.

[6] LEE J S, POTTIER E. Polarimetric radar imaging[J].  IEEE Transactions On Image Processing, 2003,22(2):561-572.

[7] GAN L, WU Y, WANG F, et al. Unsupervised  remote sensing image segmentation based on triplet Markov fields with graph cuts[J]. IEEE Transactions on Geoscience and Remote Sensing Letters,2014, 11(4):853-857.

[8] PETER YU,QIN A K, DAVID A. Unsupervised polarimetric remote sensing image segmentation and classification using region growing with edge penalty[J]. IEEE Transactions on Geoscience and Remote Sensing,2012, 50(4):1302-1317.

[9] SOUMADIP GHOSH,DEBASISH BISWAS,SUSHANTA BISWAS,et al. Soil classification from large imagery databases using a neuro-fuzzy classifier[J]. Canadian Journal of  Electrical and Computer Engineering,2016, 39(4):333-343.

[10] WONG W C,CHO S Y,CHAI Q. R-POPTVR:a novel reinforcement- based POPTVR fuzzy neural network for pattern classification[J]. IEEE Transactions on Neural Networks,2009,20(11):1740-1755.

[11] 吳恩达. Machine learning yearning[M]. 中文版. 斯坦福大学出版社,2017.

[12] 焦李成. 学习、优化与识别[M]. 北京:清华大学出版社,2017.

[13] TOM M METCHELL. 机器学习[M]. 曹华军,译. 北京:人民邮电出版社, 2015:125-139.

(责任编辑:杜能钢)

猜你喜欢

图像分割语义
语言与语义
“上”与“下”语义的不对称性及其认知阐释
认知范畴模糊与语义模糊
“深+N季”组配的认知语义分析
语义分析与汉俄副名组合
修辞的基础——语义和谐律