多特征准则融合的遥感图像脉冲噪声的识别处理
2022-09-20马晓剑赵法舜刘艳宾
马晓剑, 赵法舜, 刘艳宾
(1.东北林业大学理学院,哈尔滨 150040; 2.中国地质大学(北京)地球科学与资源学院,北京 100083)
0 引言
遥感图像是用来描述地表信息的重要数据源,能否获取清晰、高质量的遥感图像直接关系到有用信息的提取、分析和应用。但是在采集、切换和传送遥感图像时,常常因为仪器性能、操作手段或者成像环境,导致图像被脉冲噪声所冲击,造成图像质量下降。因此,在利用遥感图像解决深层问题之前,选择合适的方法在去除脉冲噪声的同时,有效保留遥感图像原有的有用信息(如边缘和细节等)就显得至关重要。
遥感图像去噪的方法可以基于不同的理论模型,比如概率统计、偏微分方程、稀疏表示以及多尺度分析等[1-6]。DBA算法[5]、NSBMF[6]等非线性方法是在统计的基础上添加噪声判断,而文献[2]提出了一种基于梯度倒数的自适应开关算法对噪声进行判断并消除。此外,为了解决遥感图像在滤波过程中丢失细节信息的问题,文献[3]提出使用组合滤波方法,在利用多尺度分析和中值滤波后,提取边缘信息,将提取结果再融合到消噪后的遥感影像中,以此提升细节信息。以上方法的共同特点是先对随机脉冲噪声与信号点进行分类[4],再对噪声点进行消除,那么分类的准确性会直接影响着滤波的效果。
事实上这种分类问题可以视作是一种不确定性问题,因为被脉冲噪声冲击的遥感图像在某些像素点上会发生不确定性的突变,这种不确定性主要体现在突变像素强度的不确定性、突变位置的不确定性和突变数量的不确定性。D-S证据理论具有表达“不确定”和“不知道”的能力,在没有先验信息的情况下它对不确定性和非精确性进行建模有着不错的灵活性和有效性[7]。因此,它比一般概率理论的适用范围更加广泛,作为解决不确定性问题的有力工具,它已经被应用到许多实际领域,如目标识别、遥感分类和图像分割等[8-10]。D-S证据理论已经成为不确定性信息处理与信息融合领域的重要理论,但是很少有人将该理论与图像脉冲噪声和信号点的分类问题结合起来。
直到2018年Zhang等[11]提出了ASMF-DBER算法,同时考虑脉冲噪声间断特征和极值特征2种准则进行了不确定性建模,创新性地将D-S证据理论应用到了噪声与信号的分类上,并取得了不错的结果。但是在证据高度冲突的情况下,仅使用2个特征和冲突系数无法准确显示融合的效果。比如,在脉冲噪声密度较高时,图像由于受到大量脉冲噪声的冲击而遭到严重损坏,ASMF-DBER算法中的2个特征准则融合后的结果出现了违背直觉或者难以分类的情况,本文考虑添加第3种特征来降低遥感图像中出现的证据高度冲突发生的可能性。所谓“高度冲突”的情况在本文中主要表现为以下几种情况: 一是遥感图像脉冲噪声密度过大; 二是待分类的像素处在遥感图像的边缘位置或者处在图像明暗区域的交界处; 三是待分类的像素恰好体现遥感图像的细节信息。一直以来这些情况下的噪声消除都是难以解决的。
为了更加有效地刻画遥感图像的固有结构、边缘以及纹理等细节特征,并尽可能地将脉冲噪声从遥感图像中去除掉,本文把脉冲噪声的3个特征准则: 极值性、间断性和相似性作为证据,提出多特征准则模型,再根据BJS散度和信度熵,构建新的权重分配以解决证据融合出现的高度冲突的问题,然后综合评估每个像素被判断为噪声点的概率大小,即通过概率决策完成分类。另外,在消除噪声的阶段,采用的是自适应中值滤波方法。需要指出的是本文的重点是脉冲噪声与信号的分类,分类的准确性是本文重点研究的内容。实验结果证实本文算法在能够提高图像滤波后的信噪比的同时,还做到了有效保留遥感图像原有的边缘细节等信息,即使是在高度冲突的情况下也有理想的结果。
1 不确定性噪声模型及证据理论
1.1 脉冲噪声模型
为了描述脉冲噪声的不确定性,本文选择文献[12]中的噪声模型,当图像(以8位灰色图像为研究对象)被脉冲噪声破坏后,噪声随机出现在像素集合N1={0,1,2,…,l}和N2={255-l,255-(l-1),…,255}中,其概率密度函数如下:
(1)
式中:xi,j和Si,j分别为噪声图像和原始图像中处在第i行,第j列的位置的像素点;p为图像被脉冲噪声破坏的概率。被脉冲噪声污染的遥感图像的像素明显偏离正常值,主要集中在0或者255附近,具有一定的不确定性,因此,本文选取l=2进行研究,即噪声像素强度为0,1,2,253,254或255。与l=0时,脉冲噪声强度仅为0或者255的椒盐噪声相比,本文给出的噪声模型增大了噪声强度的不确定性。此外,由脉冲噪声产生的机制不难发现,噪声出现位置和数量也具有不确定性。可见,式(1)确定的脉冲噪声模型更能反映遥感图像被脉冲噪声污染的实际情况。
1.2 D-S证据理论
在辨识框架Θ上,设有n个BPA函数m1,m2,…,mn,焦元分别为A1,A2,…,An,并假设这n个BPA函数是相互独立的,则BPA函数之间的Dempster融合规则定义如下:
(2)
概率转换函数[13]是指假设m(A)是辨识框架Θ下的BPA函数,Pignistic概率转换函数将一个BPA转换为一个概率测度Betp,公式为:
(3)
式中|A|为焦元A的基数;θi为脉冲噪声N或非脉冲噪声S。一般地,通过辨识框架Θ中Betp的最高值来进行最终的决策。
2 多特征准则融合的分类算法
2.1 脉冲噪声的多特征准则不确定性建模
与相邻信号相比,被脉冲噪声污染的像素有显著的特征,比如: 极值性、相似性以及间断性。本文根据这些特征利用区间距离、相似度函数以及像素的相对差异分别构造特征准则证据m1,m2和m3。
2.1.1 极值性特征准则BPA的构造
由噪声模型可以看出,脉冲噪声像素的强度主要分布在0或者255附近,接近或者达到极值。为了将噪声和信号点进行分类,本文利用区间距离来描述像素的强度和极值之间的接近程度,定义为[14]:
(4)
式中a和b为区间,即区间a=(a1,a2)和区间b=(b1,b2),则像素x与图像之间的区间距离可以表示为:
(5)
这里I=[Imin,Imax]是图像的强度区间,Imin和Imax分别为图像的最小强度和最大强度,x∈[Imin,Imax]。
如图1所示,当x取[0,255]的中值时,d(I,[x,x])达到最小值; 当x接近极值0或255时,区间距离变大。因此,d(I,[x,x])可以用来描述像素强度x与极值Imin和Imax之间的接近程度。根据区间距离的这一性质,本文构造BPA函数m1,公式如下:
(6)
式中:dc为待分类像素的强度和区间I之间的距离;d0为在当前窗口中的像素和I之间的最小距离;dext为I和极值(Imin或Imax)的距离;dmed为I和I的中值的距离。在噪声密度高的情况下,m1(N)应该接近于1,但是文献[11]中m1(N)趋近于0,这样就导致了噪声点被判断成信号的错误分类结果,本文将文献[11]的m1函数做了改进,用ε(取ε=0.001)去调整BPA函数,避免了这种情形下的高度冲突结果的发生。
图1 不同像素的d(I,[x,x])变化图Fig.1 d(I,[x,x]) of pixels
2.1.2 相似性特征准则BPA的构造
往往图像的细节信息与周围信号既有差异性又有相似性,只用极值性特征准则进行分类还不够准确,本文用待分类像素与窗口内其他信号的差异,作为分类的又一依据来构建相似性特征准则BPA函数。
(7)
式中:rg(xi,j)为像素差,g=1,2,…,WF×WF;xi,j为(i,j)处的待分类像素强度;xi-s,j-t为(i-s,j-t)处的像素强度。令SIMij为xi,j与窗口内像素的相似度[15],公式为:
(8)
式中σμ取当前窗口区域像素的均值。则SIMij表征了xi,j与周围像素的相似程度。
利用相似度构造特征准则BPA如下:
(9)
式中μ为SIMij的权重,介于0~1之间。从图2中可以看出: 当rg的绝对值越小时,SIMij越大,说明xi,j的纹理、强度等特征与周围像素越相似,即它没有被脉冲破坏的可能性越大,则被判断成是信号点的概率就越大; 当rg绝对值增大时,SIMij减小,xi,j被判断成是脉冲噪声的概率变大。可见用SIMij构造BPA函数来对脉冲噪声与信号分类是合理的。通过实验,本文取μ=0.9效果最佳,容易证明m2满足BPA函数的定义。
图2 rg与SIMij关系曲线Fig.2 The curve of relation between rg and SIMij
2.1.3 间断性特征准则BPA的构造
处在明暗交界处的信号往往比其相邻信号的强度高或低很多,这体现了间断性的特征,同时也是脉冲噪声的特点,因此这些信号往往被错误地分类成噪声。本文构建了间断性特征准则BPA,记作m3函数,以减小分类误判的概率,公式如下:
(10)
式中:IWmax为当前窗口像素的最大值,IWmin为当前窗口像素的最小值;n为当前窗口WF(i,j)中除去中心像素的像素个数;γ为权重,介于0~1之间。
2.2 基于信度熵和BJS散度的证据融合
虽然根据脉冲噪声的极值性、相似性、间断性这3个特征进行了不确定性证据建模,但是证据之间的冲突可能还会出现,为了减少证据冲突的可能性,本文提出在利用证据融合规则之前,对特征准则BPA函数进行修正处理,利用BJS散度与信度熵对证据进行重新分配,以校正高度冲突情形下噪声与信号分类的错误结果。
若Ai为信度函数m的假设,m1和m2为在同一辨识框架Θ上的两个BPA函数,则m1和m2之间的BJS散度[16]可表示为:
(11)
根据BJS散度建立证据之间的差异度量矩阵M,即:
(12)
事实上,BJS散度的显著特征之一是可以为每种概率分布分配不同的权重,它代表了证据间可靠性的差异大小,2个证据间越相似,BJS散度就越大,尤其在多于2个证据时,它对分类结果会产生至关重要的作用。
此外,当分类的不确定性程度很高时,信度熵越大,得到证据的支持度越少,可以用它来进一步表示信号与噪声分类的不确定性。所以令Ai为信度函数m的假设,则集合Ai的信息量为:
(13)
综上,为降低高度冲突发生的可能性,提高分类效果,本文利用BJS散度建立证据可信度Rei,再根据信度熵,给出证据信息量ICi,最后融合两者作为证据的新权重,实现对证据的重新分配,具体步骤如下:
1)BJS散度计算3个证据的差异度量矩阵Mij,1≤i≤3,1≤j≤3。
2)计算证据可信度Rei,i=1,2,3。
3)由信度熵计算每个证据的信息量ICi,i=1,2,3。
4)由可信度和信息量融合生成新权重Wfi=Rei×ICi,i=1,2,3。
于是再将修改后的证据采用Dempster的融合规则进行自身间的融合,并使用Pignistic概率转换(式(3))得到概率测度Betp,并将其作为最终脉冲噪声与信号点分类的依据。如果Betp>0.5,则判断该像素点为脉冲噪声,反之则为信号点。本文提出的多特征准则的融合分类算法具体过程见图3。
图3 多特征准则的建模与融合Fig.3 Modeling and fusion process of multi-feature criterion
本文算法采用先对脉冲噪声与信号分类,再进行噪声消除的思路,提出了基于IBDND[18]的消噪改进方法,步骤如下:
1)将过滤窗口的初始大小WF设置为3,并将最大窗口大小Wmax设置为11。
2)设置当前窗口大小WF×WF,并以(i,j)的目标像素为中心设置滤波窗口WF(i,j)。
4)将过滤窗口的大小扩展为(WF+1)×(WF+1),然后重复2)和3),直到当前过滤窗口大小达到最大窗口11×11。
5)对当前过滤窗口应用近似中值像素替换,输出像素值为:
(14)
式中:Nu为当前窗口脉冲噪声像素个数;P为脉冲噪声密度;Nt为当前窗口像素总数;Zij为在窗口信号点中值Yij的基础上增添了基于距离索引的调整项;Vu为当前窗口信号点像素;dist(k)为Vu中第k个值的信号与位置(i,j)处的噪声像素之间的空间距离,公式为:
(15)
3 实验与分析
为了验证本文算法的有效性,文章从SIRI-WHU遥感影像中的公园、住宅区、工业区、和河坝等数据库[19-21]里随机选取了6幅含有不同类型地物信息的遥感图像(见图4)进行实验。这些图像具有区域平滑、色调对比明显或者背景复杂、纹理信息丰富等不同特征。采用的不确定性噪声模型见式(1)。为说明算法的优势,本文还与DBA,NSBMF,IBDND,SAMF[22]以及ASMF-DBER这5种算法进行了比较。实验主要从“高冲突”角度出发,对高噪声密度、边缘、纹理细节等情况进行视觉分析和定量分析。定量指标选择常用的结构相似度(structural similarity index,SSIM)、准确率(accuracy rate,AR)和峰值信噪比(peak signal to noise ratio,PSNR),指标公式如下:
(16)
(17)
(18)
由于本文算法分2步进行,即先将遥感图像中的脉冲噪声与信号分类,再消除噪声,因而先选择了同为2步消噪的IBDND和ASMF-DBER算法进行对比。由式(16)可以看出AR指标可以衡量分类的准确性,其值越大说明遥感图像中信号与噪声的分类越准确;SSIM指标则表示消噪后的遥感图像与原图的接近程度。因此,以图4(a)为例,表1给出这2个指标下的对比结果。
表1 不同算法的AR与SSIMTab.1 AR and SSIM of different algorithms
从表1中可以看出,在低噪声密度时,2种指标下的IBDND算法稍逊一筹,当噪声密度达到50%后,即“高度冲突”体现越明显时,本文算法的分类准确率AR表现就越突出,这意味着更多的噪声被准确识别出来。另外本文算法的SSIM在“高度冲突”下表现稳定,说明消噪后的遥感图像结构变化小于其他算法,细节保持更优。
由表1不难发现,在噪声密度较低时,ASMF-DBER算法的结构相似度略微优于本文算法,但是从定性视觉直观的角度(图5)能够发现,当噪声密度为50%时,消噪后选定明暗交界处,放大横跨河水两岸的建筑物的部分细节(图5(e)),可以明显看出ASMF-DBER算法对梯度变化较大的信息保留要稍差,而本文算法符合地理要素的空间自相关性,消噪后遥感图像中的建筑物仍能保持良好的连续性,失真度小,边缘更流畅,对比度损失小。为了进一步说明本文算法对图像边缘或明暗交替的位置具有较高的还原度,本文对河坝图的局部信息(20×20的像素区域)进行误差分析,将未污染噪声的细节图与消噪后的细节图做差,生成像素误差图,如果误差分析图越接近0附近的颜色,那么消噪后的误差就会越小。由图6不难发现相比于ASMF-DBER算法,本文算法误差波动幅度较小,图像颜色显示误差值分布更接近0附近,说明本文算法处理后的细节结果更接近原图像,从而再次说明本文算法对遥感图像的细节保持好,后期应用处理会更具优势。
为了进一步从视觉角度说明本文算法适合不同地物类型的遥感图像的去噪,本文将图4(b),(c),(d),(e)以及(f)添加10%~90%不同密度的脉冲噪声,考察遥感图像被不同噪声密度干扰时的恢复能力。这5幅不同类型的遥感图像中住宅区和立交桥的遥感图像背景相对复杂,像素反差小,细节信息较多; 公园和工业区的遥感图像类型像素强度高低相间,背景相对平滑,图像的连续性较为复杂; 云层图像色调反差大,纹理信息明显。原图及各算法处理后的效果如表2所示。从中可以看出,SAMF算法由于分类能力最差,明显有大量噪声残留,故仅适用于低噪声密度的情况; DBA算法处理后的图像过于模糊,影响后续的地物信息的提取; NSBMF算法对于细节信息多的遥感图像来说,该方法的弱点就暴露出来,比如边缘连续性差、细节清晰度低、明暗交界的轮廓位置出现了毛糙; 而本文算法对于“高冲突”处理结果理想,噪声提取准确,对于遥感图像中不同类型的地物信息还原性强。同时从表2中还可以发现,公园和云层的遥感图像中的白色高亮部分经过不同恢复算法后损失严重,这是因为白色高亮部分的像素强度接近脉冲噪声的像素强度,在脉冲噪声的识别过程中容易产生误判。本文利用多特征准则融合算法提取脉冲噪声,有效降低了误判发生的可能性,白色高亮的细节部分得到更好的保留。
表2 噪声密度依次为10%,30%,50%,70%和90%的滤波效果对比图Tab.2 Comparison of filtering effect under 10%,30%,50%,70% and 90% noise density
为验证不同噪声密度条件下本文算法均有良好的还原能力,当噪声密度由10%变化到90%时,图7为应用5种算法对图4不同类型遥感图像分别处理后的定量指标PSNR的结果。很显然,随着噪声密度的升高,PSNR指标普遍下降,IBDND算法下降速度最快,本文算法的滤波优势明显,即使噪声密度达到90%,相比其他算法,本文算法处理过的遥感图像对噪声的分类仍然有效。
图7 遥感图像的PSNR对比图
4 结论
脉冲噪声的存在极大影响着遥感图像的信息判读与分析,为了实现对遥感图像的高质量复原,扩展遥感图像的应用范围和应用价值,本文提出了多特征准则融合的脉冲噪声识别方法。在文献[11]的基础上,本文增加了脉冲噪声的相似性特征,根据脉冲噪声的相似性、极值性和间断性特征进行了新的不确定性建模; 同时利用BJS散度和信度熵对证据进行了新的权重分配,根据D-S证据理论进行了证据融合,避免冲突信息的发生。通过实验得到以下结论:
1)针对被脉冲噪声损坏后的SIRI-WHU影像中工业区、公园等不同类别的遥感图片,本文算法均表现出很强的恢复能力,还原后的遥感影像符合地理要素的空间自相关性,图像清晰且对比度损失小,说明本文算法可以广泛适用于不同类型遥感图像的去噪处理。
2)即使在信息“高冲突”的情况下,本文算法仍然能保证脉冲噪声被准确的识别,完成图像的去噪。在脉冲噪声密度达到90%时,本文算法处理后的遥感图像仍能保持原有的纹理、边缘以及明暗交界等细节信息,图像的连续性仍能保持较佳的水平,说明本文提出的多特征准则信息融合算法适合对细节信息丰富或者被高密度噪声干扰的图像进行恢复处理。