APP下载

自适应波段选择与最佳预测顺序的高光谱图像无损压缩

2020-08-05朱福全王华军杨丽平李昌国

光学精密工程 2020年7期
关键词:重排波段残差

朱福全, 王华军, 杨丽平, 李昌国

(1. 成都理工大学 地球物理学院,四川 成都 610059;2. 四川警察学院 教务处,四川 泸州 646000;3. 四川警察学院 基础教学部,四川 泸州 646000;4. 四川师范大学 基础教学学院,四川 成都 610068)

1 引 言

高光谱遥感图像包含了丰富的光谱信息,具有极强的地物分类和识别能力[1-2],在资源管理、地质探测、环境监测、军事侦察、农业生产等领域都有着十分广泛的应用[3]。随着遥感技术的不断发展,光谱分辨率、空间分辨率的不断提高及其应用的日益广泛,高光谱图像数据急剧增长。庞大的数据量不仅给高光谱图像的存储和传输带来了巨大压力,同时也制约着高光谱图像的进一步应用。因此,对高光谱图像进行有效压缩成为一项十分必要的工作。

根据信息的损失与否,高光谱图像压缩可分为有损压缩[4-7]和无损压缩。有损压缩可以获得非常高的压缩比,但会造成数据失真。在应用目的不明的情况下,数据失真会对高光谱图像的后续研究和应用带来不可预计的影响。因此,无损压缩是高光谱图像压缩的首选方案。无损压缩技术主要有3类:预测编码、变换编码[8]和矢量量化[9],其中预测编码因具有较低的复杂度和良好的压缩性能而受到广泛关注。典型的预测方法有CALIC[10],LOCO-I[11],LUT[12],DPCM[13]以及反向搜索法[14]等。

近年来,基于自适应滤波的预测方法由于具有较大的压缩潜力而倍受关注。如Klimesh[15]提出的FL方法,利用最小均方(Least Mean Square,LMS)算法计算线性预测系数。该方法复杂度低,已被空间数据系统协商委员会(CCSDS)推荐为星载高光谱图像实时压缩标准[16]。为充分利用校正引起的数据相关性,Lin和Hwang[17]提出了IP3-BPS方法,先利用3阶维纳滤波器计算得到预测参考值,然后利用后向像素搜索算法搜索最接近预测参考值像素作为最终预测值。李昌国等[18]在IP3-BPS的基础上提出了IP3-PS2-APR方法,首先对高光谱图像进行自适应波段分组,然后引入递归双向搜索策略搜索预测值,最后采用自适应预测器排序策略进行预测器排序以获得最佳预测效果。IP3-BPS系列方法提高了压缩效果,但由于需要计算相关矩阵的逆和反向搜索最佳预测值,计算复杂度较高。宋金伟等采用递归最小二乘(Recursive Least Squares,RLS)法计算8阶谱间线性预测系数[19],在降低计算复杂度的同时有效提高了预测精度。另外,利用RLS投影矩阵的特点,宋金伟等[20]又提出了Fast-RLS-ALP(Adaptive Length Prediction)方法,采用自适应改变预测阶的策略,在保证较低计算复杂度的同时进一步提高了RLS算法的压缩效果。高放等[21]在RLS的基础上提出了A-CRLS方法,通过引入遗忘因子减少旧数据的影响,利用增大上下文窗口提高预估精度,并采用穷尽式搜索策略为每个波段选择最佳预测阶,获得了比较好的压缩效果。但该方法为了选择最佳预测阶需要进行多次预测,时间开销很大。为了提高CRLS(Conventional Recursive Least Square)的压缩性能,高放等[22]又提出了C-CRLS方法,采用k均值聚类算法对光谱向量进行聚类预处理,然后对每一类分别采用CRLS预测器进行预测。分类预测的策略保证了预测过程的平稳性,从而提高了预测效果。Karaca等[23]提出了B-CRLS方法,定义了纯光谱和混合空谱两种输入向量生成模式,并在两种模式中选择最佳模式来获得每个波段的最小预测残差。该方法通过利用混合空谱模式在有限的参考波段上增加预测阶来提高预测精度,获得了目前最好的压缩效果。

递归最小二乘预测器是一种基于多元线性回归的在线的递归预测算法,其预测精度与谱间相关程度存在较强的相关性,同时对像素点的预测顺序较为敏感。基于此,本文提出了一种基于自适应波段选择和最佳预测顺序的递归最小二乘预测压缩方法。首先以最大谱间相关系数为准则对高光谱图像进行波段重排预处理,接着利用自适应波段选择策略从已预测波段集中选出与待预测波段存在最高相关性的多个波段作为参考波段,然后以最小预测残差熵为准则选出最佳预测顺序模式进行谱间预测,最后采用算术编码器对预测残差进行熵编码。AVIRIS 2006数据集上的实验证明:该方法能有效提高递归最小二乘预测器的预测精度,其最佳压缩效果接近或优于其他同类方法。

2 方法描述

方法主要包括波段重排、自适应波段选择、最佳预测顺序模式选择、预测和熵编码五个步骤,如图1所示。因解压缩的需要,波段重排序号、参考波段数组以及预测顺序模式标识需要作为边信息进行存储和传输。解压缩时,首先利用解码器从码流中恢复出残差图像,然后利用预测器按读取的参考波段数组和最佳预测顺序模式标识将残差图像恢复出高光谱图像,最后利用波段重排序号对高光谱图像进行逆排序操作得到原始图像。

2.1 波段重排

波段重排是指对高光谱图像的波段排列顺序进行重新定义,以便预测器按照重新定义的顺序依次进行谱间预测,其目的是为了让待预测波段有更好的参考波段可选择。波段重排的形式化定义如式(1)所示:

f(i)=j,1≤i,j≤n,

(1)

其中:i为重排后的波段序号,j为重排前的波段序号,n为波段总数。

递归最小二乘预测器依赖于参考波段与待预测波段间的谱间相关性,相关性越强,预测效果将会越好。因此,谱间相关系数可作为衡量参考波段“好坏”程度的有效指标。第i波段与第j波段间的谱间相关系数定义如式(2)所示:

(2)

为了实现波段重排的目的,本文以最大谱间相关系数为准则进行波段重排,即首先以平均谱间相关系数最大的波段作为第1波段,然后在未排序波段中选出与当前波段存在最大相关系数的波段作为其后续波段,依此类推。具体步骤如下:

Step 1: 选出第1波段

(3)

Step 2: 选出第i(i=2,3,…,n)波段

(4)

其中:k=f(i-1),B为未排序波段集。

2.2 自适应波段选择

波段重排并不能保证相邻波段是最好的参考波段。同时,递归最小二乘预测器的预测精度与预测阶(参考波段数)有较强的相关性,但文献[21]的实验结果也表明预测阶并不是越高越好,特别是当参考波段中含较多低相关波段时,不仅不能提高预测精度反而还会降低预测精度。另外,预测阶的增大,也会影响预测速度。针对这一问题,本文引入了自适应波段选择策略,在保证低相关波段能获得最好预测效果的前提下,以最大谱间相关系数为准则从已预测波段集中选出与待预测波段相关程度最高的波段作为参考波段。具体步骤如下:

Step 1: 确定预测阶

(5)

其中:i为待预测波段序号,O*为预设预测阶。

Step 2: 从已预测波段中选出与待预测波段相关系数最高的O个波段作为备选参考波段。

Step 3: 从备选参考波段中去掉相关系数小于阈值T的波段。如果剩余波段数大于最小预测阶O#,则以剩余波段作为参考波段;否则,以相关系数最高的O#个波段作为参考波段。

2.3 最佳预测顺序模式

预测顺序是指预测器对像素点进行预测的先后次序。由于预测顺序会影响预测过程的平稳性,递归最小二乘预测器对预测顺序较为敏感。典型的预测顺序有横向光栅、竖向光栅、横向蛇形和竖向蛇形四种模式。如图2所示,红色方格表示待预测像素点,绿色方格表示因果上下文,折线表示预测顺序(采图见期刊电子版)。目前,已报道的文献均采用横向光栅模式。蛇形模式能更好地利用像素点间的邻近性,提高预测过程的平稳程度从而取得更好的预测效果。横向模式与竖向模式的预测效果则与图像内容分布情况有关,当图像表现出明显的横向分布或竖向分布时,预测效果将会产生明显差异。

(a)横向光栅模式(a)Horizontal raster mode

(b)竖向光栅模式(b)Vertical raster mode

(c)横向蛇形模式(c)Horizontal snake mode

(d)竖向蛇形模式(d)Vertical snake mode图2 典型的预测顺序模式Fig.2 Typical prediction sequence modes

基于以上分析,本文引入了最佳预测顺序模式选择策略,以最小残差熵为原则,在横向蛇形和竖向蛇形两种模式中选择最佳模式。预测残差熵的计算公式如式(6)所示:

(6)

其中:ri(i=1,2,…,L)为预测残差符号,p(ri)为预测残差符号的概率,L为预测残差符号的数量。

考虑到经过波段重排后排列靠前的波段与其后波段存在较强的相关性,其最佳预测顺序模式与后续波段的最佳预测顺序模式具有较高的一致性这一情况(如图3所示),本文采用了快速最佳预测顺序模式估计策略以降低计算量,即以前k个波段中获得最佳预测效果最多的模式作为后续波段的最佳预测顺序模式。

图3 在未校正图像Yellowstone 10上两种蛇形模式的预测效果差异

2.4 预 测

第1波段因无参考波段而采用中值预测器进行谱内预测,其他波段则采用传统递归最小二乘预测器进行谱间预测。中值预测器的计算公式如下:

(7)

利用传统递归最小二乘预测器进行谱间预测的具体步骤如下:

Step 1: 获取参考波段和最佳预测顺序模式。

Step 2: 初始化O维系数向量w(0)=[0 0 … 0]T,逆相关矩阵Φ(0)=δI,I为O×O的单位矩阵,遗忘因子λ=0.999 5,正则化参数δ=0.001。

Step 3: 计算输入向量

(8)

Step 4: 计算预测残差

e(i)=p(i)-x(i)w(i-1),

(9)

其中p(i)为第z波段中第i像素的像素值。

Step 5: 计算增益向量

(10)

Step 6: 更新逆相关矩阵

(11)

Step 7: 更新系数向量

w(i)=w(i-1)+k(i)e(i).

(12)

Step 8: 重复Step 3~Step 7直至第z波段的最后一个像素。

2.5 熵编码

预测结束后,每个波段的预测残差采用算术编码器分别进行熵编码。首先计算每个残差的频率并将其存储到频率表中,然后建立映射表将残差转换成符号序列,最后算术编码器利用频率表对符号序列进行压缩编码。由于解码需要,频率表和映射表随码流进行存储或传输。

3 实验与分析

为了验证本文算法的有效性,在2.40 GHz CPU和8 GB RAM的PC机上使用MATLAB 2018进行了实验。实验数据为国际空间数据系统咨询委员会(CCSDS)推荐的专门用于高光谱数据压缩测试和评价的数据集AVIRIS 2006。AVIRIS 2006数据集包含了5幅16位校正图像、5幅16位未校正图像和2幅12位未校正图像,具体规格如表1所示。压缩效果采用比特率进行评价。

表1 AVIRIS 2006数据集规格Tab.1 Specifications for AVIRIS 2006 dataset

3.1 参数设置

与文献[21-23]相同,本文设置遗忘因子λ=0.999 5,正则化参数δ=0.001,因果上下文窗口W=24。自适应波段选择阶段采用的相关系数阈值T和最小预测阶O#则分别取经验值0.45和13。考虑到AVIRIS 2006数据集中高光谱图像的波段数均为224,重排序号和参考波段数组均采用8位表示,预测顺序模式标识则采用1位表示。

3.2 实验结果及比较

图4展示了本文提出的三个改进策略所取得的效果。CRLS-ABS表示在CRLS基础上加入了自适应波段选择策略,CRLS-BR-ABS表示在CRLS-ABS基础上加入了波段重排策略,CRLS-BR-ABS-OPS表示在CRLS-BR-ABS基础上加入了最佳预测顺序模式选择策略。

(a)在16位校正图像子集上的平均压缩效果(a)Average bit-rate on the 16-bit calibrated images

(b) 在16位未校正图像子集上的平均压缩效果(b)Average bit-rate on the 16-bit uncalibrated images

(c)在12位未校正图像子集上的平均压缩效果(c)Average bit-rate on the 12-bit uncalibrated images

(d)在整个AVIRIS 2006图像集上的平均压缩效果(d)Average bit-rate on the all images of AVIRIS 2006 图4 不同改进策略取不同预测阶时的压缩效果Fig.4 Compression effect of different strategies for different prediction orders

从图4中可以看出,本文所提出的三个改进策略均能在一定程度上降低比特率,特别是在预测阶较低时效果比较明显。随着预测阶的增加,改善效果有所减弱,特别是CRLS-ABS在64阶后的改善效果已不明显。这是因为预测阶的增加限制了参考波段的可选空间。但波段重排策略为大部分波段在受限的可选空间内提供了更好的参考波段选择,所以CRLS-BR-ABS在高阶情况下仍能取得一定的改善。由于最佳预测顺序模式不受预测阶的影响,所以CRLS-BR-ABS-OPS在取不同预测阶时都能获得更明显的改善。此外,从图中还可以看出,当预测阶增大到64阶后,上述算法(包括CRLS)的压缩效果均无法获得明显提高。因此,本文取定最佳预设预测阶O*=64。

表2展示了本文算法CRLS-BR-ABS-OPS的实验结果及其与其他同类算法的比较,其中FL,IP3和Fast-RLS-ALP的实验结果来自于文献[19],其他实验结果为本文测试所得,最好效果已用粗体字表示。CRLS-BR-ABS-OPS的比特率包含边信息。每幅图像的边信息约需224×(8+1+8×55) bit,平均到每个像素约为0.001 bpp。从表2可以看出,CRLS-BR-ABS-OPS取得的压缩效果明显优于FL,IP3,Fast-RLS-ALP和C-CRLS,且在16位校正图像上获得了同类算法的最佳效果,其平均比特率分别比A-CRLS和B-CRLS低了0.008 bpp和0.006 bpp。在16位未校正图像上,本文算法效果虽然不及B-CRLS,但仍比A-CRLS低了0.014 bpp;同时,在12位未校正图像上也获得了与A-CRLS相同的压缩效果。

表2 压缩效果比较Tab.2 Comparison of compression results for AVIRIS 2006 (bpp)

表3显示了本文算法各个步骤所需的平均计算时间。可以看出,波段重排、自适应波段选择以及最佳预测顺序模式估计三个步骤所需的平均计算时间约为55 s,约占预测过程的2%。因此,在预测阶相同的情况下,本文算法的计算时间只是略微多于CRLS。A-CRLS采用了步长为20阶的穷尽式搜索策略,每一幅图需要进行1 544次CRLS预测。B-CRLS采用了最佳输入向量生成模式选择策略,每一幅图需要进行446次CRLS预测。CRLS-BR-ABS-OPS采用了最佳预测顺序模式估计策略,每一幅图只需要进行234次CRLS预测。因此,尽管本文算法为获得最佳压缩效果而取最佳预测阶为64,其计算时间也会少于B-CRLS,而远少于A-CRLS。

表3 本文算法各步骤的平均计算时间Tab.3 Averagecomputation time for each step of the proposed algorithm (s)

4 结 论

本文在传统递归最小二乘预测算法的基础上提出了一种基于自适应波段选择和最佳预测顺序的高光谱图像无损压缩方法。该方法利用波段重排和自适应波段选择策略有效提高了参考波段与待预测波段间的相关性,并利用最佳预测顺序策略有效解决了递归最小二乘预测器对预测顺序敏感的问题。在AVIRIS 2006数据集上的仿真实验结果表明,在没有明显增加计算成本的情况下,本文算法能有效提高递归最小二乘预测器的预测精度,在16位校正图像、16位未校正图像和12位未校正图像上分别取得了3.314,5.594和2.395 bpp的平均比特率,其最佳压缩效果接近或优于已报道的同类算法。另外,需要说明的是,本文提出的自适应波段选择策略和最佳预测顺序策略可以直接应用到A-CRLS,B-CRLS和C-CRLS等同类算法上,以获得更好的压缩效果。

猜你喜欢

重排波段残差
基于双向GRU与残差拟合的车辆跟驰建模
最佳波段组合的典型地物信息提取
基于残差学习的自适应无人机目标跟踪算法
环己酮肟重排反应酸肟比联锁方案评析
重排滤波器的实现结构*
基于递归残差网络的图像超分辨率重建
Ig/TCR基因重排在儿童急性T淋巴细胞白血病中的表达模式特点
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
综合电离层残差和超宽巷探测和修复北斗周跳