应用于远程维修系统的图像压缩方法
2021-10-23于桐郭利王威澄
于桐,郭利,王威澄
(1.陆军工程大学石家庄校区,河北石家庄,050003;2.武装警察部队特种警察学院,天津,102200)
0 引言
传统的野外条件下的装备维修抢修,对一线维修人员的素质要求极高,涉及复杂系统维护时,需要后方专家技术人员依据现场的视频图像,对装备现场的维修人员进行技术指导,但野外条件信号稳定度差,传输带宽小,传输效率低,数据的稳定传输有限制,对数据压缩效率提出更高要求,支持系统需要使用射频(RF)天线将其传输到后端云服务器中,而传输所有RGB 视频流数据信息消耗的功率占总功率的绝大多数,超过60%的功率消耗于射频天线传输数据中。
传统的压缩算法大多通过图像频域或空域[1,2]的各种属性进行压缩,陈曦在[3]中,提出了基于离散余弦变换(DCT)图像压缩算法,其对像素块适用性较好,但DCT 的固有性质破坏了图像质量,使色彩再现变得困难。Kasmeera等在[4]中提出了一种在隶属度数据和霍夫曼编码的帮助下压缩加密数据的方法,对静态JPEG 图像,压缩比率较传统方法更高。Ranjan 在[5]中,提出了一种基于DWT 和熵编码器的规范霍夫曼编码方式,通过标准阈值控制编码使压缩体积更小,获得的码本尺寸较传统霍夫曼编码更小。文献[6,7]中设计了基于具有Hexadata 编码和算术编码的两级DCT的图像压缩方法,提出的Hexadata 压缩算法通过减少高频矩阵中的系数来提高压缩效率。
但这些方法的在特定场景下压缩效率仍不尽如人意,需要开发新的图像压缩方法,为维修辅助设备增加额外的功能和更长时间的续航。
1 图像压缩重构方法
本文中提出了一种针对装备维修现场的图像特征特点进行优化的压缩方法,使用本文方法可获得更高的压缩效率。装备维修现场图像与常规图像有明显区别,具体体现在色彩分布均匀,分布结构具有规律性。按照传统的视频编码方式,装备维修现场图像会产生大量冗余信息,极为影响压缩效率,本文使用的图像压缩方法如图1 所示。
图1 图像压缩重构方法
方法主体分为两步:
第一步:颜色空间转换,将图像从RGB 色彩空间转换至YUV 色彩空间。
第二步:DPCM 编码,通过差分脉冲编码来减少数据维度,获得更高的压缩效率。
1.1 颜色空间转换
由于在维修现场,镜头转换基本保持缓慢平稳,相邻帧的色彩通道分布具有相似性,选取连续200 张视频帧图像,部分图像如图2 所示。
图2 维修现场图像
传统视频图像采样方式均使用基于三维空间的RGB 色彩通道,包括R、G、B 三个原始光谱分量,这三种原始的混合色基本覆盖了人类视觉的全部色彩空间。在分析图像的像素结构式,可以发现,单一色彩通道具有较广的强度分布,极为影响压缩效率。相邻两帧的图像像素强度分布直方图如图3所示。
图3 像素强度分布
可以看到,相邻帧间,图像的像素分布具有相似性,细微差别在人眼观测情况下可忽略不计,两相邻帧图像第500 行的像素值分布如图4 所示。
图4 同列像素值
为了获得更高的压缩效率,可使用对RGB 转码YUV 操作,一张图像尺寸为宽为w,高为h,YUV 颜色空间通过对RGB 空间进行计算获得色差和亮度分量,Y 为亮度,U 表示色差R-Y 信号,V 表示色差B-Y 信号。
通过RGB 采用逐点像素r、g、b 通道存储的存储方式后,占用w*h*3 内存。
使用YUV 逐点记录亮度Y,奇数行记录U,偶数行记录V 的方式,共占用w*h*1.5 内存,相对于使用传统编码方式,yuv 编码能够节约50%数据量。
图5 中所示为两个连续帧的YUV 分量的直方图。可以观察到,由于相邻帧的Y,U 和V 分量结构具有相似性,故使用合适的编码方式可节约更大的空间。
图5 YUV 强度值
1.2 差分脉冲编码
本文使用DPCM 编码方式,对图像进行再压缩,DPCM 通过对每个像素当前实际值和预测值的差值进行提取和编码,以此消除像素间的冗余,DPCM 原理如图6。
图6 DPCM 原理
DPCM 编码[8]使用线性预测器,预测系数为c,其中为点(i,j)处预测像素值,s(i,j)为点(i,j)处实际像素值,m 为预测级数,将预测级数m 设置为4,可得
为求实际值与预测值的误差最小,即求解s(i,j)和的均方差最小:
最优解为系数方程的解:
c为系数向量解,Φ 为自相关系数矩阵,其中:
自相关系数RS(x,y)定义为:
可得均方差最优系数向量解为:
2 实验结果分析
2.1 评价指标的选取
使用两种经典图像评价指标峰值信噪比PSNR 和结构相似性SSIM。
(1)峰值信噪比PSNR
由于压缩重构后的图像相较于原图像必然存在信息差。评价信息质量差的公认指标为PSNR[9],PSNR 越高,压缩后的信息保持度越高,PSNR 定义为:
其中MSE 为两张图像之间的均方误差,MAX 为图片像素极值,设定为255,MSE 定义为:
其中I(i,j)为图像I 在点(i,j)处像素值,K(i,j)为图像K 在点(i,j)处像素值。
(2)结构相似度SSIM
SSIM[9]用于度量x 和y 之间的结构信息,SSIM 定义为:
其中μx、μy为x、y 的均值,为x 和y 的方差,σxy为x 和y 的协方差,c1和c2为常数。
2.2 压缩及重构效果
本文选取了几种传统压缩编码方式与本文使用的压缩编码方式进行对比,分别为BMP 编码、JPEG 编码、奇异值压缩(SVD)[10]和本文方法,在lena 标准图像上对各种方法进行测试,图为各种方法的视觉成像效果,可以看到,本文方法能在节约大量内存情况下,保留更多的图像细节,但由于预测编码的局限性,误差不可消除,在眼角处出现了阴影型伪像。
在维修现场的图像上进行测试,图8 为各种方法的视觉成像效果。
图8 维修图像效果
表为各种压缩编码方式在维修限产图像实验中占用的内存、压缩比以及重构效果,本文方法在标准图像上能获得更好的压缩率和重构效果。
图7 各种方法压缩效果
表1 压缩率及重构效果
3 结束语
本文尝试了从压缩算法的改进设计入手,减少远程音视频系统传输的数据量,节约设备的整体能源,通过对目标图像像素结构进行统计分析,经实验验证,能够有效提高压缩比率,缓解数据传输压力,使辅助维修设备拥有更长的续航时间,添加更多功能。