APP下载

视频图像压缩在物联网监测系统中的应用

2016-10-17张霞霞孙万蓉岳智佳李沛甲

电子科技 2016年9期
关键词:编码补偿联网

张霞霞,孙万蓉,成 龙,岳智佳,李沛甲

(西安电子科技大学 电子工程学院,陕西 西安 710071)



视频图像压缩在物联网监测系统中的应用

张霞霞,孙万蓉,成龙,岳智佳,李沛甲

(西安电子科技大学 电子工程学院,陕西 西安 710071)

在物联网监测系统中,由于视频图像所占空间较大,且所需的通信带宽要求高,会在传输和存储的过程中造成困难,因此需要对视频图像进行压缩。文中介绍了一种适用于物联网监测系统的视频图像压缩方法,即通过帧预测、DCT变换和可变长编码相结合的方式对视频图像进行编码和相应的解码。经过实验表明,该方法有效地压缩了视频图像,且在提高视频图像传输速率的同时,减少了传输时间。

视频图像压缩;运动补偿;运动估计;DCT变换

1 物联网监测系统的体系架构

物联网[1]监测系统主要由3大部分组成:感知层、网络层和应用层,如图1所示。其中,在感知层用传感器采集数据,然后通过网络层传输到应用层,在浏览器中便可看到采集的数据。

图1 物联网监测系统3层架构

同理,在感知层采集到视频图像信息后,要先对其进行压缩,再通过网络传输到应用层,对其解压后再观察。

2 视频图像压缩编码

2.1视频图像压缩的必要性和可行性

在采集视频图像时,获得的数据量通常较大,如不经适当的压缩编码处理[2],视频图像传输所需的高速率和存储所需的巨大容量将成为其推广应用的最大障碍。

由于组成图像的各个像素点之间无论在行的方向还是在列的方向上均具有相关性,整个图像数据具有较大的冗余度,也就有一定的压缩潜力。而且评价图像品质的最终标准取决于人眼,而人眼由于其视觉特性对图像的细微差别还是难以分辨的,在对图像数据进行压缩时,可允许一定程度的失真[3]。

所以,无论是从视频图像自身特点还是评价图像品质的对象来看,对大量的视频图像数据做压缩编码以降低传输时间和存储空间的方法是可行的。

2.2常用的视频图像压缩编码方法

最经典的视频压缩编码技术是预测编码、变换编码和统计编码。

2.2.1预测编码

预测编码的基本原理是先得到预测值,该值是根据数据的统计特性获得,接着传输预测值与图像像素差值信号,降低传输码率,最终实现压缩。压缩编码后传输的并不是像素本身的取样幅值,而是该取样的预测值和实际值之差[4]。

预测编码的原理如图2所示。

图2 预测编码原理图

在图2(a)中,x(n)为原始数据;p(n)为预测值;d(n)=x(n)-p(n),即实际值和预测值之差,q(n)是输出量化值;s(n)是编码输出。在图2(b)中,s(n)经解码并反量化后得到d′(n),将d′(n)和预测值p′(n)求和,便可得到恢复后的数据x′(n),x′(n)=d′(n)+p′(n)。预测编码可分为帧内预测和帧间预测。

帧内预测:即根据一个像素点周围的像素值,来预测当前像素值。具体方法有一维预测和二维预测。人眼视觉特性实验表明,在亮度突变部分,量化误差大一些人眼不会太敏感,可采取粗量化(量化节距大);反之,在亮度变化缓慢区域,则应取细量化。利用人眼这种掩盖效应采用非线性(不均匀)量化,可使总码率有所下降[5]。表1是预测编码的一个差值量化表,第一行的值是差值,差值越大,说明变化越快,量化节距便可取得越大。

表1 差值量化表

当进行完预测后,将测量到的实际值与预测值比较得出差值,将此差值记录并编码,而不是直接对实际值编码。

帧间预测:即利用相邻帧之间像素点的相关性进行预测,视频图像前后帧之间,相同位置处的像素点有较强的相关性。在视频中,物体运动大多是平移运动。因此,若能判断出当前帧的某个物体是由上一帧中的某个物体运动而来,便可将上一帧中该物体附近区域的像素点直接“复制”到当前帧中对应的位置,作为该宏块的预测值[6]。与帧内预测不同的是,除了记录差分值外,帧间预测还要对运动矢量进行编码。

2.2.2变换编码

变换编码不直接对空间域图像数据进行编码,而是将空间域图像数据映射变换到另一个正交向量空间,得到一组变换系数,然后对这些变换系数进行量化、编码、传输。对变换系数进行压缩编码,比直接对图像数据本身进行压缩更容易获得高的效率[7]。

变换编码的原理图,如图3所示。变换编码的基本方法:将数字图像分成一定大小的子图像块,用某种变换对子图像块进行变换,得到变换域中的系数矩阵,然后选用其中的主要系数进行量化和编码,图像显示时再经过逆变换即可重构原图像。

图3 变换编码原理框图

变换编码的方法有:K-L变换、离散傅里叶变换、离散余弦变换、离散沃尔什变换、离散哈达玛变换和小波变换等。

相比预测编码的消除时间冗余,变换编码消除了空间的冗余度[8]。

2.2.3统计编码

统计编码是根据消息出现概率分布的特性而进行的压缩编码。其宗旨在于,在消息和码字之间找到明确的一一对应关系,并将这种失真或不对应概率限制到可容忍的范围内,但无论何种途径,其总是要使平均码长或码率压低至最低限度[9]。

常用的编码有:Huffman编码、算术编码和Shannon-Famo码等。

3 视频图像压缩编码方法

本文的视频图像压缩方法采用的是帧预测、运动估计、运动补偿、DCT变换和可变长编码(VLC)的混合编码模式,编解码框图如图4所示。

图4 视频图像压缩编码方法

编码过程:(1)对录入视频图像进行预处理:分离视频信号与音频信号,将视频拆分成一帧一帧的图像,并将每幅图像的R、G、B分量提取出来;(2)将输入帧信号与预测帧信号之差作DCT变换,将其量化再反量化作IDCT缓存,作下一帧信号的预测帧时使用;(3)将量化后的作VLC编码(可变长编码)后输出压缩信号。

解码过程:利用VLC解码方法对压缩信号进行重构,经反量化和离散余弦逆变换(IDCT)后,先将其缓存作为下一帧图像的参考帧使用,然后将其与预测帧信号求和得到当前帧的视频图像。最后,将解压过的一帧帧图像用算法重建视频图像。

3.1帧预测

帧预测是利用相邻帧之间的相关性来对下一帧图像中同一个物体的位置进行估计,即运动估计,为对此物体的位置进行准确预测,还需要用到运动补偿算法。

3.1.1运动估计

视频图像两帧之间的物体运动是平移运动,位移量并不大,所以会以块作为单位分配运动矢量,在运动估计中采用了大量的参考帧预测来提高精度,当前的待编码块可在缓存内的所有重建帧中寻找最优的匹配块进行运动补偿,以便较好的去除时间域的冗余度。为每一个块寻求一个运动矢量,并进行运动补偿预测编码。

一般的运动估计方法如下:设t时刻的帧图像为当前帧f(x,y),t′时刻的帧图像为参考帧f′(x,y),参考帧在时间上可以超前或者滞后于当前帧,当t′t时,称之为前向运动估计。当在参考帧t′中搜索到当前帧t中的块的最佳匹配时,可得到相应的运动场d(x;t+tΔ) ,即可得到当前帧的运动矢量。

3.1.2运动补偿

运动补偿是一种描述相邻帧(相邻在这里表示在编码关系上相邻,在播放顺序上两帧未必相邻) 差别的方法,具体而言是描述前面一帧的每个小块怎样移动到当前帧中的某个位置去。即运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,其是减少帧序列冗余信息的有效方法,包括全局运动补偿和分块运动补偿两类[10]。

3.2DCT变换

DCT变换的全称是离散余弦变换(Discrete Cosine Transform),是指将一组光强数据转换成频率数据,以便得知强度变化的情形。

DCT变换压缩的特点是将从前密度均匀的信息分布变换为密度不同的信息分布。在图像中,低频部分的信息量要大于高频部分的信息量,尽管低频部分的数据量比高频部分的数据量要小的多。若对高频的数据做些修饰,再转回原来形式的数据时,显然与原始数据有差异,但人眼却不易辨认出来。压缩时,将原始图像数据分成8×8数据单元矩阵。

3.3可变长编码(VLC)

可变长编码(VLC)由行程编码和哈夫曼编码两部分构成,行程编码是对图像块按Zigzag方法扫描然后由行程+幅值构成,哈夫曼编码则对行程码作符号统计然后根据哈夫曼编码表对之编码[11]。

哈夫曼数据压缩步骤:(1)检查字符在数据中的出现频率;(2)构建哈夫曼树;(3)创建哈夫曼编码表;(4)生成压缩后结果,由一个文件头和压缩后的数据组成。

4 实验结果分析

在进行图像预处理时,需要将每一帧图像的R、G、B分量分别提取出来,图5所示为预处理对比图,图6为第2帧图像的预测图像,图7为解压后的重建图像,图8为重建彩色图像与原彩色图像对比图。

本文采用的视频图像压缩算法与DCT编码算法、Huffman编码算法的压缩比和峰值信噪比的比较结果如表2所示。

表2 压缩编码方法比较

图5 预处理对比图

图6 第二帧图像预测

图7 压缩前后对比图

图8 重建彩色图像与原彩色图像对比

从表2可看出,本文采用的混合编码算法的图像压缩比高于Huffman编码算法,又低于DCT编码算法;其峰值信噪比高于DCT编码算法和Huffman编码算法(峰值信噪比越大,表示前后两幅图像越相近)。因此,本文采用的视频图像压缩算法既有较好的图像压缩比,又有适当的峰值信噪比,满足了视频图像压缩编码的要求。

5 结束语

本文采用帧预测、运动估计、运动补偿、DCT变换和可变长编码(VLC)的混合编码模式来进行视频图像压缩,在物联网监测系统的视频传输过程中有效减少了传输时间,提高了传输效率,从而节约了传输带宽。相信随着信息技术的发展,能研究出更高效的针对视频图像压缩编码算法,更好地为物联网监测服务。

[1]张春红,裘晓峰,夏海轮,等.物联网技术与应用[M].北京:人民邮电出版社,2011.

[2]张强,王正林.精通Matlab图像处理[M].2版.北京:电子工业出版社,2012.

[3]Kalva H.The H.264 video coding stardard[J].IEEE Multimedia,2006,13(4): 86-90.

[4]路锦正.MPEG-4/H.264视频编解码工程实践[M].北京:电子工业出版社,2011.

[5]刘衍琦,詹福宇.Matlab图像与视频处理实用案例详解[M].北京:电子工业出版社,2015.

[6]许录平.数字图像处理[M].北京:科学出版社,2007.

[7]陈靖,刘京,曹喜信.深入理解视频编解码技术-基于H.264标准及参考模型[M].北京:北京航空航天大学出版社,2012.

[8]黄乐.基于轮廓提取的视频压缩与还原方法研究[D].西安:长安大学,2013.

[9]Zhu Shiping,Wang Zaikuo,Kamel Belloulata. A novel fractal monocular and stereo video codec based on MCP and DCP[C].Shanghai: IEEE International Conference on Industrial Technology,2010.

[10] Rafael C Gonzalez, Richard E Woods,Steven L Eddins.数字图像处理:Matlab版 [M].2版.北京:电子工业出版社,2013.

[11] 高文,赵德斌,马思伟.数字视频编码技术原理[M].北京:科学出版社,2010.

Video Image Compression for a Monitoring System in the Internet of Things

ZHANG Xiaxia, SUN Wanrong, CHENG Long, YUE Zhijia, LI Peijia

(School of Electronic Engineering, Xidian University, Xi’an 710071, China)

Video capture has become an important part in a monitoring system in the Internet of things. But video images require substantial storage space and communication bandwidth, which may cause great difficulties in transmission and storage, thus the need for video image compression. This paper discusses a video image compression method for a monitoring system in the Internet of Things, which combines the frame prediction, DCT transformation and variable length encoding to realize video encoding and decoding accordingly. Experimental results show that this method can effectively compress the video image and improve the transmission rate of the video images while reducing the transmission time.

video image compression; motion compensation; motion estimation; DCT transformation

2015- 11- 27

张霞霞(1991-),女,硕士研究生。研究方向:物联网监测系统中的视频图像压缩编码。孙万蓉(1960-), 女,教授。研究方向:数据采集与传输技术,图像信号处理。

10.16180/j.cnki.issn1007-7820.2016.09.028

TN919.85

A

1007-7820(2016)09-102-04

猜你喜欢

编码补偿联网
“身联网”等五则
《物联网技术》简介
《物联网技术》简介
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
无功补偿电容器的应用
Genome and healthcare
抢占物联网
解读补偿心理