数字稳像系统运动估计算法的研究

2017-11-22邱庆顺

科教导刊·电子版 2017年28期

邱庆顺

摘要运动矢量估计技术的研究总是围绕着解决计算复杂度和检测精度这对矛盾进行的。运动矢量估计的算法主要有灰度投影法、特征匹配法、光流法、块匹配法等，应该根据实际需要合理选择运动估计算法。本文先介绍了数字稳像系统中的运动估计原理，然后介绍了两类运动估计，即平移运动估计和旋转运动估计，然后再介绍运动估计中遇到的各种问题，最后介绍了块匹配法。

关键词运动估计算法块匹配法

中图分类号：TP391.4 文献标识码：A

0前言

视频图像序列的相邻帧间存在很大的时间冗余，对视频序列进行压缩时，采用各种运动估计算法，可以大幅度提高视频编码的效率。块匹配法因其简单有效，在视频编码中得到广泛应用。块匹配运动估计法是基于块内各像素运动一致性的假设基础上的。

1块匹配运动估计原理

块匹配法的原理为：将图像的当前帧划分为固定大小（M€譔像素）的图像子块，一般是16€？6或者8€？像素，并假定位于同一图像子块内的所有像素具有相同的位移，然后对当前帧中的每一块，在上一帧的一定范围内（搜索窗口），根据一定的匹配准则找出最优匹配块（预测块），并认为该块就是从上一帧最优匹配块位置处平移过来的，所得运动位移即为当前块的运动矢量。设可能的最大位移矢量为（dx，dy），则搜索范围为（M+2dx）€？N+2dy），为了方便算法的实现，子块的M和N 取值一般相等，dx和dy也取相等。预测块和当前块逐像素的差值组成残差块，预测块与当前块之间通过匹配准则函数得到的值称为块匹配误差。

块运动模型分为块平移模型和可变形块模型两种，块平移模型假定每个块只做二维平移运动。给定两帧视频图像 1（x）和 2（x），对于 1（x）中的一个块，可由 2（x）中一个同样大小的块重建，即 1（x）|x∈ = 2（x+d）

其中，d是两个块的空间距离。块重建的过程称为运动补偿。 2（x）中的块可以是重叠或者非重叠的。对于非重叠块，每个块估计一个运动矢量，进行运动补偿；对于重叠块，重叠部分像素的运动矢量可以由两个块的平移矢量求平均得到，也可选择其中匹配程度较好的运动矢量。

2块匹配运动估计技术指标

块匹配运动估计的效率主要体现在图像质量、压缩码率、搜索速度三方面。运动估计越准确，预测补偿的图像质量就越高，补偿的残差就越小，补偿编码所需位数越少，比特率越小；运动估计速度越快，越有利于实时应用。提高图像质量，加快估计速度，减少比特率是块匹配运动估计的目标。块运动估计可以从以下四个方面进行研究：块形状与大小，块匹配准则，初始搜索点的选择，搜索策略。

2.1块的形状与大小

块匹配方法隐含着如下假设：同一块内像素的运动是一致的。显然该假设具有一定的片面性，但选择合适的块形状与大小可在一定程度上消除这种片面性。一般来说，块形状选用正方形是比较自然的选择，这样既便于图像的划分，又有利于块匹配准则函数的计算。但这并不一定是最佳选择，有的算法采用了其他形状，如三角形等。块大小的选择受两个矛盾的约束。块大时，块内各个像素做相等平移运动的假设不合理；快越小，编码一帧图像所需要的运动估计次数越多，因而需要存储和传输的运动矢量数也越多，可能降低编码效率。因此，要综合考虑多种因素，选择合适的块大小。作为折中，通常选择的宏块作为单位。

2.2块匹配准则

块匹配准则是判断块相似程度的依据，因此匹配准则的好坏直接影响了運动估计的精度；另一方面，匹配运算复杂度、数据读取复杂度在很大程度上取决于所采用的块匹配准则。因此，提高运动估计算法的速度可以用两种途径：一种是减少搜索匹配的点数，另外一种是降低块匹配准则的计算复杂度。运动估计算法中常用的匹配准则有以下三种：

（1）平均绝对误差（Mean absolute difference criterion，MAD）：

MAD准则实现简单、方便，所以使用最多，还可以将MAD简化为SAD（Sum of Absolute Difference），即求和绝对误差，可以去掉不必要的运算。SAD定义为：

（2）均方误差（Mean square error，MSE）

（3）归一化互相关函数：

2.3初始搜索点的选择

一种是直接选择参考帧对应的（0，0）位置，这种方法简单，但容易陷入局部最优。如果采用的算法初始步长太大，而原点又不是最优点，有可能使快速搜索跳出离原点周围可能性比较大的区域而去搜索远距离的点，导致搜索方向的不确定性，故有可能陷入局部最优。另一种是选择预测的起点。由于运动物体的整体相关性和视频运动的连续性，因此视频序列图像的运动必然具有时间和空间上的相关性。许多算法都利用这种相关性先对初始搜索点进行预测，以预测点作为搜索起点。大量的实验证明，预测点更加靠近最优匹配点，即加强了运动矢量中心偏置分布，使得搜索次数减少。

2.4算法的评价指标

匹配效果：峰值信噪比： PSNR=10log10（2552/MSE）

搜索时间：由于搜索时间受运动平台及其他因素的影响，目前常见的还是比较搜索点数即搜索过程中进行匹配的次数。对于块匹配运动估计，计算复杂度主要依赖于平均搜索点数。

3结语

运动估计算法的优劣，主要取决于匹配效果和搜索时间。匹配效果可以通过人眼进行主观评价，但这具有较大的随意性，且不易进行定量的比较。一般选择平均峰值性噪比（PSNR）或者平均MSE进行评价。

参考文献

[1] 朱娟娟.电子稳像理论及其应用研究[D].四川：电子科技大学，2009.

[2] 黎洪松.数字视频处理[M].北京：北京邮电大学出版社，2006.

[3] 杨军.基于块匹配的视频图像运动估计技术研究[D].湖南：湖南大学，2007.

[4] 钱捷.数字视频的稳像软件设计[D].四川：电子科技大学，2011.endprint