基于运动估计的视频信息隐藏分析技术研究
2016-09-20许绘香
许绘香,赵 冰
(郑州工程技术学院 信息工程学院,郑州 450044)
基于运动估计的视频信息隐藏分析技术研究
许绘香,赵冰
(郑州工程技术学院 信息工程学院,郑州 450044)
本文提出了一个基于运动估计的视频信息隐藏分析方法:首先结合信号处理技术,通过求绝对差之和进行运动估计,创建一个新的视频信号再计算该信号和可疑媒体的差值,从而在时间域上增强隐藏信息的强度;然后采用基于渐近相对效率(ARE)的探测器,通过对差值进行计算,并和相应的阈值进行比较,最后对隐写信息进行判断。实验结果表明,该算法是对所要分析的高度相关的可疑数据是无记忆的和依赖的,对于大样本和微弱信号非常有效。
隐藏分析;视频;运动估计;渐近相对效率
近年来,随着信息产业的发展,互联网与多媒体技术逐步走进了千家万户,并且已经渗透到人们的学习、工作、生活中,对人们的生活、企业发展和社会进步产生巨大影响。但是人们在享受信息技术成果的同时,也开始担忧因互联网而带来的信息安全问题。信息隐藏技术作为网络安全领域的一个重要方面,设计数据隐藏、保密通信、密码学等相关学科,目前得到了广泛的研究与应用,但是由此所引发的信息安全和网络问题日趋严重。因此,信息隐藏分析已经成为信息安全等领域的研究重点。
1 视频信息隐藏和视频信息隐藏分析技术
视频信息隐藏是利用视频数据中普遍存在的冗余数据与随机性,把秘密信息嵌入到视频自身的数据中的一种技术,而视频信息隐藏分析则是用于探测秘密信息的存在性,估计嵌入信息长度,并试图反向提取嵌入的信息,进而采取措施阻断非法信息的传递。[1]
视频是由一系列的静止图像所组成,但是视频又不同于静止图像,因此不能直接用静止图像信息隐藏分析的方法解决视频隐藏检测问题。因为视频信息隐藏还具有以下特征:(1)隐藏容量大,因为视频信息本身的数据量比静止图像大很多,所以它的绝对隐藏容量很大,比如一副图像的信息隐藏量仅仅几千比特,但是一个DVD格式的视频文件却可以隐藏约10兆隐藏信息;(2)嵌入比率小,视频中嵌入的隐藏信息往往以极低的密度分散在较大的视频信息流中,嵌入比率相对较小;(3)依赖于视频编解码系统,很多视频隐写算法都很大程度上依赖于所采用的视频编码解码系统;(4)组成视频的一帧帧图像之间时间上是相关的。一般情况下,图像的隐写分析都是利用图像的空间域和变换域的特性进行分析,但是在视频中组成它的一帧帧图像间还具有较强的时间域相关性。基于以上分析,对于视频信息隐藏分析,既要充分利用静止图像隐藏分析算法已有的设计思想,同时还需要依据视频信息本身的特点来进行研究。[2]
因此本文依据视频信息的时域相关性提出了一个基于运动估计的视频信息隐藏检测算法,结合信号处理技术,通过运动插值创建一个新的视频信号,再计算该信号和可疑媒体的差值,在时间域上增强隐藏信息的强度,采用基于渐近相对效率(the Asymptotic Relative Efficiency ,ARE)的探测器[3]进行隐写信息的检测,具有较好的检测性能。
2 基于运动估计的视频信息隐藏分析算法
视频是由一帧帧图像组成,各图像之间具有时间相关性,这种相关性主要通过图像中物体的运动变化体现出来,所以在进行视频隐写检测时要结合视频信息所特有的“运动”时变性。[4]
基于运动估计的视频信息隐藏分析算法由两部分组成,如图1所示,信号处理阶段和检测阶段。第一个阶段为信号处理阶段,主要是对带有隐藏信息的媒体信号进行特征提取;第二阶段为检测阶段,对可疑序列潜在的隐藏内容做出准确地判断。
图1 隐写分析算法流程
2.1运动插值
第一阶段主要是通过对视频信号的运动矢量进行插值处理,以最大限度地发现可疑序列和估计序列之间的不同,使隐写检测更容易实现。借助于古典检测理论的形式化检测方法,首先对视频信号进行处理,对可疑信号的掩护媒体进行一个估计或统计相关联的指标,通过运动插值创建一个新的视频信号,再计算该信号和可疑媒体的差值,输入到第二阶段进行检测,此过程将显著增强隐藏信息的信号强度,从而很容易发现隐藏的信息。
运动估计和插值是视频修复中常用的一种技术。当一个帧的数据丢失或缺少时,可以根据周围帧的数据流对该帧进行数据修复,因为帧和帧之间的数据是高度相关的。假设Fn是视频流中的一个丢失的数据帧,需要进行差值修复。利用直接相邻的帧Fn-1和Fn+1重新构建了估计帧Fn#。需要说明的是,帧Fn没有参与帧Fn#的重建。也就是说如果Fn由于隐写被破坏但不会影响到Fn#。如果在帧中关联有隐藏数据,则将增加运动估计的难度,会导致可疑帧和估计帧的差别更大。理想情况下,二者的差别越大,越容易实现隐写分析。
算法采用求绝对差之和 (the Sum of Absolute Differences,SAD)的方法进行运动估计[11]。为了计算从帧Fn-1到Fn+1的运动矢量,绝对差和SAD方法假设每个像素大小为N×N,Fn-1中第k块值为Bn-1,k,为了最大限度地减少绝对差和,在Fn+1中确定最佳匹配的块Bn+1,k:
Bn+1,k=mini|Bn-1,k-Bn+1,i|
在PAL制式中一个视频序列每秒钟由25帧组成,在NTSC制式中一个视频序列每秒钟由30帧组成,假设Fn-1和Fn-1是距离很近,因此两个帧之间的位移很小。这样为了确定Bn+1,k,搜索区域可缩小到仅考虑Bn-1,k附近的坐标。
为简单起见,假设帧到帧之间的位移是线性的。因此利用插值求Fn#实质上等价于求出的运动矢量长度的一半。对可疑视频序列的每一帧反复执行这个算法,以产生新的估计序列,随后再将该序列从可疑信号序列中减掉。我们把数据的运动差值归结为以下几种情况,如表1所示。
表1 各种运动插值情况
在表1中,NC(Not Corrupted)表示该帧没有因嵌入数据而破坏,C(Corrupted)表示该帧有嵌入的数据。情况1表明Fn-1,Fn,Fn+1均不含水印,也就是说没有因植入数据而遭到破坏。进行运动插值时,估计帧Fn#也是无损的,因此,如果插值成功,Fn#和Fn的差别是很小的。第二种情况是:仅Fn含有水印,也就是说通过植入数据后对该帧内容有一定的破坏(Corrupted,简写为C),由Fn-1和Fn+1计算出的Fn#是没有破坏(NC)的,因此在Fn和Fn#之间就会有偏差。在后面的几种情况中,即使因数据的嵌入 和 内容有一定破坏(C),但它们之间也存在一个偏差,因为帧和帧间嵌入的信息是独立的。因此,除了第一种情况,理想情况下应存在一个可以测量的偏差:Fn-Fn#,这个值可以直接通过检测器进行检测。
2.2检测
检测机制通常用来探测是否存在以某种形式的附加噪声而存在的信号。检测的结果是根据以下两种假设进行决策:
其中Ni代表检测论中的经典概念“噪音”,也就是处理的视频;Si代表“信号”,也就是视频中嵌入的信息;θ代表嵌入信号的长度。
在算法中,将模型中要检测的“信号”和“噪音”均视为随机变量,因为掩护媒体中的水印必须是随机的,这样才能以确保其具有一个非平凡的有效载荷。算法采用基于渐近相对效率(ARE)的探测器,由于探测器需要通过算法设计进行实现,探测器是对所要分析的高度相关的可疑数据是无记忆的和依赖的,对于大样本和微弱信号非常有效。
2.2.1检测器计算
图2 检测阶段
一旦功效η取得最大值,这个检测器将成为最理想的具有依赖和无记忆的探测器。
An×1(i)=ai
在以上过程中,确定最佳系数ai虽然需要进行大量的计算,然而,这个计算仅需进行一次就够了,因为无论是何种可疑视频,其非线性序列g(x)是一样的,这就意味无论何种视频只需进行一次就算。例如,一个视频中每次测试5帧,仅需设置5个系数,这5个系数可以描述为:
{a0,a1,a2,a3,a4}={8.2643,0,-51.729,0,23.27}
2.2.2阈值的设定
从理论上讲,探测器的阈值T应该是一个常数,每个可疑的视频都被视为噪音的不同表现。实际上,视频的大小不同,内容不同,标准偏差及相关系数不同,这个阈值也应该是有区别的,因此需要设置一个自适应的阈值。另外,检测器分析的帧的数量不同,也将影响到阈值T的设置。基于以上因素,我们进行了初步测试,找出关于这四个参数的函数作为最佳阈值T:
T=
3 实验结果
实验选择了视频序列采用没有使用探测器和使用探测器两种情况进行隐写分析情况进行测试。测试结果显示,没有使用探测器时掩护视频和隐写视频的平均比为5,使用探测器后值为697,因此,使用探测器后,这个比值变大了,也就是说,探测器实际上放大了掩护视频和带有秘密信息的隐写视频的区别,使嵌入了隐写数据和没有进行隐写的数据序列之间的差别变大,这样更容易发现隐藏的信息。
为了测试探测器的阈值,选择了测试视频(有的含隐藏信息,有的不含隐藏信息),通过算法进行处理,先计算出运动矢量,再估算估计序列并经探测器检测,最后对潜在的隐写情况作出决定。测试样本由28个不同的灰度序列,每个序列25帧,检测器每次输入5帧进行处理。从28个原始的无损的序列中,新产生26个序列,各自用来处理从编号0到25的由于数据破坏而产生的差错帧。差错帧序列通过对每帧增加扩频水印来生成,因此测试中有28帧,故共用了728个序列。对于此测试的第一个系列,差错帧的水印使用75dB的高峰信号信噪比(PSNR)。检测器的接收者操作特征receiver operating characteristic(ROC)曲线如图3所示,图中变化的参数是阈值定义时的常数C。需要说明的是,和以前的视频隐写工作不同的是关于隐藏数据分布的假设不同。在以往方法中,水印信号被假设是零均值并且在每帧中都有该信号,目的是便于用帧平均法后减少嵌入的数据。然而,基于运动的视频分析方法即使只有少数帧被嵌入时也能找出隐写的信息。通过实验发现,越多的帧包含水印,越容易实现隐写分析。图3中,算法达到正样本正确预测率为60%,假阳性率false positive为10%。图4中显示的是另一个ROC曲线,序列中80%的帧均被污染,其正样本正确预测率提高到了70%,显示的隐写分析性能就比图3好一些,因此当污染帧的数量增加时,算法的隐写分析性能也随之提高。
为了测试算法对水印强度的检测性能,算法允许嵌入水印引起的失真,并通过测量峰值信噪比PSNR测量失真的程度。这个测试采用的是一个较小的样本序列,图5显示了峰值信噪比(PSNR)从60db到75db范围内变化时的接受者特征曲线(ROC)。结果表明,水印强度越大,隐写分析算法的性能越好。
图3 少量帧被嵌入的样本ROC曲线
图4 80%的帧被嵌入的样本ROC曲线
4 结论
本文提出了一个基于运动估计的视频信息隐藏分析方法。首先结合信号处理技术,使用运动估计算法通过信号处理在时间域上增强隐藏的信息;然后基于渐近相对效率(ARE)提出检测方法,在检测阶段掩护视频和水印均被视为随机变量,通过对运动插值阶段可疑视频和估计视频的差值进行计算,并和相应的阈值进行比较,最后对潜在的信息隐藏情况做出决定。实验结果表明,包含水印的帧越多,越容易实现隐写分析;水印强度越大,隐写分析算法的性能越好;算法对所要分析的高度相关的可疑数据是无记忆的和依赖的,对于大样本和微弱信号非常有效。
图5 不同峰值信噪比(PSNR)时的ROC曲线
[1]张文静,苏育挺.基于帧间预测的视频信息隐藏分析算法[D].天津:天津大学,2008.
[2]吴珊.基于运动矢量的视频信息隐藏算法分析[D].天津:天津大学,2008.
[3]Lehmann E L,Romano J P.Testing tatistical Hypotheses,3rd.Edition.Springer Texts in Statistics,2005:650-652.
[4]孙怡峰.基于运动估计的视频隐写检测算法[J].模式识别与人工智能,2010,23(6):759-766.
[5]郑鹏,刘敏忠.一种基于DCT 域的视频水印算法[J].武汉理工大学学报,2009,18(31):9-11.
(责任编辑赵冰)
Study on Digital Video Steganalysis Based on Motion Estimation
XU Hui-xiang,ZHAO Bing
(College of Information Engineering,Zhengzhou Institute of Technology,Zhengzhou 450044,China)
This paper proposes a method of video information hiding analysis based on motion estimation :first of all,combined with signal processing technology,by calculating the sum of absolute difference (SAD) in motion estimation,we create a new video signal to calculate the signal and suspicious media difference,so as to enhance the strength of hidden information in time domain; Then the algorithm employs a asymptotic relative efficiency (ARE) detector,which process the difference between the suspect-video and the estimated video from the motion interpolation phase,provides the necessary decisionmaking through comparing with a threshold.The experimental results show that the ARE detector is memoryless and dependent to account for the highly correlated suspect data,and it is very efficient for large sample and weak signal.
steganalysis;video;motion estimation;the asymptotic relative efficiency (ARE)
2016-05-21
河南省科技厅基础前沿项目(152300410170)
许绘香(1980—),女,河南郑州人,郑州工程技术学院信息工程学院副教授,主要研究方向为计算机应用、多媒体技术。
10.13783/j.cnki.cn41-1275/g4.2016.04.026
TP391
A
1008-3715(2016)04-0125-04