基于云水印的视频内容认证技术*
2009-05-08梁长垠牛夏牧
梁长垠 ,李 昂,牛夏牧
(1. 深圳职业技术学院 电子与信息工程学院,广东 深圳 518055;2. 哈尔滨工业大学 深圳研究生院,广东 深圳518055)
随着近年来网络多媒体技术的飞速发展,数字视频在网络中传播的越来越广泛,相应地,视频数据遭受恶意篡改所造成的社会危害也越来越大。基于此,作为保证视频内容完整性和真实性的视频内容认证技术成为近来研究和应用的热点。而半脆弱性数字水印技术因其具有隐蔽性好、对失真具有一定容忍度、不需要额外保存认证信息、具有篡改定位能力等优良特性,在多媒体信息的内容认证方面具有很好的应用前景。
目前,文献[1]结合LSB脆弱水印算法和基于扩频的视频鲁棒水印算法,设计了针对MPEG视频认证的半脆弱水印系统,该水印系统能够抵抗码率转换等内容保持类操作,但水印生成时计算复杂,实时性差。文献[2]提出了一种自恢复认证的视频水印算法,该算法利用修改VLC(Variable length coding)参数在压缩视频码流中嵌入水印,将后一个图像组(GOPi+1)的主要特征值压缩后嵌入当前图像组(GOPi)中。这虽然能够对图像的一般修改进行认证与恢复,但不能抵制转码、加噪等内容保持类的操作。文献[3]提出了一种基于内容特征的可配置视频认证方案,该方案虽然可以通过参数调节的方式实现系统鲁棒性与安全性之间的较好平衡,但同样对改变视频结构的内容保持类操作敏感。本文将结合视频内容的特点,应用镜头分割技术对视频进行不变特征提取,提出一种基于云水印的视频水印认证方案[4-5]。
1 水印算法设计
为了区别恶意篡改与正常的视频处理过程,本文设计了一种基于云水印的视频认证技术。该技术基本思想是:压缩的视频码流首先通过部分解码以得到DCT系数,嵌入水印后再重新编码。然后通过对接收视频中提取的水印信息与重构的特征信息进行比较,以实现对时域及空域恶意篡改的检测。
1.1 不变特征提取
在图像认证方面,已经有各种各样从图像中提取不变特征量的鲁棒哈希算法被提出[6-7]。而将这些算法扩展到视频认证中时却存在着一些问题。由于视频通常是由大量的图像帧构成,复杂的图像特征提取算法会导致水印嵌入耗时过长,不能满足视频认证的实时性要求。并且这些视频帧的特征量之间也缺乏联系,对时域上的篡改检测无能为力。考虑到在绝大多数的视频序列中,一个镜头内连续的图像帧在视觉上都是十分相似的特点,本文将待认证的视频进行镜头分割[8-9],以镜头为单位提取不变特征量。镜头分割方法的主要差别在于帧与帧之间的比较方法不同。首先,从视频帧中提取某种特征来衡量帧间内容的变化,例如颜色、形状、纹理等特征都可以用来作为对视频帧的描述;然后,根据某种标准来度量帧间内容的差别,这种差别就是计算出来的帧间不连续值Z(k,k+1),其中k≧1,最后经过阈值判决,不连续值大于某一预先设定的阈值,则认为帧k与k+1形成了边界,否则两帧在同一镜头内。
对MPEG-2压缩的视频来说,一方面由于中、低频DCT系数集中了图像帧的绝大部分能量,较好地反映了视频的内容变化;另一方面,中、低频系数在重压缩等合法操作的过程中相对稳定,而对视频帧内容上的篡改敏感[10]。因此利用视频帧亮度块内中、低频DCT系数的能量分布作为镜头分割的依据及内容特征,是一个便捷且恰当的选择。
设一个视频帧中有m个宏块,每个宏块包含4个亮度块,每个亮度块都由64个DCT系数组成。基于DCT系数能量的镜头分割方法可分为以下三个步骤:
(3)将距离d(k,k+1)与一个阈值Ts进行比较,如果d(k,k+1)>Ts,则第k帧为一个镜头的边界,阈值Ts的选取可参考文献[11]。
将这个能量序列归一化为一个二值形式,得到镜头S的特征向量F:
特征量F很好地反映了镜头S内所有I帧图像的能量分布情况。这里也可以引入其它一些复杂的图像特征提取技术,以期进一步地提高认证水印的篡改检测能力。
1.2 云水印的生成
为增加安全性,可用密钥K将特征量F置乱并进一步做适当的调制,产生m位的水印信息W{w1,w2, …wn},其中wi是特征位F(i)经扩频后得到的m/n位伪随机序列。根据云模型及视频序列的特性,通过扩展云发生器[4-5]生成嵌入到镜头S中的云水印信息。
以水印信息集合W{w1,w2, …wn}为期望值,选择适当的En和He,可以产生一系列相似但不同的水印云滴的集合{D1,D2,…,Dt},其中Di=W’,t为镜头S包含的视频帧总数。具体的实现过程如下:
(1)以En为期望,He2为方差,生成一个随机熵En’;
(2)以集合W中的元素wi为期望,En’2为方差,生成一个随机量wi’;
(3)遍历W中的所有元素,产生一个水印云滴Di=W’{w1’,w2’…wn’};
(4)重复步骤(1)~(3)直至产生t个云滴。
1.3 水印的嵌入和提取
镜头S对应的t个水印云滴将被逐一嵌回到该镜头所有帧内,每帧图像将嵌入一个云滴。水印的嵌入方法则是通过调整宏块内的能量分布,将水印嵌入在DCT系数的亮度块中,每个宏块嵌入一个水印信息bit位。其中设定的能量阈值TE可用来提高水印的鲁棒性,实际应用中可以根据具体需要调整TE的大小,TE大,则鲁棒性好,图像视觉效果会相对降低一些;TE小,则鲁棒性就差一些。具体嵌入方案如下:
(2)当嵌入的水印信息为0时,将块B1、B2的DCT高频系数清零并与块B0、B3交换部分中频系数,直至(EB0+EB3)-(EB1+EB2)≧TE;
(3)当嵌入的水印信息为1时,将块B0、B3的DCT高频系数清零并与块B1、B2交换部分中频系数,直至(EB1+EB2)-(EB0+EB3) ≧TE;
通过这个阈值的设定,可以保证宏块内两部分的能量差值始终不小于TE,确保了水印对于常规视频处理的鲁棒性。
水印的提取是嵌入的逆过程,分别计算接收视频每个宏块内四个亮度块的能量。若EB0+EB3≧EB1+EB2,则提取水印位“0”,若EB0+EB3﹤EB1+EB2,则提取水印位“1”。
1.4 认证及篡改检测
通过重构视频的内容特征并与从视频中提取出的水印信息进行比较,可以实现对接收视频的空域及时域恶意篡改进行认证和检测定位。
首先将接收视频以同样方法重新分割为一系列的镜头,从镜头S’内提取出t’个水印云滴,利用逆向云发生器得到水印信息W’{w’1,w’2, …w’n}[4-5]。对镜头S’的内容特征进行重构得到向量F’,以相同的密钥K及伪随机序列置乱和调制后生成m位重构特征信息Z{z1,z2, …zn}。分别计算伪随机序列w’i与zi之间的相关性,可实现定位精度为m/n个宏块的空域篡改检测。
时域上的篡改包括帧的剪切、插入及位置互换等,这些攻击都会导致镜头内有效水印云滴样本的减少,使恢复的水印信息W’与原始水印信息W之间存在的误差增大。以重构特征信息Z{z1,z2, …zn}代替W,并忽略已检测到空域篡改的图像区域,对W’ {w’1,w’2, …w’n}及Z{z1,z2, …zn}的其余n’部分计算其平均距离:
∑|w'i-z'i|
若d>T,则可判断镜头S内遭到了时域上的篡改。
在镜头层次上的时域篡改检测是通过对不同的镜头改变置乱密钥来实现的,所有的密钥均由一个状态机密钥发生器产生[12]。在不知道密钥K的情况下进行水印的嵌入是几乎不可能的,而即使知道了当前镜头所用的密钥,也不能为其它镜头的密钥破解提供任何信息,因此这种密钥转换的机制也进一步确保了认证水印方案的安全性。
2 实验结果及分析
为验证上一节中算法的可行性和有效性,下面采用MPEG-2标准视频测试序列Table-Tennis进行实验,并从对常规处理的鲁棒性、篡改检测能力等方面进行测试及讨论,测试视频的主要参数,视频大小为704×480;GOP帧数为12;I/P帧间距为3;色差格式为4∶2∶0;帧率为25 fps;帧数为679。
2.1 常规处理后水印检测结果
视频文件由于其数据量极大,并且与图像相比有较大的冗余,因此在存储和传输的过程中通常要对其进行一些例如压缩码率转换、比例缩放、图像滤波等。其中,尤以不同码率的转换最为常见,包括适当去除视频序列的B帧或P帧、丢弃高频DCT系数、 重新量化、将压缩视频转化为非压缩比特流后重编码。因此,视频认证水印对于常规处理,必须具有一定的鲁棒性。本文对算法在视频压缩重编码、码率转换、帧率转换后的鲁棒性进行了测试,如表1所示为25帧/s与20帧/s时的误码率。从中可以看出,平均每帧的误码率一般不超过0.7 bit。当对视频进行篡改时,某帧或某些帧的误码率会很大。所以很小的误码率不影响对视频认证的效果。
表1 误码率
2.2 时域篡改攻击认证结果
为了评价认证方案对时域篡改检测能力,本文共设计了如表2所示的3组实验。从其中时域认证结果可以看出,视频图像空域的内容篡改对时域的检测影响很大,原因在于对图像内容的篡改会使可用于时域检测的水印信息部分减少,计算误差增大。这会降低检测的正确率,同时会产生虚警,虚警率随着单帧篡改程度的加深和篡改帧数量的提高而变大。总体来说,本文提出的视频认证方案对时域上的篡改均有较好的检测效果。
2.3 空域篡改攻击认证结果
本文算法是对视频内容进行保护,实验结果如图1所示。从实验中可以看出,本文的认证水印方案可以检测出对视频图像的篡改,包括替换视频中的某个对象和在视频中删除或添加某个对象。通过本文提出的算法进行检测,可以比较精确地定位篡改位置(如图1(c)中认证图像的黑块部分所示)。
表2 时域认证结果
图1 Table-Tennis视频序列攻击后的检测结果
3 结 论
本文在视频镜头分割技术的基础上,提出了一种基于镜头的特征提取和云水印的视频内容认证方案,该方案可实现针对MPEG压缩视频进行内容篡改的检测及定位。通过对视频镜头进行特征提取,大大缩短了水印的嵌入时间,提高了认证算法的实时性。利用有效水印云滴样本数量与还原误差之间的关系,检测视频内容在时域上遭受篡改的程度。基于能量分布的重构特征量与还原水印信息的相关性检测,能够对空域的篡改进行有效的定位。
参考文献:
[1] PENG Yinyu, HEATHER Hong. A semi-fragile watermarking system for MPEG video authentication[J]. ICASSP, IEEE International Conference on Acoustics, Speech and Signal Processing, 2002,4(5):3461-3464.
[2] CROSS Daniel, MOBASSERI Bijan. Watermarking for self-authentication of compressed video[C]. IEEE International Conference on Image Processing Rochester, New York, 2002,3(9):913-916.
[3] SUN Q, HE D, TIAN Q A. Secure and robust authentication scheme for video transcoding[J]. IEEE Transactions on Circuits and Systems for Video Technology, 2006,16(10):1232-1244.
[4] 李德毅, 刘常昱, 杜鹢, 等. 不确定性人工智能[J]. 软件学报, 2004,15(11):1583-1594.
LI Deyi, LIU Changyu, DU Yi, et al. Artifical intelligence with uncertainty[J]. Journal of Software, 2004,15(11):1583-1594.
[5] 李德毅, 杜鹢. 不确定性人工智能[M]. 北京: 国防工业出版社, 2005.
[6] YANG B, GU F, NIU X. Block mean value based image perceptual hashing[C]. International Conference on Intelligent Information Hiding and Multimedia Signal Processing, 2006:167-172.
[7] SWAMINATHAN A, MAO Y, WU M. Robust and secure image hashing[J]. IEEE Transactions on Information Forensics and Security, 2006,1(2):215-230.
[8] 章毓晋. 基于内容的视觉信息检索[M].北京: 科学出版社, 2003:13-17.
[9] 李国辉. 基于内容的多媒体信息检索模型和方法研究[D]. 长沙: 国防科学技术大学, 2001:10-30.
[10] MOBASSERI B G, EVANS A T. Content-dependent video authentication by self-watermarking in color space[C]. SPIE Security and Watermarking of Multimedia Contents III, San Jose, 2001,4314(1):21-26.
[11] ROOVER C D, VLEESCHOUWER C D, LEFEBVRE F, et al. Robust video hashing based on radial projections of key frames[J]. IEEE Transactions on Signal Processing, 2005,53(10):4020-4037.
[12] LIN E T, DELP E J. Temporal synchronization in video watermarking[J]. IEEE Transactions on Signal Processing, 2004,52(10):3007-3022.