鲁棒可区分的压缩视频感知哈希算法研究

2013-05-12文振焜高金花杜以华朱映映刘朋飞

深圳大学学报（理工版） 2013年2期

关键词：关键帧哈希误码率

文振焜，高金花，杜以华，朱映映，刘朋飞

1)深圳大学计算机与软件学院，深圳 518060;2)深圳信息职业技术学院机电工程学院，深圳 518172

鲁棒可区分的压缩视频感知哈希算法研究

文振焜1，高金花2，杜以华1，朱映映1，刘朋飞1

1)深圳大学计算机与软件学院，深圳 518060;2)深圳信息职业技术学院机电工程学院，深圳 518172

运用比较宏块互异数方法得到视频关键帧，提出基于Gabor小波分解的视频感知特征快速提取算法，针对小波分解后得到的特征矩阵，给出基于负熵目标函数的FastICA优化降维量化策略，并运用中位值量化方法得到哈希位串.采用标准格式视频验证的结果显示，该算法对亮度变化、噪音污染等常规内容操作具有良好的鲁棒性能，对感知内容不同的视频序列也有较好的区分性能.研究成果可为视频版权、视频安全和视频篡改检测提供理论支撑和技术支持.

视频处理;感知哈希;小波分析;独立分量分析量化;视频压缩;视频版权;视频安全;视觉感知;视频篡改检测与定位

感知哈希 (perceptual hashing)是指根据人类视觉理论，将多媒体数据集单向映射为感知摘要集的函数过程.其中，具有相同感知内容的多媒体资源可映射为相同或相似的数字摘要;具有不同感知内容的多媒体资源可映射为完全不同的数字摘要.感知哈希满足传统密码学的单向性和摘要性，还应具有鲁棒性、可区分性和安全性等特殊性质［1］.

当前视频感知哈希技术研究，主要集中在基于空域特征感知哈希和基于时空域联合特征感知哈希两方面.在前者中，Mucedero等［2］通过提取视频帧分块区域的方差矩阵作为该帧的感知特征，以方差矩阵中某一特定位置上是否存在最小值为依据来生成该视频帧的摘要哈希，最终把所有视频帧的哈希序列按时间重排序后作为整段视频的哈希标识;De Roover等［3］提出的算法首先从视频序列中进行关键帧抽取，与此同时组合各关键帧径向投影角度作为视频序列的感知特征向量，但该方法仅将特征向量作为算法输出结果，对于哈希量化的过程考虑不足.后者，Coskun等［4-5］通过预处理将视频序列标准化为灰度视频，根据时空域变换提取标准化视频感知特征，结合中位值量化策略得到摘要哈希;周学兵等［6］改进了 Oostveen等［7］提出的算法，在提取感知特征过程中加入线性相关分析过程，提升算法鲁棒性.针对当前算法中对于视觉感知因素的考虑不足，张慧等［8］提出基于人类视觉系统的感知哈希算法，Walk等［9］提出用颜色自相似特征来刻画局部块特征算法，Ying等［10］提出一种改进MHT算法，通过融合HSV-LBP外观和互斥惯量模型，构造HSV-LBP直方图的似然函数，从含糊不清的图像检测中挖掘更多感知信息.然而，由于目前对人眼视觉感知过程的理解仍不成熟，尚无相关数学模型能真正意义上描述人眼感知过程.本研究提出基于分块Gabor小波分析和独立分量分析 (independent component analysis，ICA)量化的压缩域视频感知哈希算法，且在深入分析算法鲁棒性与区分性的同时探讨其在视频认证和篡改检测中的应用.

1 压缩视频感知哈希算法

本算法在抽取压缩视频关键帧的基础上，利用分块Gabor小波分析提取感知特征，结合ICA算法和中位值量化策略得到视频整体感知哈希值，算法框架如图1.

图1 基于分块Gabor小波分析和ICA压缩视频感知哈希算法的框架图Fig.1 The framework of video perceptual hashing algorithm based on block-Gabor and ICA

1.1 压缩域视频预处理

基于比较宏块互异数算法，同时考虑压缩域视频帧中宏块预测和补偿信息［11］进行关键帧抽取，并对所得关键帧进行标准化处理:首先对关键帧统一灰度化;其次对关键帧重采样，标准化为W×H(W=H=32)大小格式.最终，预处理后的压缩域视频大小用W×H×k(k为关键帧数量)表示.

1.2 基于分块Gabor分析的感知特征提取

预处理所得压缩域视频关键帧序列是一个W×H×k的三维矩阵，首先对每个关键帧进行8×8的子块划分，然后针对每个子块进行2层Gabor小波分解，并把经过第2层Gabor分解后的4个LL2系数作为该块的感知特征，把每帧所有子块经2层Gabor小波分解得到的LL2系数作为该帧的感知特征(n×4的矩阵)，所有帧的特征矩阵形成压缩域视频序列的整体感知特征，表现为n×4×k的三维矩阵，执行过程如图2.

图2 基于2层Gabor分解的压缩域视频感知特征的提取Fig.2 Perceptual feature extraction of compressed video based on block-gabor

1.3 基于负熵目标函数的FastICA优化量化

ICA是一种对多变量数据的非正交线性变换方法.通过确定一个线性变换矩阵使得变换后的输出分量尽可能统计独立，从而减少信息冗余.

特征矩阵每一列表示视频序列第t帧各分块在第i个指标上的观测值.由于图像数据的上下文具有相关性，因此这些观测值之间在某种程度上存在信息冗余，采用FastICA处理可消除这些向量信息之间的相关性，使它们相互独立，减少信息冗余.

1.4 融合时-空域特征的压缩视频哈希位串

特征矩阵F1经FastICA处理，生成中间特征矩阵FM，然后将FM按行进行时域特征排序，形成新转置矩阵FF.以FF的列为单位进行中位值量化生成哈希序列，并以此作为整个压缩域视频的感知哈希位串，提取过程如图3.

图3 融合时间域特征生成的视频感知哈希Fig.3 Video perceptual hashing based on time-domain features

2 实验结果及分析

为验证算法的有效性，选择NIKE、BMW、Coca、Toyota四组压缩宣传短片，对算法的鲁棒性与可区分性进行评价.本研究采用哈希序列的误码率(bit error rate，BER)作为鲁棒性和区分性的实验分析要素.

2.1 鲁棒性分析

为验证算法鲁棒性，分别对4组压缩视频进行7种内容保持操作，所得视频之间的误码率统计结果如图4.由图4可见，本算法对亮度变化和噪声污染具有较好的鲁棒性.而对直方图处理、Laplace锐化和旋转操作，算法的平均误码率分别保持在20.43%、19.65%和 18.32%.算法的鲁棒性相对较弱，主要是因为直方图处理和Laplace锐化改变了视频帧的能量分布状态，视频帧的信息丢失过多，感知能力下降，但这符合人类视觉的感知理论;与此同时，旋转操作使得视频帧边缘成为黑色，边缘信息丢失严重，所以误码率较大.实验证明，本算法能将误码率保持在25%以下，具有良好的鲁棒性能.

图4 鲁棒性实验结果Fig.4 Robustness experimental results

文献［12］采用 PCA得到中间特征，而文献［13］利用计算较快的直方图抽取特征.对本算法、文献［12］和文献［13］的算法进行实验，结果表明本算法在特征提取与中间量化更占优势，如图5.

图5 鲁棒性对比试验结果Fig.5 Comparison of robustness experimental results

由图5可知，在6种内容保持操作处理中，本算法的误码率仅在有帧旋转时低于文献［13］，表明本算法的鲁棒性逊于文献［13］算法，但这也体现了算法对篡改具有较好的敏感性.与文献［12］相比，本算法对有噪音污染的误码率稍高，其余均小于文献［12］，因此在进行上述内容保持操作时，本算法的鲁棒性总体上要好于文献［12］.

2.2 可区分性分析

为验证本算法的可区分性，实验选择4组视频序列，每组包括原始压缩视频和其经过7种内容保持操作的视频数据，任选其中1组的1个视频与另外3组中的1个视频序列组成1对，然后计算误码率.随机选择200对进行验证，统计不同误码率出现次数，并以直方图形式呈现，结果如图6.

采用概率分析得出，不同内容视频序列之间的误码率均值应无限接近50%.由图6可知，本算法的误码率集中在 (0.45，0.54)区间，分布较均匀，误码率的峰值出现在0.49，而文献［13］误码率分布左边比右边稠密，峰值出现在0.485，可见本算法的可区分性优于文献［13］.

由鲁棒性和可区分性实验可知，本算法鲁棒性略逊于文献［13］，但算法的可区分性较文献［13］好，可见本算法使鲁棒性和可区分性达到更好的平衡，有利于对篡改操作的准确检测.

2.3 篡改检测分析

视频篡改分为时域篡改和空域篡改两类.前者指改变视频在时间轴上的播放序列，主要包括剪切、帧替换及插入新帧等操作;后者主要指在视频帧上添加logo及其他改变内容操作.

图6 可区分性对比实验结果Fig.6 Comparison of discrimination experimental results

由于篡改后视频内容发生变化，篡改视频与原始视频间的误码率均值应位于阈值γ范围内，鉴于本算法鲁棒性在25%以下，区分性接近50%，所以设定γ的取值范围在30%～35%.也就是说，若误码率在上述范围之内，便可初步认定该视频为篡改版本，体现了鲁棒性与区分性保持平衡的优点.

对实验所选的4组压缩域视频分别替换原始视频的第1、18、100和117帧.计算4个原始视频与其经篡改的视频间的哈希误码率，结果如图7.

由图7可见，对于帧的替换操作，平均误码率是33.13%，能有效检出帧替换时的篡改;对于时域上的剪切操作，误码率均值为31.48%，表明算法对剪切篡改操作也具有一定的敏感性.综上所述，本算法鲁棒性与区分性良好的平衡性能，使处于中间状态的篡改行为能够得到准确的认定与检测，算法能为视频认证与篡改检测提供理论参考和依据.

图7 时域视频帧篡改操作视频误码率Fig.7 The bit error rate of time-domain video tampering

结语

针对应用广泛的压缩域视频格式，提出一种鲁棒可区分的压缩视频感知哈希算法，实验结果显示算法对亮度改变、噪声污染等常规内容保持操作具有良好鲁棒性，同时对感知内容不同的压缩视频具有良好的可区分性.视频篡改比对实验结果显示，本算法对帧替换、剪切等篡改操作行为具有良好的检测能力.但该算法在视频时域特征的描述过程中显得力度不够，今后将重点研究时域特征变化对感知哈希值的影响，从而实现更加高效精准的视频技术应用.

/References:

［1］Niu Xiamu，Jiao Yuhua.An overview of perceptual hashing ［J］.Chinese Journal of Electronics，2008，36(7):1405-1411.(in Chinese)

牛夏牧，焦玉华.感知哈希综述［J］.电子学报，2008，36(7):1405-1411.

［2］Mucedero A，Lancini R，Mapelli F.A novel hashing algorithm for video sequences［C］//Proceedings of the 2004 International Conference on Image Processing.Singapore:IEEE Press，2004，4:2239-2242.

［3］De Roover C，De Vleeschouwer C，Lefebvre F，et al.Robust video hashing based on radial projections of key frames ［J］.IEEE Transactions on Signal Processing，2005，53(10):4020-4037.

［4］Coskun B，Sankur B，Memon N.Spatio-temporal transform based video hashing［J］.IEEE Transactions on Multimedia，2006，8(6):1190-1208.

［5］ Coskun B，Sankur B.Robust video hash extraction［C］//Proceedings of the 12th IEEE Signal Processing and Communications Applications Conference.Kusadasi(Turkey):IEEE Press，2004:2295-2298.

［6］Zhou Xuebing，Schmucker M，Brown C.Perceptual hashing of video content based on differential block similarity［C］ //2005 International Conference on Computational Intelligence and Security.Xi'an(China):IEEE Press，2005，3802:80-85.

［7］Oostveen J C，Kalker T，Haitsma J.Visual hashing of digital video:applications and techniques［C］ //Proceedings of SPIE:Applications of Digital Image Processing XXIV.San Diego(USA):SPIE Press，2001，4472:121-131.

［8］Zhang Hui，Zhang Haibin，Li Qiong.Image perceptual hash based on human visual system ［J］.Chinese Journal of Electronics，2008，36(12A):30-34.(in Chinese)

张慧，张海滨，李琼.基于人类视觉系统的图像感知哈希算法［J］.电子学报，2008，36(12A):30-34.

［9］Walk S，Majer N，Schindler K，et al.New features and insights for pedestrian detection［C］//IEEE Conference on Computer Vision and Pattern Recognition(CVPR).San Francisco(USA):IEEE Press，2010:1030-1037.

［10］Ying Long，Xu Changsheng，Guo Wen.extended MHT algorithm for multiple object tracking［C］//ICIMCS'12 Proceedings of the 4th International Conference on Internet Multimedia Computing and Service.New York:ACM，2012:75-79.

［11］Pu Yungong.Research on the Algorithm for Video Key Frame Extraction in Compressed Domain［D］.Beijing:Beijing Jiaotong University，2009.(in Chinese)

普云功.基于压缩域的视频关键帧提取算法研究［D］.北京:北京交通大学，2009.

［12］Wen Zhenkun，Zhu Weizong，Ouyang Jie.A robust and discriminative video perceptual hash algorithm ［C］//The 18th China Conference on Multimedia.Xi'an(China):Tsinghua University Press，2009:38-43.(in Chinese)

文振焜，朱为总，欧阳杰.一种鲁棒可区分的视频感知哈希算法［C］//第18届全国多媒体学术会议论文集.西安 (中国):清华大学出版社，2009:38-43.

［13］ Hamon K，Schmuker M，Zhou Xuebing.Histogrambased perceptual hashing for minimally changing video sequence［C］//The 2nd IEEE International Conference on Automated Production of Cross Media Content for Multi-ChannelDistribution.Darmstadt(Germany):IEEE Press，2006:236-241.

2011-06-27;Revised:2012-10-17;

2013-02-28

Robust and discriminative perceptual hash algorithm in compressed video

Wen Zhenkun1†，Gao Jinhua2，Du Yihua1，Zhu Yingying1，and Liu Pengfei1

1)College of Computer Science and Software，Shenzhen University，Shenzhen 518060，P.R.China
2)School of Mechanical and Electronic Engineering，Shenzhen Institute of Information Technology，Shenzhen 518172，P.R.China

The method of comparing the different number of macro-block to get the video key frame was applied and a fast video perception features extraction algorithm based on Gabor wavelet decomposition was proposed in this paper.On account of the feature matrix resulting from wavelet decomposition，we propound the quantitative policy FastlCA，based on the objective function of negative entropy，to optimize dimension reduction.At last，we get the Hash bunch from the method of the medium value quantization.According the standard format video validation，we can conclude that the algorithm have a good Robust performance on the normal operation of the changes of lightness，noise pollution，etc.It also has a good distinguishable performance on perceiving the list in videos that have different contents.The result of the research can provide technical support in the area of video copyright，video security，tamper detection of video，etc.

video processing;perception hash;wavelet analysis;independent component analysis quantization;video compression;video copyright;video security;visual perception;video tamper detection and location

TN 911.73

10.3724/SP.J.1249.2013.02157

Foundation:National Natural Science Foundation of China(61170326);Shenzhen Science and Technology Research Foundation for Basic Project(JC201005250052A)

†

Professor Wen Zhenkun.E-mail:wenzk@szu.edu.cn

:Wen Zhenkun，Gao Jinhua，Du Yihua，et al.Robust and discriminative perceptual hash algorithm in compressed video［J］.Journal of Shenzhen University Science and Engineering，2013，30(2):157-161.(in Chinese)

国家自然科学基金资助项目 (61170326);深圳市科技基础研究基金资助项目 (JC201005250052A)

文振焜 (1962-)，男 (汉族)，广东省信宜市人，深圳大学教授.E-mail:wenzk@szu.edu.cn

引文:文振焜，高金花，杜以华，等.鲁棒可区分的压缩视频感知哈希算法研究［J］.深圳大学学报理工版，2013，30(2):157-161.

【中文责编:英子;英文责编:雨辰】