APP下载

采用量化离散余弦变换系数检测视频单帧连续多次复制粘贴篡改

2016-05-14林晶黄添强赖玥聪卢贺楠

计算机应用 2016年5期
关键词:特征向量阈值均值

林晶 黄添强 赖玥聪 卢贺楠

摘要:目前大多数时域视频帧复制粘贴篡改检测算法都是针对至少20帧以上的视频子序列的复制粘贴篡改,而对单帧复制粘贴篡改无法判断。而根据人眼视觉感知的特性,修改视频内容需要至少15帧以上的帧操作, 因此篡改帧想通过单帧复制粘贴篡改来达到想要的效果,必须进行连续多次粘贴操作。为了检测这种篡改方式,针对性地提出了一种基于量化离散余弦变换(DCT)系数的视频单帧连续多次复制粘贴篡改检测算法。首先,将视频转换为图像,采用量化后的DCT系数作为视频帧图像特征向量,并通过计算巴氏(Bhattacharyya)系数来衡量两相邻帧帧间相似度;再设定阈值来判断两相邻帧帧间相似度是否有异常,最后根据出现相似度异常的帧是否连续,以及连续出现的帧数来判断视频是否经过篡改,并定位篡改位置。实验结果表明,所提算法对不同场景的视频都能检测,不仅检测速度快,而且不受再压缩因素影响,算法的正确率高、漏检率低。

关键词:视频篡改检测;单帧复制粘贴;离散余弦变换;帧间相似度;Bhattacharyya系数

中图分类号:TP391 文献标志码:A

Abstract:Most existing detection algorithms of video frame copymove forgery in time domain were designed for the copymove forgery of video sequence containing 20 frames at least, and are difficult to detect single frame forgery. While according to the characteristics of human visual perception, 15 frames at least were needed to modify the video meaning. So when goal in vision was made by the tampering, continuous operation and many times were needed. In order to detect the tampering, a detection algorithm based on quantized Discrete Cosine Transform (DCT) coefficients for continuous and repeated single frame copymove forgery in videos was proposed. Firstly, the video was converted into images, and quantized DCT coefficients were taken as the feature vector of a frame image. Then, the similarity between frames was measured by calculating Bhattacharyya coefficient, and threshold was set to judge the abnormal similarity between two adjacent frames. Finally, whether the video was tampered and the tampered positions were determined by the continuity of frames with abnormal similarity and the number of continuous frames. The experimental results show that the proposed algorithm can detect the video with different scenarios, it possesses fast detection speed, and is not affected by further compression factors, but also is of high accuracy and low omission ratio.

Key words:video tampering detection; single frame copymove; Discrete Cosine Transform (DCT); intraframe similarity; Bhattacharyya coefficient

0 引言

近年来随着高质量低价格数码摄像机的普及和视频分享网站的流行,数字视频已经成为我们日常生活中的重要组成部分[1]。同时,随着多媒体技术的发展,视频编辑软件的不断更新,人们可以根据需要更加轻易地编辑视频,修改视频内容,达到更好的视觉效果。然而,技术进步方便人类的同时,也带来了不利影响。如果不法分子利用软件恶意篡改视频毁灭证据、修改视频内容,被恶意篡改的视频经过网络传播,在一定程度上会影响社会的稳定,因此,视频篡改检测技术的研究目前已是信息安全的一项重要课题[2]。

由于篡改形式的多种多样,国内外越来越多的学者针对不同篡改形式提出了不同的检测算法。Wang等[3]将图像双压缩篡改检测的方法延伸应用在视频上,提出通过计算MPEG(Moving Picture Experts Group)视频流中每个P帧的运动误差,观察误差的周期性变化来判断视频是否经过篡改。文献[4]提出了一种基于视频修复痕迹——“鬼影”的视频篡改检测算法,对于移除视频中目标运动物体的篡改,由于在篡改后需要采用修复技术对移除运动对象区域进行修复,而修复的结果通常会破坏视频运动轨迹连续性和一致性,通过检测视频遗留的修复痕迹判断视频是否经过篡改。复制粘贴类型的篡改方式是一种常见的视频篡改手段,可以分为:时域复制粘贴和空域复制粘贴。空域复制粘贴篡改,其实质和单幅图像的复制粘贴篡改类似,将视频帧内的区域对象复制到该帧的其他位置或复制到其他帧中以达到隐藏对象的篡改目的;而时域复制粘贴篡改则是以帧为单位的复制粘贴,使得视频中的部分场景被替换或隐藏[5-7]。时域复制粘贴篡改的方式通常是复制一段连续多帧的视频子序列到视频中。现有的研究针对这种篡改方式提出了检测方法。文献[8]利用时空相关性矩阵来检测复制粘贴视频,首先将视频帧序列分为重叠的多个短子序列,计算各个短子序列在时间上和空间上的相关性矩阵,然后利用相关性矩阵来检测。这种划分为子序列的方法使得算法对静止视频或运动相对缓慢的视频检测效果不佳。文献[9]提出了一种由粗到细的匹配方法来检测时间域上的复制粘贴篡改,将大小相等的子序列进行粗匹配,相似度大于阈值的序列作为候选片段,再对候选片段进行细匹配,但由于粗匹配得到的候选片段的精度不高,导致细匹配上的时间代价高。文献[10]提出了一种利用结构相似度来检测时间域上视频帧复制粘贴的篡改,算法将视频帧序列划分为多个重叠的子序列,利用结构相似性理论来度量视频帧间的相似性,最后通过时间域上子序列间的匹配策略寻找出存在复制关系的子序列对,合并子序列对并定位出视频中复制片段的具体位置。算法检测的原理是基于时间域上子序列间的匹配策略,对单帧模式的复制粘贴篡改失效。

目前已有的视频时域复制粘贴篡改检测算法适用于连续多帧的子序列复制粘贴篡改,对单帧复制粘贴篡改无法正确检测。然而视频帧在经过连续多次复制粘贴操作后也能够达到篡改视频内容的目的,改变视频原本传达的真实含义, 因此本文首次针对单帧模式的复制粘贴篡改提出检测算法,采用量化离散余弦变换(Discrete Cosine Transform, DCT)系数的方法检测与定位篡改位置,该方法不仅能准确地判断视频是否经过篡改,而且检测速度快,能够精确地定位篡改位置,算法检测的正确率高,漏检率低。

1 单帧连续多次复制粘贴篡改模式

视频单帧连续多次复制粘贴篡改是指用原始视频中的某一帧进行多次复制并连续粘贴插入到原始视频序列中或替换原始视频中的某些帧,使得原始视频中的部分场景被替换或被推迟/提前发生,同时又不影响视频的连续性。单帧篡改操作一次在视觉上对视频的影响非常小,可以忽略不计,因此单帧操作若想达到篡改目的,必须进行连续多次复制粘贴。这种篡改方式能够达到覆盖原始视频的部分场景,或延迟特定事件发生的目的,不仅能改变视频内容,而且用肉眼不能直接观察出。但目前已有的帧间复制粘贴篡改检测算法都是适用于连续多帧的视频子序列复制粘贴篡改,因此针对视频单帧连续多次复制粘贴篡改方式的检测是非常必要的。序列复制粘贴篡改过程与单帧连续多次复制粘贴篡改过程对比如图1~2所示,其中,视频序列复制粘贴篡改过程如图1所示。而本文算法检测的单帧多次复制粘贴篡改过程如图2所示。

2 篡改检测算法

从上面的篡改示意图可以看出视频单帧连续多次复制粘贴篡改后会使得视频增加一段静止画面的视频序列,那么真实的原始视频中原有的静止画面就会对检测篡改造成很大的干扰,难以用肉眼直接分辨静止画面视频序列的真实性。算法检测的目的在于判断视频是否经过篡改,并寻找篡改位置。由于篡改是以帧为单位的复制,对整个视频而言,篡改后得到的序列相邻帧帧间相似度会高于其他位置的帧间相似度, 因此本文通过检测是否出现帧间相似度相对高的序列来判定视频是否经过篡改。

2.1 算法流程

算法首先将视频转化为帧图像,提取各帧特征向量,本文采用图像DCT系数作为帧图像的特征向量,利用巴氏系数衡量特征向量间的相似度即帧间图像相似度。寻找相似度高于设定阈值的可疑帧,并排除可疑帧连续出现次数小的序列,初步定位可疑序列起始终止位置。为了避免原始视频中真实的静止画面对篡改检测流程的干扰,再次验证初步定位的可疑篡改序列的准确性,计算可疑序列的起始位置帧与结束位置帧的帧间相似度,进一步判断视频是否经过篡改,以及定位篡改位置。算法检测流程如图3所示。

当count大于一定阈值Tlength时,说明视频经过篡改,篡改序列位置位于start~ending;否则说明视频未经过篡改。在计算可疑帧连续出现的次数时,若中间出现1~2帧的非可疑篡改帧,忽略不计,这可以认为是篡改者为了隐藏篡改帧出现的连续性而故意插入的真实帧。

5)再次验证准确性。由上述步骤可以得到的start、ending分别为算法检测出的篡改起始与结束位置。由于视频的每帧图像会受光照强度等外在因素影响,即使在静止画面的真实视频中,两帧图像的帧间相似度也随着帧距的加大而降低。而篡改序列的每帧均是复制粘贴得来的,因此两帧图像帧间相似度不受距离远近影响,也就是篡改序列的首尾帧的帧间相似度应该仍然大于设定的相似度阈值。

6)输出结果。若算法检测结果满足式(6),则输出篡改序列start~ending;否则,视频未经过篡改。

2.2 算法时间复杂度分析

根据算法流程分析可知算法的时间消耗主要在以下步骤:1)提取各帧特征向量;2)计算相邻帧帧间相似度;3)定位篡改序列位置。假设视频长度为n帧,视频分辨率为M×N,图像分块大小为b,则子块数为K=M/b」N/b」,则各主要步骤的时间复杂度分别为:提取各帧特征向量的最大时间复杂度为O(Kn),计算相邻帧帧间相似度的最大时间复杂度为O(n),定位篡改序列位置的最大时间复杂度为O(n)。

3 实验分析

为了验证本文算法的有效性,实验视频采用Surrey University Library for Forensic Analysis (SULFA)[13]视频库以及自己拍摄的视频,拍摄设备型号为SONY CX700和Canon IXUS 220HS拍摄,分辨率为1920×1080、720×576和320×240三种,视频编辑篡改使用软件为Adobe Premiere Pro CS4。实验所用计算机配置Intel Core i53470 CPU 3.20GHz、4GB内存、Windows 7系统,利用MatlabR2012b实现算法。

3.1 阈值设定

3.1.1 相似度阈值

由于单帧连续多次复制粘贴篡改模式是以帧为单位的篡改,篡改位置相邻帧的帧间相似度会异常高于真实视频帧,所以本文实验采用整个视频的帧间相似度均值作为阈值。假设视频长度为n帧,BC=[b1,b2,…,bi,…,bn-1],i∈[1,n-1],其中bi表示第i与第i+1帧图像的相似度,则阈值为矩阵BC的均值,即Tsimilar=mean(BC)。相似度高于均值的帧是可疑帧,将可能属于篡改的视频帧初步筛选出。这种将待测视频的相邻帧帧间相似度均值作为阈值的方法的好处在于,使阈值的设定具有自适应性,与具体视频内容没有关系。虽然含有运动对象的视频相邻帧帧间相似度较低,无运动对象的视频或运动缓慢的视频,相邻帧的帧间相似度较高,但单帧连续多次复制粘贴篡改位置处的帧间相似度仍然高于均值。

为了相似度阈值设定的有效性,实验随机选取SULFA视频库5组视频进行单帧连续多次复制粘贴篡改。由于经过压缩的视频会直接影响帧间相似度,阈值的选择更加有说服力,因此实验将篡改后视频用不同压缩比压缩后,分别计算篡改后视频的相邻帧帧间相似度均值,以及视频篡改位置相邻帧间相似度均值,结果如表1所示,其中压缩比指压缩后的视频数据量与压缩前数据量之比。从表1的数据分析可以发现篡改位置的相邻帧间相似度基本高于实验设定的均值阈值,说明阈值设定方法有效,这种以视频相邻帧帧间相似度均值作为阈值的方法可以将篡改帧筛选出。

3.1.2 长度阈值Tlength

一般情况下,视频的帧率通常是20~30frame/s,单帧复制粘贴篡改模式要达到良好的视觉效果,需要至少15次以上的连续粘贴操作。为了排除视频中原本帧间相似度非常高的真实帧对检测算法的干扰,设定长度阈值Tlength=15,也就是篡改序列长度的限制,说明当可疑帧连续出现的次数计数结果大于15时,认为视频经过单帧连续多次复制粘贴篡改。实验结果表明,本文算法对不同帧率的视频都有很好的检测效果。

3.2 实验结果及分析

如图4为视频单帧连续多次复制粘贴篡改的一个示例,来源于自己拍摄的视频。其中,图4(a)是一个真实原始视频的5帧图像,实验复制了原始视频中还未出现小车的一帧图像,将第568~621帧图像替换,使得小车行驶的痕迹被抹掉,最后并以压缩比20%对篡改后视频进行压缩。图4(b)显示的是篡改后的对应帧图像。

本文算法采用量化DCT系数方法来提取每帧图像的特征向量,并提取每个图像分块8×8大小的系数特征,该方法能很好地表征图像信息,并且大大缩减了特征向量提取的时间,有利于提高算法检测效率。算法采用巴氏系数衡量帧间相似度,相似度高于均值的帧图像为可疑帧。图5(a)为图4原始视频帧间相似度图,图5(b)为篡改后帧间相似度图,其中纵坐标轴右侧刻度上圆圈位置处表示均值。从篡改前后帧间相似度的波动趋势分析可以看出,原始视频帧间相似度在均值上下波动,并且上下波动的帧号间隔非常小,对于篡改视频,在其篡改位置的相邻帧间相似度明显高于均值,而且这些帧是连续的。因此本文将相似度值高于均值的两个相邻帧判定为可疑帧,并根据可疑帧连续出现的次数来进一步判断视频的真实性,次数高于15,则认为该视频序列是经过单帧连续多次复制粘贴篡改的。

由于单帧连续多次复制粘贴篡改会得到静止画面的视频序列,因此无运动对象的原始视频对算法的干扰性比较强,实验采用的视频包括有运动目标和无运动目标两种。为了分析篡改时粘贴插入位置与原始帧距离远近的影响,分别在距离原始帧近处插入、远处插入、左右侧均插入,以及多处插入篡改,不同篡改位置分析算法的准确性,检测结果如表2所示。对无运动对象的视频与有运动对象的视频分别进行单帧连续多次复制粘贴篡改,检测结果如表3所示。现实生活中,视频通常要进行压缩处理,来减少对存储空间的需求,为了检验算法对压缩视频是否有效,进一步对不同压缩比的篡改视频进行检测,检测结果如表4所示。

实验将本文算法与文献[10]中算法进行比较,比较结果如表5所示。本文算法的准确率和召回率都比文献[10]高。文献[10]算法首先将视频分为重叠的子序列,根据结构相似性理论度量帧间相似度,这种方法会将复制粘贴后的篡改帧误认为是存在复制粘贴关系的互相匹配的原始帧和篡改帧,因此文献[10]的召回率低,同时在计算相邻帧结构相似度时受静止画面因素影响,正确率比较低。实验结果表明,连续多帧的视频子序列复制粘贴篡改检测算法是不适用于单帧模式的篡改,本文算法不受原始视频中的静止画面影响、不受原始帧与篡改帧距离影响,以及不受压缩比影响,能准确检测出视频中是否存在单帧复制粘贴篡改序列,并且能有效定位篡改序列位置,算法的检测速度非常快。

4 结语

本文的创新点在于首次针对性地提出了一种视频单帧连续多次复制粘贴篡改的检测算法,采用量化DCT系数的方法提取视频帧图像特征向量,通过计算两相邻帧图像特征向量的巴氏系数作为视频帧的帧间相似度,通过阈值设定来检测视频中的可疑帧;接着根据可疑帧连续出现的次数判断视频是否经过单帧复制粘贴篡改,定位篡改序列位置;最后检验篡改序列首尾帧帧间相似度是否满足阈值条件,进一步确认篡改位置。实验结果表明,本文算法的检测速度很快,这对视频应用非常有利,并且对于不同视频场景下或经过压缩的视频都能准确检测出视频是否经过单帧多次复制粘贴篡改,以及定位篡改序列位置。然而算法也存在一定的局限性,与大多数视频篡改检测算法的弊端相同,算法的适用性较弱,只能针对特定的篡改方式进行检测,多种篡改方式并存的检测方法将是以后工作的重点之处。

参考文献:

[1]陈威兵, 杨高波, 陈日超, 等. 数字视频真实性和来源的被动取证[J].通信学报, 2011,32(6): 177-183. (CHEN W B, YANG G B, CHEN R C, et al. Digital video passive forensics for its authenticity and source[J].Journal on Communications, 2011,32(6): 177-182.)

[2]周琳娜, 王东明. 数字图像取证技术[M]. 北京:北京邮电大学出版社, 2008: 1-2. (ZHOU L N, WANG D M. Digital Image Forensics[M]. Beijing: Beijing University of Posts and Telecommunications Press, 2008: 1-2.)

[3]WANG W, FARID H. Exposing digital forgeries in video by detecting double quantization[C]// Proceedings of the 11th ACM Workshop on Multimedia and Security. New York: ACM, 2009: 39-48.

[4]ZHANG J, SU Y, ZHANG M. Exposing digital video forgery by ghost shadow artifact[C]// Proceedings of the 1st ACM Workshop on Multimedia in Forensics. New York: ACM, 2009: 49-54.

[5]DELP E, MEMON N, WU M. Digital forensics[J]. IEEE Signal Processing Magazine, 2009, 26(2): 14-15.

[6]MILANI S, FONTANI M, BESTAGINI P, et al. An overview on video forensics [J]. APSIPA Transactions on Signal and Information Processing, 2012, 1(1): 1-18.

[7]DONG Q, YANG G, ZHU N. A MCEA based passive forensics scheme for detecting framebased video tampering[J]. Digital Investigation, 2012, 9(2):151-159.

[8]WANG W, FARID H. Exposing digital forgeries in video by detecting duplication[C]// Proceedings of the 9th ACM Workshop on Multimedia and Security. New York: ACM, 2007: 35-42.

[9]LIN GS, CHANG JF. Detection of frame duplication forgery in videos based on spatial and temporal analysis [J]. International Journal of Pattern Recognition and Artificial Intelligence, 2012, 26(7): 21250017.

[10]LI F, HUANG T. Video copymove forgery detection and localization based on structural similarity[C]// Proceedings of the 3rd International Conference on Multimedia Technology. Berlin: Springer, 2014: 63-76.

[11]ZHAO J, GUO J. Passive forensics for copymove image forgery using a method based on DCT and SVD [J]. Forensic Science International, 2013, 233(1): 158-166.

[12]CHOI E, LEE C. Feature extraction based on the Bhattacharyya distance[J]. Pattern Recognition, 2003, 36(8): 1703-1709.

[13]QADIR G, YAHAYA S, HO A T. Surrey University Library for Forensic Analysis (SULFA) of video content[C]// Proceedings of the 2012 IET Conference on Image Processing. London: IET Press, 2012: 1-6.

猜你喜欢

特征向量阈值均值
高中数学特征值和特征向量解题策略
非均匀光照下文本图像分割算法研究
特斯拉发布新功能 停电期间也可充电
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
三个高阶微分方程的解法研究
利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰
均值不等式的小应用
氨基酸序列特征向量提取方法的探讨
两种改进的局部阈值分割算法