基于YouTube的视频源鉴别
2012-09-13荷兰亚尼克斯凯林范德列里芝诺胡拉茨马塞尔瓦林
[荷兰]亚尼克·斯凯林,尤·范德列里,芝诺·胡拉茨,马塞尔·瓦林
(阿姆斯特丹大学 系统和网络工程,荷兰 海牙)
基于YouTube的视频源鉴别
[荷兰]亚尼克·斯凯林,尤·范德列里,芝诺·胡拉茨,马塞尔·瓦林
(阿姆斯特丹大学 系统和网络工程,荷兰 海牙)
卢启萌译 施少培校
在一定条件下,传感器的光电响应非均匀(PRNU)特性能够作为拍摄器材的特异性指标,用于视频图像的来源鉴别。本文利用Lukáš等[1]定义的小波滤波器提取经过AVC方式重新编码的视频文件中的光电响应非均匀特性模式,研究调节分辨率和编码参数对拍摄器材的光电响应非均匀性模式的影响,发现部分经过重新编码的视频仍能够通过光电响应非均匀特性进行拍摄器材的鉴别。
光电响应非均匀特性模式;视频来源;重新编码;小波滤波器
1 前言
从鉴定角度而言,视频拍摄相机的鉴别是个十分有趣的问题。例如,在猥亵儿童案件中,鉴定人员往往需要判断扣押的相机是否与归罪的视频资料库中的图片或视频相关。
随着YouTube和Vimeo等视频上传服务网站的发展,视频分享变得越来越流行。视频服务提供商为了维持海量数据,在每个视频上传后会对其重新编码(压缩),以减小文件大小,加快媒体流速,减少带宽使用。重新编码将会改变视频,从而增加了视频来源鉴别的难度,使其成为一项十分具有挑战性的任务。
大部分相机在拍摄的视频文件中存储有相机序列号等元数据,较新型的相机甚至还存储有GPS坐标,但是这些元数据很容易被删除。然而,我们仍然可以通过其他角度对视频来源进行鉴别,如拍摄时相机附加的“噪声”。这类噪声一般不容易识别,但它作为相机的“标签”或“印记”存在于拍摄的输出中。相机处理信号时,有许多因素会导致噪声,如传感器有坏点形成的固定模式噪声(FPN),但更为普遍的来源是光电响应非均匀特性(PRNU)。光电响应非均匀特性是由拍摄相机的传感器引入[2-3],总是存在于其输出中。每个传感器的光电响应非均匀特性已被证明具有特异性[4],这使得它成为理想的视频来源鉴别指标。
因为光电响应非均匀模式存在于图像本身,所以当对图像进行压缩时这种模式的质量将会降低。在撰写本文时,应用最广泛的视频编解码器是AVC(H.264/MPEG-4),其对光电响应非均匀特性的影响尚未有过研究。该领域最近的成果是2008年van Houten等[5]针对由XviD及Windows Media9编解码器处理的低分辨率视频的研究,我们将拓展这项研究,探索经AVC(H.264/MPEG-4)方式重新编码后,是否仍能够通过光电响应非均匀特性对拍摄相机进行鉴别。
2 原理
由于视频可视为由一系列图像组成,本部分将从静态图像而非视频角度阐述视频源的鉴别原理。
2.1 光电响应非均匀特性
当鉴定人员尝试判断一幅图像的来源时,他首先需要寻找拍摄相机的特有印记,然后将其与待检图像进行比较。此类印记可以有不同的来源,其中最为重要的是图像传感器。其他的还有颜色插值(插值假像)[6]和信号处理(量化表)[7]。
对于图像的来源鉴别而言,出现在一系列图像中的印记十分重要,并且同样的印记模式必须在参照图像和待检图像中都出现。这种再现性的印记模式通常称为固定模式噪声(FPN),由CCD或CMOS传感器造成。它们对光线输入进行处理,并将其转换为数字信号。Geradts等[8]的研究结果表明,传感器的缺陷像素可用于拍摄相机的鉴别。通过对多幅图像进行平均,可以滤除其它来源的非恒定分布的噪声,从而获得反映出缺陷像素的固定模式噪声。然而,缺陷像素导致的固定模式噪声常常会被后期处理过滤掉,并不是总会在图像中得到反映。
Lukáš等[1]提出了一种更好的利用模式噪声鉴别拍摄相机的方法。这一模式噪声不是来自于传感器的缺陷像素,而是来源于每个像素点对光照感应的不均匀性。当所有像素点曝光于同一光照度下,每个像素的响应会有微弱差别,这一现象称作光电响应非均匀特性,也被视作模式噪声的一种。这种模式噪声由器件和结构的不完善所引起,出现在每一幅图像输出中,并且被证明具有特异性[4]。从视频中提取到光电响应非均匀分布,它就可以作为拍摄相机的指纹,用于确认其他图像中的噪声模式是否与其相符。即,首先通过拍摄相机获得参照模式噪声,然后用其验证待检图像的模式噪声。
为了确定视频V来自于相机C,首先必须获得相机C的参照模式噪声PC,视频V与参照模式噪声PC的关联程度用它们之间的相关系数表示。由于大部分相机无法直接从中获得原始传感器数据,我们只有通过对视频的多帧图像进行平均,得到模式噪声的近似值。
视频V首先被分割为一系列的单帧图像Ii,i=1,……,N,N等于视频V的总帧数。平均Ii可以得到模式噪声的近似值。理想情况下,每帧图像应只包含模式噪声,不应存在场景内容。我们可以用降噪滤波器F过滤每帧Ii中的场景内容,仅留下噪声ni,用于计算模式噪声。
视频V中的帧数越多,平均得到的模式噪声PV就越精确。建议N>50[1]。
为了验证视频V是否来自于相机C,得到的PV与参照模式PC之间的相关系数ρC计算如下:
带有上横线的符号代表平均值。有赖于降噪滤波器的选择,我们可以发现更为准确的相关系数。Lukáš等在参考文献[1]中提出了一种基于小波变换的滤波器,效果优于维纳滤波器和中值滤波器,后二者常会在图像边缘产生误判。参考文献[1]和[8]详细描述了该降噪滤波器的工作原理。
上述滤波器的完整算法已在由van Houten等开发的开源工具PRNUCompare[9]中实现,用于获得光电响应非均匀模式及计算视频间的相关系数。
得到ρC(V)后,我们就可以判断相机C是否用于拍摄视频V。相机C的参照模式噪声是用该器材拍摄视频后通过PRNUCompare计算得到。参照视频中没有场景内容,并且理论上接近均匀光照,小波变换滤波器中参数σ的推荐取值为5[5]。
因为小波变换滤波器独立处理每个颜色通道,ρC(V)将会有三个相关系数(RGB),这三个系数之和可用于视频拍摄相机的鉴别。
2.2 AVC编解码器
视频编解码器用来压缩视频文件。因为视频质量越好,则文件越大,所以压缩过程过程总是视频质量与文件大小的折中。压缩使视频文件变小,减少了带宽的占用,增加了视频流速。
如今,针对高清晰视频的标准编码方式是AVC,许多在线视频服务,如YouTube和Vimeo都使用该编码方式。
AVC基于H.264和MPEG-4两个标准,并在FFmpeg的libx264库执行。改变压缩率有多种设置,最简单的一种是调节固定质量因子(CRF)参数,旨在确定输出的视频质量。当CRF设为0时为无损压缩;设为18~20时,能在保证高质量的同时,视频文件较小。使用CRF编码参数,易于调节输出的视频质量等级。
3 实验方法
3.1 限制条件
相机支持的视频分辨率正变得越来越标准化。新型的相机可以录制1280×720或1920×1080的高清(HD)视频,通常还可转换至640×480的低分辨率来节省磁盘空间。手机、网络摄像机、监控摄像机依然使用这种低分辨率标准。在van Houten等的研究中[5],仅使用了 176×144,320×240,352×288 及 640×480 的低分辨率相机。研究高清分辨率相机及其与低分辨率相机的区别是一种较为合理的拓展思路。本研究中,我们选择的视频分辨率为640×480和1280×720,未包括全高清分辨率1920×1080,因为采用该分辩率的相机很少。
Van Houten等[5]的研究表明,一般而言,200以上的平场帧就可提取到可靠的模式噪声。为了保证获得可靠的模式噪声,我们将所有视频裁切为30s。30s的图像帧数与帧速率有关,范围在750到900帧。前期研究[5]采用30s视频得到了确定性的结果,这也是我们采用这个视频长度的原因。
3.2 实验配置
3.2.1 拍摄器材
拍摄器材为既能录制480p视频又能录制720p视频的相机。选用三种常见品牌,其中,两种型号的松下相机,两种型号的佳能相机及苹果iPhone4手机。为了提高数据的可靠性,每种型号的相机都有5个,这样可以大大减少可能的制造瑕疵的影响,同时保证这些型号相机的PRNU模式比较的有效性。
特别选择iPhone4在于其有很高的大众认知度。iPhone是销量最高的智能手机之一,YouTube中的视频有很大部分直接来自于iPhone4,研究该款智能手机使得我们的研究工作也切合潮流。
表1 相机在不同分辨率下支持的帧速率
表1列出了实验用相机的概况,包括支持的分辨率和编解码选择。松下FP-7和松下FZ-45采用Motion JPEG编解码器。但是,松下FZ-45也可以拍摄AVC(H.264/MPEG-4)编码的720p视频。其他相机都使用通用的AVC(H.264/MPEG-4)编解码器。
拍摄相机的帧速率不尽相同,它决定了相机每秒能够录制的帧数。因为实验的视频长度均裁切为30s,帧速率值决定了参照视频和自然视频最终的帧数。
本文着重研究使用AVC(H.264/MPEG-4)重新编码后,从视频中提取的PRNU模式,这意味着重新编码之前的编码方式并不十分重要。但我们仍然会简单阐述不同编码方式的视频在二次压缩后的区别。
3.2.2 准备视频
为了确定PRNU模式间的相关性是否仍是鉴别拍摄相机的可靠方法,我们使用上述相机进行实验验证。首先,给每个型号的相机贴上1到5的标签;然后,在重新编码之前提取参照视频和自然视频的PRNU模式;之后,将每个参照视频的PRNU模式与5个同一型号相机拍摄的自然视频的PRNU模式进行比较。在可能的情况下,对480p和720p分辨率的视频都进行这一步骤。例如,我们从松下FP-7_1拍摄的参照视频中提取PRNU模式,同时提取编号为FP-7_1到FP-7_5的自然视频的PRNU模式。使用PRNUCompare计算每个参照视频与5个自然视频的模式相关系数,匹配相机间的相关系数由ρm表示,失配相机的最高相关系数由ρmm表示。
如本文第二部分所述,我们针对每个相机都分别使用480p和720p分辨率摄制一个参照视频和一个自然视频。参照视频在实验条件下拍摄,保证提取的PRNU模式可靠。参照视频均使用同一方法拍摄,即将相机对着一白色表面缓慢移动拍摄30s。
使用Avidemux工具[10]将每个视频裁切为30秒。Avidemux通过“流复制”功能可以在不重新编码的情况下剪切视频文件,其工作方式为,首先分离视频流,然后以新的长度重写文件头,从而不会改变实际的视频流。由于每个相机的帧速率不尽相同,我们通过计算,当总帧数约为30s时剪切视频。
3.2.3 视频编码
获得适当的视频长度后,我们对每个自然视频使用不同的质量设置进行重新编码。如本文第二部分所述,在libx264编解码器中使用CRF选项,旨在得到相近图像质量的视频。选择CRF值为18到39之间,以3为递增值对视频进行处理,得到8个重新编码的视频。使用PRNUCompare提取每个重新编码视频的PRNU模式。
3.2.4 YouTube编码
为了比较我们的重新编码视频与YouTube视频的区别,我们上传了所有的自然视频,然后对其下载。由于YouTube允许使用640×480和1280×720分辨率,下载视频的大小都未发生改变。每个视频均在YouTube经过AVC(H.264/MPEG-4)重压缩,但参数设置未知。使用PRNUCompare提取每个下载视频的PRNU模式。
3.2.5 评估标准
PRNU模式比较与两个视频间的RGB差值有关。每个颜色通道的最大相关系数1,最小相关系数为-1。三个相关系数之和为最终相关值,我们用其推断两个视频是否匹配。和的最大值为3,表明两个视频完全匹配。当使用同一个视频相互比较时,可得到这一最大值。
为了确认PRNU模式的比较值,我们对结果进行T分布检验。T分布检验能够检测数据的显著性,并与PRNU相关系数结合,推断模式的可靠性。
4 实验结果
4.1 重新编码前
依照本文第三部分描述的提取方法,我们使用PRNUCompare提取并比较了视频的PRNU模式,得到第一组结果。
如表2所示,对于松下FP-7,最高PRNU模式匹配值出现在松下FP-7_1参照视频与自然视频之间。当视频为480p分辨率时,计算得到ρm=2.021,ρmm=0.054。表3为同一相机当分辨率为720p的结果,ρm=2.129,ρmm=0.481。与480p分辨率视频相比,匹配值有些许增大,但失配率要高出很多。
对每个拍摄器材都进行同样的计算,结果见表2~表 11。
表2 松下FP-7,以Motion JPEG方式640×480分辨率编码的自然视频平均帧=10,σ=5
表3 松下FP-7,以Motion JPEG方式1280×720分辨率编码的自然视频平均帧=10,σ=5
表4 松下FZ-45,以Motion JPEG方式640×480分辨率编码的自然视频平均帧=10,σ=5
表5 松下FZ-45,以Motion JPEG方式1280×720分辨率编码的自然视频平均帧=10,σ=5
表6 松下 FZ-45,以 AVC (H.264/MPEG-4)方式 1280×720分辨率编码的自然视频平均帧=10,σ=5
表7 苹果 iPhone4,以 AVC(H.264/MPEG-4)方式 1280×720分辨率编码的自然视频平均帧=10,σ=5
表8 佳能 Ixus 220HS,以 AVC(H.264/MPEG-4)方式 640×480分辨率编码的自然视频平均帧=10,σ=5
表9 佳能Ixus220HS,以AVC(H.264/MPEG-4)方式1280×720分辨率编码的自然视频平均帧=10,σ=5
表10 佳能 PowerShot SX210 IS,以 AVC(H.264/MPEG-4)方式640×480分辨率编码的自然视频平均帧=10,σ=5
表11 佳能 PowerShot SX210 IS,以 AVC(H.264/MPEG-4)方式1280×720分辨率编码的自然视频平均帧=10,σ=5
表12 松下 FP-7,以 AVC (H.264/MPEG-4)方式 640×480分辨率不同CRF值编码的自然视频
表13 松下 FP-7,以 AVC (H.264/MPEG-4)方式 1280×720分辨率不同CRF值编码的自然视频
表14 松下FZ-45,以Motion JPEG方式640×480分辨率不同CRF值编码的自然视频
表15 松下FZ-45,以Motion JPEG方式1280×720分辨率不同CRF值编码的自然视频
表16 松下 FZ-45,以 AVC (H.264/MPEG-4)方式1280×720分辨率不同CRF值编码的自然视频
表17 苹果iPhone4,以AVC(H.264/MPEG-4)方式1280×720分辨率不同CRF值编码的自然视频
表18 佳能Ixus220HS,以AVC(H.264/MPEG-4)方式640×480分辨率不同CRF值编码的自然视频
表19 佳能Ixus220HS,以AVC(H.264/MPEG-4)方式1280×720分辨率不同CRF值编码的自然视频
4.2 二次压缩后
提取重新编码之前的PRNU模式后,我们进一步提取所有重新编码视频的PRNU模式,并与同一型号相机拍摄的参照视频进行比较。表12~表21给出了视频的参数及ρm和ρmm值,但仅列出了每一型号编号为1的相机的结果。
表20 佳能 PowerShot SX210 IS,以 AVC(H.264/MPEG-4)方式640×480分辨率不同CRF值编码的自然视频
如表12所示,对于松下FP-7_1,当CRF为18时,ρm为 1.456(未重新编码时为 2.021),ρmm为 0.034(未重新编码时为0.054)。视频流大小为15.2MB,比特率为4063kbps(原始视频为38.4MB和10.7Mbps)。
当CRF从18变到39,压缩率相应增加。PRNU相关系数在CRF为39时降低为ρm=0.068,ρmm=0.023。视频流大小只有930Kb,比特率下降到246kbps。
表中也包含了YouTube视频的相关系数。如对于松下 FP-7_1,YouTube 的 ρm=0.306,ρmm=0.019。 视频流大小为4.23MB,比特率为1129kbps。
5 分析
5.1 重新编码前
我们计算所有视频文件的PRNU模式相关系数。提取表2~表11中的ρm和ρmm值,计算平均值。
我们的数据有限,故计算表2~表11中PRNU模式的ρm和ρmm标准差,以确定其分布。
表21 佳能 PowerShot SX210 IS,以 AVC(H.264/MPEG-4)方式1280×720分辨率不同CRF值编码的自然视频
标准差的公式如下,xi是数据,x是平均值:
图1为计算得到的二次压缩前的PRNU值分布。
为了测试数据的显著性,对所有参数条件下视频的PRNU模式相关系数进行T分布检验。
图1 所有相机重新编码前的PRNU模式相关系数平均值
图1 显示,对于一些型号的相机而言,比较PRNU模式是一种有效的鉴别视频源的方法。松下FP-7、松下FZ-45和iPhone的匹配值ρm与ρmm最高失配值有明显的差异。在720p分辨率下,佳能PowerShot SX210 IS的PRNU值也可认为是可靠的。在图1看到,在480p分辨率下,佳能Ixus220HS和佳能Power ShotSX210的ρm与ρmm几乎没有区别。
我们进一步观察各个分辨率下视频的PRNU值差异,决定哪个足够显著,可以认为是可靠的。
5.1.1 松下FP-7
该相机使用Motion JPEG方式编码。480p视频的ρm=1.979,ρmm=0.054,差异有 36倍,显著有效。 720p 视频的 ρm=2.045,ρmm=0.477,相差 4.2 倍,足够有效,尤其是考虑到相关匹配值很高这一情况(最大值为3)。图1清楚地显示了这些差异。
5.1.2 松下FZ-45
该相机的480p分辨率视频用Motion JPEG方式编码,720p分辨率视频可以选用Motion JPEG或AVC(H.264/MPEG-4)方式编码。该相机的这一特点使得我们可以研究这两种编码方式对PRNU值的影响。如图1所示,匹配和不匹配视频的PRNU值差异非常明显。高相关匹配值和低相关失配值说明该相机能够得到有效的鉴别。
同时看到,对于720p的视频,使用AVC(H.264/MPEG-4)方式编译比使用Motion JPEG方式编译,失配值要低很多(AVC为0.006,Motion JPEG为0.374)。但是,必须注意的是720p AVC视频的ρm为0.756,只有720p Motion JPEG视频ρm的一半(1.131)多一点。
如果进一步对差异倍数进行比较,720p AVC视频的729倍远胜过720p Motion JPEG视频的3.5倍。尽管Motion JPEG视频的差异倍数很低,但是由于匹配值很高,结果仍然是可靠的。
5.1.3 Apple iPhone 4
Apple iPhone 4得到了非常理想的结果,ρm=1.452,ρmm=0.006,相差235倍。这一很高的差异倍数结合高的值和很低的ρmm值,使其成为PRNU模式比对的典型相机。
5.1.4 佳能Ixus220HS
佳能Ixus是首个PRNU模式效果不理想的相机。480p和720p的匹配值都太低而不可靠,并且如图1所示,失配值和匹配值非常接近。而且,当我们进一步计算 480p视频的标准差时,ρm=0.196,ρmm=0.169,几乎没有差别。
720p分辨率视频的ρm略有增长,至0.382,ρmm降低至0.114,但匹配相关值仍然太低而不可靠。
5.1.5 佳能PowerShotSX 210IS
在480p分辨率上与佳能Ixus220HS一样,匹配值太低,失配值相对较高,同样的可靠性低,不应作为PRNU模式比较使用。
720p视频的表现优于480p视频,可能是因为更高的分辨率得以捕捉更多的像素。ρm=0.849,ρmm=0.093,9倍的差值足以作为PRNU模式比较使用。
5.2 二次压缩
分析了重新编码前的情况,我们对二次压缩对PRNU相关系数的影响进行进一步研究。如前所述,有些相机的PRNU模式比较是有效的,这里我们选取2种型号的相机予以图例说明,一个是可靠的松下FP-7相机,另一个是部分可靠的佳能PowerShot SX210 IS相机。其他相机的结果见图4~图6,这里不再详细讨论。
5.2.1 松下FP-7
图2表明,即使经过高压缩率压缩,PRNU比较对于松下FP-7而言仍十分有效。直到CRF至33,PRNU模式相关值都足够高,匹配值与失配值能够区分,可以认为是可靠的。
图2 编码对松下FP-7视频PRNU相关值的影响
YouTube下载的视频与CRF值为27左右的重压缩视频的情况相当。表12显示,与经过重压缩的480p视频相比,YouTube视频有略高的比特率和流大小,但是与经过重压缩的720p视频相比,两者几乎相当。由于YouTube视频的PRNU相关值较高,仍然可以进行视频源鉴别。
松下FP-7的480p视频的T分布检验显示有效,CRF为 18时,p=0.001;CRF为 39时,p=0.001;YouTube的p=0.001,均显著低于0.05阈值。
720p视频的显著性计算结果同样,CRF为18时,p=0.001;CRF 为 39时,p=0.001;YouTube的 p=0.001。
5.2.2 佳能PowerShot SX210 IS
如前所述,即使没有经过二次压缩,也并非所有视频可以通过PRNU模式与拍摄相机建立关联,就如前面分析的佳能PowerShot SX210 IS相机拍摄480P视频。
如图3所示,720p视频的相关值足够高,CRF至30时,依然可以准确地鉴别出匹配相机。
图3 编码对佳能PowerShotSX210IS视频PRNU相关值的影响
对视频的T分布检验证实了我们的结论。CRF为18时,p=0.001;CRF为 39时,p=0.001。 YouTube视频的压缩参数与CRF为27的视频相当,可以鉴别拍摄相机,其T分布检验p=0.001。
对于480p视频,由于其二次压缩之前的PRNU相关值就不充分,视频压缩更不能使相关值提升。
即使采用本实验中的最高CRF为18,ρm和ρmm都过低而不能成功匹配。我们计算了所有CRF设置的PRNU相关值,随着压缩率的升高,相关值越来越低。
T分布检验也证实了这点。当CRF=18时,p=0.001,统计学上可以作为一个显著性结果。但是如果考虑到PRNU模式的平均相关性只有0.19(最大值为3),且标准差为0.03,该数据应予以忽略。当CRF=30时,p=0.06,超过了0.05的阈值。CRF值更高时,统计结果均不显著。
从YouTube视频提取的PRNU模式完全不可靠,远差于预先设定CRF值范围的重压缩视频。通过验证,YouTube下载视频的PRNU相关值与CRF=45视频的PRNU相关值相当。毋庸赘言,这时视频质量已被完全毁坏。在视频大小和比特率方面,YouTube视频与CRF值为27的重新编码视频相当,与我们检测的其他相机拍摄的视频一致。YouTube视频的T分布检验结果也良好,p=0.001,就之前定义的标准而言,具有显著性。
以上结果表明,YouTube对视频的PRNU模式进行了处理,但我们无法推测或重现这些处理方式。同时表明,除佳能PowerShot SX210拍摄的720p视频外,PRNU比较方法不适用于我们检测的其他佳能相机。
图4 编码对松下FZ-45视频PRNU相关值的影响
图5 编码对iPhone4视频PRNU相关值的影响
图6 编码对佳能Ixus 220HS视频PRNU相关值的影响
6 结论
根据实验结果,可以得出结论:在某些情况,通过模式噪声比较建立视频与拍摄相机的关联是可行的。这基于拍摄相机的品牌、视频分辨率及对视频施加的压缩量。随着压缩量提升到一定程度,PRNU模式的可靠性以指数方式降低。
拍摄相机的PRNU模式具有与品牌相关的鲁棒性。松下和苹果iPhone相机表现出典型性。在重新编码之前,对视频提取模式噪声,可以清楚地反映视频与拍摄相机的关联。视频的CRF值重新编码对原始模式噪声有破坏性的影响。图2~图6表明,压缩率升高,相关值降低。对比YouTube视频和重新编码视频的模式噪声可知,YouTube的压缩参数相当于CRF值为27到30。YouTube视频可以通过提取模式噪声鉴别其拍摄相机来源。
佳能相机拍摄的视频不适用于本方法。当分辨率为480p时,无法通过从视频中提取的模式噪声鉴别拍摄相机。当分辨率为720p时,模式噪声比较只有50%的可行性,其成功率与特定的拍摄相机型号有关。同时,佳能相机具有与其他相机相同的模式噪声呈指数下降的趋势。这意味着如果重新编码之前的模式噪声充分,重新编码之后鉴别出视频源的机会增加。YouTube视频并非始终可以进行视频源鉴别,它取决于视频分辨率。720p的视频即使是佳能相机也足以鉴别,但是480p的视频均不足以保留模式噪声,用于成功比较。
AVC二次压缩对于模式噪声具有非常明显的负面效果。视频分辨率、相机品牌和压缩等级对于PRNU模式比较的可靠性有着综合性影响。无论是对于在线视频服务重新编码还是手动重新编码,视频源的匹配过程都依赖于具体情况。
7 进一步研究建议
我们的研究着重于480p和720p分辨率的视频,还可以针对更高分辨率如1080p或2304p的视频进行相似的研究。
相机品牌决定了模式噪声的可靠程度,还可以针对同一品牌的更多型号相机或更多不同品牌相机进行研究,建立它们之间的关联。
致谢
感谢Netherlands Forensics Institute为我们的研究提供设备和资源。尤其要感谢Zeno Geradts对本项目的实时帮助和指导。
感谢Marcel Worring对我们撰写最终报告提供的帮助及分析数据所需的宝贵输入。
Ewald Snel为我们提供了PRNUCompare的修改版本,得以实现命令行的界面,从而大大加快了我们处理数据的速度。
最后,我们要感谢Cees de Laat帮助实现本研究项目。
[1]Jan Lukáš,Jessica Fridrich,Miroslav Goljan.Digital camera identification from sensor pattern noise[M].2006.
[2]Jan Lukáš,Jessica Fridrich,Miroslav Goljan.Determining digital image origin using sensor imperfections[M].2005.
[3]Mo Chen,Jessica Fridrich,Miroslav Goljan.Digital imaging sensor identification (further study)[M].2007.
[4]Miroslav Goljan,Jessica Fridrich,Tomáš Filler.Large scale test of sensor fingerprint camera identification[M].2009.
[5]Wiger van Houten,Zeno Geradts.Using sensor noise to identify low resolution compressed videos from youtube[M].2009.
[6]Alin C.Popescu and Hany Farid.Exposing digital forgeries in color filter array interpolated images[M].2005.
[7]Hany Farid.Digital image ballistics from jpeg quantization[M].2008.
[8]Zeno Geradts,Thomas Gloe.D6.8b: Identification of images[M].2009.
[9]http://prnucompare.sourceforge.net/.
[10]http://www.avidemux.org/.
TP212
A
10.3969/j.issn.1671-2072.2012.05.004
1671-2072-(2012)05-0031-009
2012-06-20
亚尼克·斯凯林,男,系统和网络工程硕士,主要从事系统和网络工程研究。E-mail:yannick.scheelen@os3.nl。
芝诺·胡拉茨,男,图像分析及生物识别高级鉴定人,电子证据生物识别研发部主任,主要从事图像分析生物识别研究。 E-mail:z.geradts@nfi.minvenj.nl。