数字图像真伪鉴别技术研究
2012-08-15姚园园
姚园园
河南警察学院,河南 郑州 450003
随着高性能数字图像采集设备与智能化图像编辑处理软件的普及应用,数字图像的篡改变得更简单且更难于识别,给图像信息与图像证据的可靠性带来危机。因此,对数字图像资料的真实性、原始性、完整性的检验已逐渐成为一项常规检验工作对司法鉴定人员提出了挑战,也成为图像处理、信息安全等领域的研究热点。目前的技术方法主要分为两大类:手工鉴别方法和计算机自动图像鉴别技术。
1 手工鉴别方法
1.1 初步检验
1.1.1 查看EXIF元数据信息
数码照片的EXIF信息是镶嵌在JPEG格式中的数码相机原始拍摄信息,包括生产信息、摄影参数和照片的修改信息等,可以使用专门软件来查看。如果EXIF信息完整且显示没有使用软件处理过,该照片就是原始照片;反之则修改过,需要进一步进行真实性检验。
1.1.2 分析图像内容是否合理
摄影作品通过画面内容反映一定的摄影意图,是一个有机的整体。而伪造照片是将不同的内容元素重组来表达一种虚拟的内容。通过解读摄影意图,分析摄影画面的不合逻辑之处可以判断照片的真伪。例如分析摄影时的季节气候、地理环境与人物衣着、动植物的分布及生长状况是否一致;人物与背景关系、表情肢体动作是否符合情节等。
1.1.3 对图像细部进行像素级分析
将图像放大至边缘轮廓及线条至像素级,可以清晰显示出由剪切、拼接等操作所形成的色调统一性、连续性的破坏;线条错位、边缘粗糙;改变图像比例形成的局部图像分辨率差异等。
1.2 根据摄影成像景深原理进行检验
照片上清晰景物的纵深范围即为景深,景深范围外的被摄物距离对焦点平面越远的景物成像越模糊。景深的大小受到焦距、光圈等因素的影响,使得在添加性篡改中很难做到实现画面景深的一致性。例如伪造照片可能出现不同纵深段的两个景深范围,或同一平面景物有的清晰而有的不清晰。在对图像进行检验时,首先寻找景深范围,然后根据景深前后纵深范围物体的清晰度变化是否与景深原理相符合,查找篡改部位。
1.3 根据摄影成像透视规律进行检验
图像上物体之间的立体关系通过在二维平面上的大小、远近、虚实等透视现象表现出来,符合透视规律。例如近大远小规律;互相平行的线段向远方逐渐靠拢并消失于灭点;非水平的倾斜线条消失于天点或地点;与画面不平行的水平线条消失于视平线上心点两旁的灭点等。如果照片中各个成像物的比例关系违背透视规律,则说明该照片存在篡改。应注意镜头的焦距不同产生的透视效果也不同,焦距越小透视效果越强,影像的畸变越强烈。
1.4 根据摄影用光特性进行检验
光是摄影成像的必备条件。光对物体照明,塑造物体形象和质感,描绘影调与色调。光源性质不同,光强度不同,照射方向与距离不同均产生不同的造型效果。可以根据图像所摄物体中光线性质、数量、角度、亮度以及照片的色调、反差以片影调的一致性来判断照片中的可疑点,再进行量化检验。例如,可根据人的眼睛反映出的光源的数量一致性进行篡改检测。
2 计算机数字图像鉴别技术
数字图像鉴别技术是计算机取证技术的一个分支,用来检验数字图像原始性、真实性、完整性。目前数字图像鉴别技术可分为主动式鉴别技术和被动盲鉴别技术两大类。
2.1 主动鉴别技术
主动鉴别技术预先向图像中嵌入数字水印、数字签名等验证信息,在取证时中提取该信息,以确定是否被非法篡改。现有的用于图像真伪鉴别的图像主动取证技术包括脆弱数字水印和图像哈希。脆弱水印是在图像的空域或频域中嵌入易碎水印信息,当图像被篡改时水印信息就遭到破坏从而暴露出篡改行为。每个数字文件包括数字图像都具有独有的字符串哈希值。哈希具有敏感性,即使图像修改1比特也会使哈希值产生改变,因此可以通过查看哈希值判断图像是否为原始图像。
2.2 被动鉴别技术
数字图像被动取证技术不需预先嵌入信息,仅根据图像自身特性对图像的真伪和来源进行鉴别和取证。
2.2.1 基于图像处理操作的遗留痕迹特征进行鉴别
1)复制—粘贴检测
目前应用较广泛的一种图像篡改方法是将图像中的一部分复制后粘贴至同幅图像的其他部分来覆盖掉场景中的人或物。根据复制区域和粘贴区域在内容上基本相似的特点可以设计相关算法进行检测,目前的检测方法主要有穷举搜索法、图像块自相关矩阵法和图像块匹配法等。
2)重采样检测
为了使篡改图像更自然,操作者往往采用缩放、旋转等操作,这就对图像做了重采样。重采样会造成像素值之间的特殊关联性,利用这种特性可检测图像中经过重采样的区域。目前该检测算法有数学期望最大化(EM)算法等。
3)模糊操作检测
模糊操作来常用来润饰经过剪切、拼接的图像边缘,消除伪造痕迹。模糊操作检测能够找出图像中人工模糊操作的证据,判断图像真伪。目前的小波域检测法、基于异常色调率的模糊操作检测法等都有很高的检测率。
4)JPEG压缩检测
JPEG是数码相机通用的照片格式,也是网上广泛传输的一种图像格式。JPEG又是一种有损压缩标准,JPEG图像修改后保存时,会再次进行压缩。当图像中不同区域呈现不同的双重压缩特征时,说明该图像不是正常的保存性压缩,而是经过了篡改。目前有双重量化效应检测法、块效应检测法等。
2.2.2 基于图像获取设备引入的特征进行鉴别
数字成像设备在获取图像的过程中会将自身固有的属性特征引入图像,如果对图像进行修改必将影响这些特征。若将不同来源的图像进行合成篡改,相应区域将呈现出不同的设备特征。
因此,通过分析这些特征信息也可以进行图像真伪鉴别。目前有基于不同品牌型号的色彩滤镜阵列(CFA)插值算法唯一性特征的CFA插值关联性检测法;基于相机光学镜头引入的色差一致性的横向色差检测算法;基于相机传感器引入噪声一致性的噪声模式检测法;基于几何不变量和相机响应函数(CRF)的一致性特征的CRF检测等。
2.2.3 基于数字图像自身的场景特征进行鉴别
1)基于自然图像统计特性进行鉴别
自然图像具有类似的统计学特征,因此可以采用一定的统计特征和区分阈值来判断图像是否被篡改。这种方法通常目前常用来区分自然图像与计算机生成图像。目前有多尺度小波分解和高阶统计建模的检测方法等。
2)基于物理学原理进行鉴别
基于物理学原理的图像检测涉及到图像理解的问题,研究较少,目前有主要针对单个光源进行用光具有一致性建模的检测方法,利用相机的投影点(主点)一致性来判断图像真伪的检测法等。
3 各类鉴别方法比较及展望
1)手工检测方法常用在司法鉴定部门的声像资料鉴定工作中,目前尚无完整的体系和规范的操作标准,鉴别结果受检测人的知识、经验、主观认知的影响较大;
2)数字图像主动鉴别技术检测准确性较高,但要先期对图像进行特殊处理,并且需要特殊的阅读程序才能读取出来。这使该技术的应用受到限制;
3)被动鉴别技术不依赖于额外信息,只通过图像本身特征进行真伪鉴别的特性,使它具有更广阔的应用前景。但是目前的技术往往只针对特定的篡改类型有效,鲁棒性差。
数字图像的真伪鉴别技术目前还是一个新兴领域,在今后的发展中应注意如下几个方面:建立通用体系结构;融合现有自动鉴别手段,增强适应性,全面鉴别伪造图像;研究成像过程中的物理原理,加强图像内容理解,创新半自动式鉴别技术。
[1] 杨用文,金志祥.浅谈伪造照片常规检验方法[J].云南警官学院学报,2009(1).
[2] 王朔中,吴酋珉.真伪之辩—数字图像的防伪认证[J].自然杂志,32(5).
[3]赵俊红.数字图像被动取证技术综述[J].计算机工程与设计,2010,32(8).
[4]马婷婷.硕士学位论文[D].长沙:长沙理工大学,2011.