基于JPEG 格式图像探析不同传输方式对Exif 信息的影响
2023-11-16孟利
文/孟利
本文通过深入分析JPEG 格式图像经微信、抖音、微博、邮件、小红书以及QQ 等不同传输路径传输后,其文件属性和Exif(可交换图像文件格式)信息发生的变化,以期为图像真实性的检验提供有效参考。研究结果显示,JPEG 格式图像经微信、抖音、小红书和QQ 传输后,其文件属性会发生本质变化,Exif 信息的完整性会受到影响甚至丢失。也就是说,使用者可以通过观察这些变化来检验JPEG 格式图像的真实性是否发生了改变。
随着科学技术和数字图像技术的不断发展,图像、视频等逐渐发展成信息传播的主要载体,并在政治、经济、司法诉讼以及日常生活中发挥出重要作用。特别是在一系列功能多样、容易操作的图像处理软件出现以后,图像篡改的情况日益普遍,甚至发展到肉眼难以察觉篡改痕迹的地步。这些被篡改的图像在网络上广泛传播,将大大降低图像信息的可信度,并在一定程度上造成恶劣影响。因此,如何判断图像的真实性已成为社会各界普遍关注的问题。
当前,人们主要通过以下三种方式来验证图像的真实性,即成像检验、Exif 信息检验以及图像信号分析。[1-3]其中,Exif 信息检验的工作原理是:验证图像文件格式中包含的照相设备在拍摄图像过程中采集的信息,如设备制造商、信号强度、颜色编码、曝光时长以及GPS 定位等是否被修改过,进而以此Q 为依据检验图像的真实性。在具体实践中,大部分人对Exif 信息缺乏全面认识,无法利用Exif 信息为图像真实性检验提供可靠依据。本文在对JPEG 格式图像进行分析的基础上,进一步探讨了不同传输方式对Exif 信息的影响,旨在丰富Exif 信息检验图像真实性的应用途径。
一、JPEG 格式图像文件结构
首先,笔者将JPEG 图像文件以特定规则保存,其次使用JPEG 文件交换格式JFIF 对图像数据流进行封装,使用“APP0”对其进行标记,最后以“0xFFD8”为开头字符串,以“0xFFD9”为结束字符串。此时,JPEG 图像文件头中包含一系列“0xFF”格式的字符串作为信息“标记码”,其中,“0xFFE1”代表信息为“Exif 信息”。
二、Exif 信息的构成
通常,“0xFFE0”和“0xFFEF”之间的16 个JPEG 标识符会被应用程序保留,Exif 信息也正是利用这些信息串来记录JPEG图像参数信息的。图1 展示的是某数字图像Exif 信息的开头部分,完整的Exif 信息长度为“0xFFFE”。由于JPEG 文件格式规定使用大端顺序,该数字图像Exif 信息的实际长度为65534B。此外,0x457869660000是Exif 信息的ASCII 码值,0x4D4D002A00000008 是TIFF(标签图像文件格式)头的一部分。其中,“0x4D4D”表示在该TIFF 段中使用大端顺序。考虑到“0x002A”是一个固定值,0x00000008 就表示从“0x4D4D”到第一个图像文件目录(IFD)的偏移量为0x8。
图1 某数字图像Exif 信息的开头部分
三、实验分析
笔者使用手机拍摄了一张图像,分别通过微信、抖音、微博、邮件、蓝牙、小红书、QQ 等渠道进行传输。随后,笔者操作ExifToolGUI V5.16.0.0软件分别查看了该图像在传输前后的文件属性和元数据信息。
数据信息显示,该图像的元数据包含Exif 信息、IPTC 信息以及JFIF 信息等多种形式。值得一提的是,IPTC 元数据标准作为一种元数据标准格式,已经在JPEG 数字图像处理领域得到广泛应用,它能够详细记录并描述图片的作者、版权、字幕、细节以及创建时间等信息。
以小红书为例,笔者借助Photoshop CS6 13.0 软件查看了图像文件传输后的元数据,并整理重要信息如下:
其中,“IPTCDigest”代表图像中IPTC 元数据的MD5 哈希校验值,且当IPTC 元数据发生变化时,该值也会随之发生变化;“DocumentID”为该图像的全局唯一标识符;“InstanceID”为该图像当前的版本标识符,且当图像更新并产生新版本时,“InstanceID”也会发生相应变化。
与此同时,笔者综合各专业软件的检验结果发现,该图像经邮件、微博和蓝牙传输后未发生任何改变,但经小红书、微信、抖音以及QQ 传输后分别在文件名、大小、MD5 值等方面发生了不同程度的变化。
在Exif 信息方面,该图像在经小红书和微信传输后均发生“ThumbnailOffset”变小和“GPS信息”丢失的情况。尤其是经过小红书传输后,该图像的“ThumbnailLength”变小,其JFIF信息的“XResolution”(水平解析度)和“YResolution”(垂直解析度)均变为“72”。也就是说,该图像的分辨率明显降低。另外,该图像在经小红书、微信和QQ传输后,其文件名分别发生不同程度的改变。其中,经过微信和QQ 传输后,该图像的原始文件名中分别加入了微信和QQ 标志;经过小红书传输后,该图像则根据系统的内部顺序进行了重命名。笔者利用WinHex 工具查看后发现,该图像经小红书、微信和QQ 传输后都显示了JFIF 信息。JFIF 信息以十六进制数“0xFFE0”为开始标记,紧接着的“0x0001”两个字节用于表示JFIF 信息的长度,“0x4A4649460001”为“JFIF”的ASCII 码值。
该图像经抖音和QQ 传输后,Exif 信息丢失,并且二者在ExifToolGUI V5.16.0.0 软件中均不显示各自的Exif 信息,同时该图像的文件名也发生了改变。另外,该图像在经抖音传输后,其扩展名也从JPEG 格式转换成了PNG 格式。这一变化在该图像的Exif 信息中也能体现出来。最后,笔者利用WinHex 工具查看了该图像的RIFF 信息,发现其字符串以“0x52494646”开头。
该图像经抖音、微信、小红书和QQ 传输后,其“Thumbnail-Offset”和“ThumbnailLength”均发生明显变化。这就说明,原始图像的缩略图(Thumbnail Image)同样发生了改变。缩略图作为原始图像的精简版,通常以文件形式存储在图像库中。在某些特定情况下,缩略图也可以揭示原始图像是否存在被篡改的痕迹。在此次实验中,笔者用手机拍摄的图像经小红书、抖音和QQ 传输后,缩略图由于信息丢失,未能显示。
另外,该图像经微信传输后,其“ThumbnailOffset”变小。一般来说,此类缩略图的起点和终点分别用“0xFFD8”和“0xFFD9”表示,并存储于“Thumbs.db”文件夹中。如果图像被篡改,那么使用者就可以通过查看缩略图信息来追踪图片的篡改痕迹。
综上所述,不同传输路径对JPEG 格式图像的影响主要表现在文件属性和Exif 信息方面,使用者可以通过分析对比JPEG 格式图像的文件名、大小、MD5 值以及Exif 信息来检验图像的真实性。
例如,在利用Exif 信息检验图像真实性时,使用者应仔细比对检验图像中的Exif信息与相应拍摄设备所特有的固有功能及元数据,以判断二者是否一致。一旦在比较过程中发现不一致的情况,使用者就要对这些不一致的现象进行深入分析,以确定待验证图像是否存在篡改或伪造痕迹。
四、结语
本文研究了JPEG 格式图像经邮件、小红书、微信、微博、蓝牙、抖音和QQ 等渠道进行传输后,在文件格式、大小、MD5 值以及Exif 信息方面发生的变化,基于相关实验数据和分析结果,进一步探讨了利用文件属性和Exif 信息来检验图像真实性的技术方法,以期为图像真实性检验提供更多选择。与此同时,笔者还发现,JPEG 格式图像在不同传输渠道下还存在信号分析结果不统一、传输通道流量不均衡、数据丢失等诸多不确定影响因素。因此,相关研究者要充分了解图像传输中的各种影响因素,深入研究文件属性和Exif信息,通过科学准确的手段来检验图像的真实性。