惠普彩色激光打印文件跟踪暗码的实验研究
2016-08-15郝红光
胡 萍 成 磊 郝红光
(1.中国人民公安大学,北京100038;2.公安部物证鉴定中心,北京100038)
惠普彩色激光打印文件跟踪暗码的实验研究
胡萍1成磊1郝红光2
(1.中国人民公安大学,北京100038;2.公安部物证鉴定中心,北京100038)
本文采用Matlab程序和Photoshop图像批处理文件两种方法提取彩色激光打印文件上的跟踪暗码,并对提取的暗码点进行基本模式图案的划分。研究利用打印文件的跟踪暗码点的分布规律区分打印文件是否来源于惠普彩色打印机,分辨换页文件,解析惠普彩色打印机打印文件的暗码点。
跟踪暗码彩色激光打印文件自动提取
引言
彩色激光打印机的制造商在设计他们的设备的时候,采用某种方式在每个打印文件上设置一个独特的跟踪图案,此跟踪图案用于识别打印文件的来源、打印时间等信息。打印机的普及增加了伪造、变造文件的数量。识别伪造、变造激光打印文件一个较好的方法就是找到激光打印文件中不能额外添加信息的功能,称为内在功能。所谓内在功能就是正常的文档生成时候的副产物,即跟踪暗码。
跟踪暗码点是肉眼不可见的,在显微镜观察下是小黄点。打印文件在EPSON V370 Photo扫描下的图片,经过Photoshop图像处理软件的处理,可以看见黄色小圆点(参照图1数字周围小圆点)。这些小黄点形成具有固定的水平和垂直间距的图案并且重复出现,这种重复图案被定义为基本模式图案。
图1 暗码点
关于跟踪暗码的研究,在1993年,L.Cal. M.Belovicova.M等人提出了用暗码点来识别问题文件,在2005年Mike Musgrove提出了根据暗码点形状来区分几种品牌打印机的打印文件;纵观国内,黄建同、梁立峥等人提出了从跟踪暗码点的形态可以分辨几种品牌的彩色激光打印机的打印文件,以上都属于形态观察法。2005 年EFF组织破译了富士施乐牌彩色激光打印机打印文件的暗码点信息,但是其他品牌的跟踪暗码点至今未被破译出来。本文提出了不同以往的研究方向——从普惠彩色激光打印机打印文件的暗码的分布规律进行研究,并提出自动提取跟踪暗码点。
1 实验方法和设备
1.1实验设备
UVCS-5000文检仪,Photoshop图像处理软件,EPSONV370Photo扫描仪、十种型号惠普打印机分别为:HP CP5525dn、HP CP4525dn、HP CP4700dn、HP CP1025、HP M750dn、HP M551dn、HP M451nw、HP CP1025nw、HP M551n、 HP CP4525dn。
1.2实验样本
收集了十种惠普型号打印机在不同时间、内容下打印的文件,如图2、3所示:在6月10号和25号单独打印样本一与样本二,在6月10号和25号连续打印样本三。
图2 样本一、样本二
图3 样本三
1.3实验设计
实验样本以分辨率1200dpi在EPSON V370 Photo扫描仪下扫描形成图片,用Photoshop图像处理软件提取暗码,找出基本模式图形,进行重合比对、找出暗码分布规律。
2 实验过程
2.1实验步骤
实验内容分为三个部分:(1)手动提取扫描文件上的跟踪暗码点。(2)手动提取暗码点产生噪点、叠印点的分析,以及解决方法。(3)提出暗码点自动提取。
2.1.1打印文件跟踪暗码点的手动提取
扫描文件在Photoshop中分别在C—青色、M—黄色、Y—洋红、K—黑色通道下观察。在黄色通道下,暗码特征最明显,但是会出现许多虚假黄点。因此,需要手动检查在不同的页面的点的颜色值显示,在RGB色彩空间中的R 和G的值是接近255,而具有稍低B值。手动设置容差在20~40之间的某一个值来提取暗码点。
2.1.2手动提取暗码点产生噪点的分析及解决方法
叠印点:打印文件内有黄色图片或文字,因为暗码点也是黄色的,所以使暗码点被文档内容覆盖,导致部分暗码点不可检测,整体图案不完整,如图4所示。
噪声点:有些提取点可能并不是暗码点。产生噪声点原因很多,一部分是由于在提取暗码时,当容差较低的时候、与黄色暗码点相似的底灰,就会被选中,形成虚假暗码点。当选择的容差较大时、很多黄色暗码点由于比例大小不一样,越来越多的点数将被错过,最后形成的暗码点基本图形不完整。另一部分噪声点可能是由于打印机本身问题,比如:打印机墨粉受潮、硒鼓与打印机接触不良等原因,导致打印的碳粉遍布全页,这种情况下,很多小黑点随处可见,暗码点分辨变得困难。扫描文件的分辨率越低,噪声点也越多,如图5所示。
图4 叠印点
图5 噪点
为了得到完美的暗码点图形,需要对暗码点进行手动调整。通过基本图形对准方法,先找出一个基本模式图形,通过重合比对、看其他地方暗码点是缺失还是增多,按照基本模式图形、增加或者减少暗码点。
2.1.3提出自动暗码识别
笔者在提取连续文件的暗码点时,发现过程繁杂,为了简化提取步骤,笔者提出了二种自动暗码点提取系统。第一种方法是使用MAT⁃LAB程序自动提取,可以通过该程序自动提取大量扫描文件的暗码点,省去了人工提取的步骤,该暗码点自动提取系统的伪代码如下:
h=('11.jpg');扫描文件名称
m=585;图像的大小
n=1354;图像分辨率
R=h(:,:,1);提取每个像素R通道的值
G=h(:,:,2);提取每个像素G通道的值
B=h(:,:,3);提取每个像素B通道的值
for i=1:m;图像大小一致
for j=1:n;图像分辨率一致
if(((R(i,j)>205)&&(G(i,j)>205)&&(30205并且G值>205并且30
caise(i,j)=0;满足以上条件则赋值为黑色
else
caise(i,j)=255;不满足以上条件则赋值为透明色
end;结束
图6为该程序运行结果,可以看出MAT⁃LAB程序运行下结果不理想,噪点太多。
结合在Photoshop图像处理软件中手动提取精确性优点与自动化,笔者又采取了批处理文件的方法。手动提取暗码,Photoshop图像处理将步骤记住生成exe程序,把未提取文件加入exe程序,程序按照手动提取方式,自动提取暗码。这种方法提取暗码效率高、精确度高。图7为该程序运行结果。
图6 MATLAB程序运行下结果
图7 photoshop处理后结果
3 实验结果分析
(1)暗码点是呈一定规律性不断重复的、划分基本模式最大的问题就是——不知道基本模式何时开始以及何时结束,提取出来的基本模式会引起歧义,而且基本模式的大小也是未知的。基本模式的提取遵循的方法为采用暗码点起始定位方式。图8是惠普打印机出纸方式图,可以发现纸张297mm的一侧先出来。(A4纸尺寸:210×297mm)
图8 出纸方式图
每一页的跟踪暗码点都是从页侧边开始出现。暗码点基本模式图案也是从页侧边开始,页侧边的暗码点作为起始点,找到循环的对应点。图9是以侧边暗码点为起始点截图部分暗码点。图10是暗码点的基本模式。
图9 暗码点
图10 暗码点的基本模式
(2)从笔者收集的十种惠普型号打印机打印文件的跟踪暗码点来看,这十台打印机的打印文件的暗码点的基本图形都不一样。用同一台打印机打印连续文件、单独打印文件、打印时间不同的打印文件产生的暗码基本模式图形、以及暗码点之间的距离都是一样的,可以得出惠普打印机打印文件的暗码点不包含时间信息。如图11所示,左边打印文件来源于HP CP5525dn打印机。右边打印文件源于HP CP4525dn打印机打印的文件,对以上两种打印文件的暗码点基本图案进行重合比对,发现右边一小部分是重合的。这两份打印文件的打印时间、内容都不同,右边重合的图案就是代表了惠普打印机品牌信息。由此可以得出,发现打印文件的跟踪暗码点的分布如右边重合图案,那么可以确定该打印文件来源于惠普打印机。
图11 重合比对图
(3)换页文件的区分:同一种型号的惠普打印机的打印文件的跟踪暗码无法解决连续打印换页问题,是由于打印机的出纸方式,每一页的跟踪暗码点都是从页侧边开始出现。页侧边的暗码点基本模式图案是一样的,连续打印文件的上下页的跟踪暗码点是无法结合在一起。每一台惠普打印机出来的文件上跟踪暗码开始都是相同的,以此点出发、要是不同打印机的换页文件就可以根据页侧边暗码点不同而鉴别出来。
4 结论
在本文中,笔者扩展了以前的通过跟踪暗码点的形态来识别打印文件的来源。创新点在于提出跟踪暗码自动提取、部分暗码点的解码,这可以用于通过识别彩色激光打印文件的跟踪暗码点来识别打印机品牌。通过比较两份彩色激光打印文件暗码点的基本模式图案,可以判断这两份彩色激光文件是否来自相同品牌的打印机,其次对来自相同的打印机打印文件的基准图案中提取的商家的基本信息,再利用跟踪暗码点分布规律来判断一份彩色激光打印文件是否为连续打印文件。所提出的方法可适用于其他品牌打印文件跟踪暗码点的研究,破译跟踪暗码点的工作需要更多的社会努力。
[1]Mike Musgrove.Sleuths Crack Tracking Code Discov⁃ered in Color Printers[EB/OL].[2005-10-19].http:// www.washingtonpost.com.
[2]EFF.Investigating Machine Identification Code Tech⁃nology in Color Laser Printers[EB/OL].[2005-07]. http://www.eff.org.
[3]Jason Tuohey.Government Uses Color Laser Printer Technology to Track Documents[DB/OL].[2004-11-22].http://www.pcworld.com.
[4]梁立峥,黄建同.彩色激光打印文件跟踪暗码小点特征初探[J].中国人民公安大学学报(自然科学版),2011,(4).
[5]黄建同.文件检验实验指导[M].北京:中国人民公安大学出版社,2014.