一种适用于出入境证件中传统水印的智能鉴别算法
2017-04-19张梅
张 梅
(中国人民武装警察部队学院边防系,河北廊坊,065000)
·水印智能鉴别·
一种适用于出入境证件中传统水印的智能鉴别算法
张 梅
(中国人民武装警察部队学院边防系,河北廊坊,065000)
本研究突破传统人工检测与鉴别出入境证件真伪的方式,提出了一种出入境证件中传统水印的智能鉴别算法。通过综合分析传统水印的产生、伪假水印图像的伪造方式和伪假特征;探索模式识别、人工智能中的图像去噪、图像均衡、区域生长等相关理论,并将其引入到水印图像的自动鉴别之中,且结合不同的伪假情形,对传统水印这一防伪特征展开自动、定量化分析和研究,提出了一个完整的水印图像鉴别算法,并且将该算法应用于实际伪假水印图像进行验证,取得了很好的鉴别效果。
传统水印;伪假;智能鉴别算法
水印[1]是指在造纸生产过程中通过改变纸浆纤维密度的方法制成的有明暗纹理的图形或文字,通常应用于国际旅行证件、流通货币、证券、发票等,具有较强的防伪性能。为了与数字水印防伪技术相区分,把在造纸过程中形成的水印称为“传统水印”。
当前,对出入境证件中传统水印的真伪比对,检查员还停留在“眼看手摸”的阶段,这种人工鉴别方式带有很大的描述性和主观性,导致鉴别结论的权威性和客观性大打折扣;并且,伴随着伪造水平的不断提高,伪造的水印图像与样本图像非常相似,容易迷惑检查员的判断。为此,本课题围绕出入境证件中传统水印的智能鉴别展开研究,通过研究图像处理、模式识别、人工智能等理论及在纸张检测中的应用[2-3],结合传统水印图像的特点,研究其智能鉴别算法,构建传统水印智能鉴别系统;并且在确保鉴别准确率的同时,提高系统的运行效率,并利用实际伪假水印图像进行验证。
1 传统水印的形成和鉴别
1.1 传统水印的产生
传统水印是机械加工的结果,根据制作原理不同,分为圆网水印和长网水印。
1.1.1 圆网水印
圆网水印是在圆网纸机成形过程中生成的,圆网是一个套在转动着的辊筒上的丝网,圆网网笼浸没在圆网网槽的纸浆中,浆料水分在圆网转动的过程中从网眼中渗透流走,从而形成湿纸幅,然后在真空箱的作用下进一步脱水。圆网水印细节制作精美,透光下观察清晰,明暗过渡自然,立体感较强,用手摸纸张有明显触感。图1为圆网水印效果。
图1 圆网水印
1.1.2 长网水印
长网水印是在长网纸机成形过程中生成的,纸浆喷到长网纸机成形网上,浆料水分通过成形网的网眼渗透脱除,这个过程中会经过一系列的案辊和真空箱,案辊的压力和真空箱的抽吸作用可以加速水分的脱除,再经安装在两组真空吸水箱之间位置上的水印辊整饰,形成水印,之后初步成形的纸张进入纸机的压榨部,进一步脱水。图2为长网水印效果。
图2 长网水印
1.2 水印伪造方式和传统鉴别方法
传统水印在造纸过程中就已经形成,并且融入了设计、雕刻、制网、抄纸等复杂的工艺,所以传统水印伪造难度较高,造假者往往不会模拟水印生产过程进行伪造,这也成为判别纸张是否伪假的重要指标。正因如此,伪造者通过一些手段来模拟水印图案产生的效果,以达到迷惑检查员的目的,常见伪假水印的方法通常有两种[4]。
一种是采用白色颜料、油性物质将水印图案印刷在纸张表面,或者印刷在纸张内层,这种伪造方法称为印刷法。印刷方法制作出的伪假水印透光下观察缺乏鲜明的对比度和层次感,在紫外光或常光下观察,肉眼可见。
对印刷法伪造的水印,传统的方法是利用紫外光、侧光、透光等光源进行鉴别。在紫外光下,真水印是没有荧光反应的,而伪造的水印图文由于使用了油墨,所以多数有明显的荧光反应。在侧光下,真水印能观察到由于纸张厚薄变化产生轻微的凹凸不平效果,而对于印刷在表面的水印图文由于表面印有油墨,所以能明显观察到油墨部分对光的反射造成的明亮区域而非凹凸效果;对于印刷于纸张内层的水印图文,侧光下,表面会十分平整,无凹凸感。在透光下,真水印图文清晰,层次分明,立体感很强。而伪造的水印图文在透光下变得模糊不清,甚至消失,而且还没有在侧光下观察到的清晰,并且图案没有层次感和立体感。图3给出了利用印刷法伪造的水印以及和真水印的对比。
图3 印刷法伪造的水印
第二种伪造方法是将纸张浸湿浸软后用手或橡皮辊压上一个图案,称之为模压法。模压法伪造出的水印与真水印最大的区别就是使用外力使纸张产生凹陷。此种方法制作的伪假水印透光下观察黯淡不清,较为模糊。
对模压法伪造的水印用侧光、透光等光源进行鉴别。在侧光下,伪造的水印图文有明显的凹陷现象,凹陷感十分明显,反而十分不自然。如果纸张在正常状态下进行模压,纸张虽被压薄了,但是纤维密度变大了,所以在透光下观察,不会有水印图文。但如果纸张经过湿化处理后进行模压,就会改变纤维的分布,在透光下可以观察到与真水印基本一致的反应,十分具有迷惑性。图4给出了利用模压法伪造的水印以及和真水印的对比。
图4 模压法伪造的水印
无论是印刷法还是模压法伪造的水印的鉴别,都是一种人工鉴别法,这种“眼看手摸”的方式带有很大的描述性和主观性,比如用“清晰、自然、立体感、凹凸感”等形容词进行鉴别,导致鉴别结论的权威性和客观性大打折扣;并且出入境证件用纸在抄造之后还会进行底纹的印刷,背景上的图案也会干扰检查员的判断;再者伴随着伪造水平的不断提高,伪造的水印图像与样本图像非常相似,比如模压法中的湿化处理,十分迷惑检查员的判断。这种传统的人工鉴别方法无法适应当前出入境证件查验的信息化、智能化发展水平。
2 基于模式识别的智能鉴别算法
由上可知,传统水印的产生实质上是通过机械力将模板上的图像转移到纸张上,水印图像在透光下能够清晰地呈现,水印图像与颜色无关,本质上是一幅灰度图像。由于外力的强度不同或者模板凹凸程度的不同,使得纸张的透光性不同,表现在水印图像上就是图像的灰度值不同。
真水印所对应的水印图像,应该是灰度值连续、边界完整的,而不管采用何种方式伪造的水印,人工鉴别中用到的“清晰、自然”等词汇,表现在水印图像上恰恰是灰度值不连续,边界不完整。进一步地,如果能将水印灰度图像进行量化,用图像处理的方法分析灰度值的连续性以及边界的完整性,那么,就可以实现传统水印的智能鉴别。下面介绍一种传统水印的智能鉴别算法。
2.1 水印图像的采集
高精度的水印灰度图像是进行智能鉴别的基础。灰度图像需要经过专业的检验设备,在透射光源的照射下,按照一定的标准进行采集才能获得,并且为了尽可能地去除底纹印刷的干扰,通常在光源前放置滤色片。由于不需要水印的颜色信息,所以经过采集得到的是水印的8 bit灰度图像。
2.2 图像预处理
采集后的灰度图像是数字图像,此时的图像往往不能直接进行鉴别,原因有以下3点。
第一,由于受到采集环境光照、硬件设备震动等因素的干扰,并且纸张表面的纤维丝也会混入到灰度图像中,将这些不希望出现在水印图像中的信息统称为噪声污染,为了提高鉴别的准确率,首先要对待鉴别的图像进行降噪处理。
第二,由于每次采集所选取的位置不同,必然存在水平和垂直方向上的平移,并且由于证件放置的角度问题,可能存在水印图像旋转的问题,这些都会导致两幅水印图像之间存在位置上的差异,使得像素位置不匹配,为了解决图像间的位置差异,在鉴别之前必须进行配准处理。
第三,在透光照射和摄像机采集的过程中,可能由于光照过强(或过弱)以及曝光过度(或不足)的影响,导致所采集的灰度图像对比度不足,致使细节信息被隐藏,为了增强图像的对比度,增加图像的动态范围,在鉴别之前往往先进行图像的增强处理。
以上3个原因就要求首先进行图像的预处理,使得水印图像之间具有客观可比性,才能进行接下来的鉴别,本课题是对传统水印的智能鉴别算法初探,所以采用比较简单的预处理算法进行尝试。比如采用中值滤波算法[5]去除图像中的噪声,采用特征匹配算法[6]进行图像配准,采用直方图均衡算法[7]进行图像增强,下面对各算法分别进行简单介绍。
2.2.1 中值滤波算法
(1)
2.2.2 特征匹配算法
图像配准是将待鉴别的两幅图像在空间位置上对准,主要是对存在错位、偏移或尺度变化的图像进行适当的调整。使两幅图像的点准确对应,并且对应于同一空间位置。
特征配准方法主要包含两个步骤:第一步,选取特征点,并计算出变换参数,由于SIFT算法对图像旋转、平移、缩放等变换具有很强的鲁棒性,是图像配置领域的研究热点,本课题通过SIFT算法将两幅图像上的特征点一一对应,并且根据特征点之间的匹配关系求解待配准图像之间的变换参数。第二步,完成图像配准,由于正向映射法存在无法赋值的问题,所以经常采用反向映射法完成图像的配置过程,即完成灰度赋值。在反向映射法中,由于求解出的原始图像上的坐标可能是浮点型,所以通常采用原始图像上该点某领域范围内的点经过插值获得配准后的灰度值。本课题采用双线性插值法。图5中,通过参数计算,配准后的灰度值等于原始图像上坐标位置P的数值,但是由于坐标的整数特性,实际上这个位置并不存在,但是可以用距离P最近的4个点A、B、C、D的灰度值采用公式(2)求解得到P点的灰度值。
Ip=(1-Δi)(1-Δj)IA+(1-Δi)ΔjIB+Δi(1-Δj)IC+ΔiΔjID
(2)
式中,Ip、IA、IB、IC、ID分别对应各点的灰度值,Δi、Δj分别表示P点到水平和垂直方向的距离。
2.2.3 直方图均衡算法
为了将图像的灰度范围拉伸,并且将灰度频率较小的灰度级变大,让灰度直方图在较大的动态范围内趋向一致。对于采集后的数字图像,像素个数为N,灰度级个数为L(8 bit量化下,L=256),第k级灰度级出现的次数为nk,则第k级灰度等级出现的概率为:
(3)
那么均衡后第k级的灰度值Ik为:
(4)
经过直方图均衡,各灰度等级的比例更加平衡,细节突出。
图7 采集后水印图像
2.3 区域生长
区域生长[7]算法可以很好地将水印图像从背景底纹中分割出来,实现水印图像的二值化,通过观察边界完整性和边界走向,对水印图像进行鉴别。
区域生长的基本思想是以初始种子点为核心,按照一定的生长规则,不断将周围领域内符合条件的像素点添加进来,直至遍历所有像素点。本课题采用灰度准则,即首先选定水印图像内一组种子点,以第一个种子点为中心,计算其与领域内各像素点的灰度差,如果差值小于阈值,则将当前像素点添加到区域内,并且定义为新的种子点,直至遍历完全部种子点的领域以及全部像素点,区域生长停止。
最后给出传统水印智能鉴别算法的完整流程图,如图6所示。
图6 水印智能鉴别算法流程
3 实验数据验证
下面用实际数据对上文提出的传统水印智能算法进行验证。表1给出了水印图像采集的设备和参数。
采集后得到的水印图像如图7所示。
表1 水印图像采集参数
图8 中值滤波后结果
图9 特征配准后结果
图10 直方图增强后结果
图11 区域生长后结果
采用中值滤波后的图像如图8所示,由此可见,图像效果得到一定的改善。
对中值滤波后的图像进行配准,得到图9,可见配准后的图像上的点满足亚像素级的一一对应。
然后进行直方图均衡,得到图10。
接下来进行区域生长算法,得到图11。
由图11可以很直观地得出检材水印图像是伪假的,由此验证了本课题提出的算法具有很好的鉴别效果。
4 结 语
本课题提出了一种出入境证件中传统水印的智能鉴别算法,突破了传统的水印鉴别方式,极大地完善了证件查验的理论与方法。由于水印图像亦符合数字化图像的本质特征,所以可以将图像处理、模式识别、人工智能等相关理论引入到水印图像的自动鉴别之中,并且结合不同的伪假情形,对传统水印这一防伪特征展开自动的、定量化的分析和研究,从一个全新的角度拓宽了证件查验的理论与方法。
证件的智能化鉴别是新形势、新任务下对边检机关证件查验工作提出的新要求,也是边检一线证件查验工作随着科技进步的必然结果,构建综合的证件智能鉴别平台,是公安边防机关信息化建设的重要方面。本课题证件智能鉴别系统的预研,既丰富了证件鉴别内容,又推动了边检机关证件查验工作智能化水平的发展,是信息化建设在公安边防证件查验领域里的大势所趋、大势所向。
[1] Huo Dan. The Manufacture and Characteristic of Watermark paper[J]. Shanghai Paper Making, 2011, 42(6): 32. 霍 丹. 水印纸的生产及其特征[J]. 华东纸业, 2011, 42(6): 32.
[2] CAI Chen-yun, LI Qi[J]. Paper Whiteness Measurement based on the Digital Image Process[J]. China Pulp & Paper, 2007, 26(3): 67. 蔡陈赟, 李 颀. 基于数字图像处理的纸张白度测量法[J]. 中国造纸, 2007, 26(3): 67.
[3] YANG Bo, ZHOU Qiang, ZHANG Gang-qiang. Study on Algorithm of Paper Defect Detection Based on Geometric and Gray Feature[J]. China Pulp & Paper, 2011, 30(9): 50. 杨 波, 周 强, 张刚强. 基于几何及灰度特征的纸病检测算法研究[J]. 中国造纸, 2011, 30(9): 50.
[4] Sun Huaqing, Liang Luning, Zhang Lingfei, et al. Analysis on watermark characteristics of counterfeit RMB currency[J]. Forensic Science and Technology, 2012, 37(5): 15. 孙华清, 梁鲁宁, 张翎飞, 等. 伪造2005版100元人命币水印特征初探[J]. 刑事技术, 2012, 37(5): 15.
[5] Yu Yanfei, Zheng Quan, Wang Song, et al. Image noise detection technology based on spatial domain[J]. Journal of Computer Applica-
tions, 2012, 32(6): 1552. 余燕飞, 郑 烇, 王 嵩,等.基于空间域的图像噪声监测技术[J]. 计算机应用, 2012, 32(6): 1552.
[6] Jeffrey S Beis, Lowe DG. Shape Indexing Using Approximate Nearest-Neighbor Search in High Dimensional Space[C]//Proceedings of the IEEE Computer Society Conference on Computer Vision and Pattern Recognition, 1997.
(责任编辑:刘振华)
An Intelligence Identify Algorithm Used for the Traditional Watermark Images on the Exit-Entry Documents
ZHANG Mei
(BorderControlDepartment,TheChinesePeople’sArmedPoliceForcesAcademy,Langfang,HeibeiProvince, 065000)
(*E-mail: 15501000805@163.com)
In order to break through the traditional manual method for identification of the exit-entry documents an intelligence and automatic identify platform of the exit-entry documents, an Intelligence Identify Algorithms used for the Traditional Watermark Images was studied in this paper. The produce of the traditional watermark and its forging method and characteristic were discussed. The theory of image denoising, image equalization and regional production in the pattern recognition and the artificial intelligence area were explored, finally a complete identify algorithm was proposed. This algorithm was validated by the real fake watermark images, and indicating its superior performance.
traditional watermark; forging; intelligence identify algorithm
张 梅女士,博士,讲师;主要从事出入境证件安全、出入境智能管控以及出入境信息分析等领域的研究。
2016- 10- 08(修改稿)
TS761.4;TP18
A
10.11980/j.issn.0254- 508X.2017.03.010
本课题获武警学院博士科研创新计划(BSKY201510)资助。