APP下载

融合防伪线的高仿圆形印章配准与鉴别研究

2022-03-03何文孝

内江师范学院学报 2022年2期
关键词:角点防伪印迹

文 琴, 何文孝

(内江师范学院 人工智能学院, 四川 内江 641100)

0 引言

印章在我国被广泛地使用,比如在招标、合同签订等场合有着非常重要的作用,它是具有法律效力的.一旦印章被不法分子私刻盗用,将会对个人或企业带来非常大的影响.因此印迹的鉴别技术在生活中发挥着很重要的作用,例如企业到银行进行重大业务办理,银行都会对企业的印迹进行鉴别.

针对印迹的鉴别,国内外有不少的学者进行了研究,梁吉胜等[1]提出以所设计的辐射状模板为核心的圆形印章配准方法,该方法使用不同频率的辐射状模板分别与预留印章和待检验印章进行卷积运算,将其运算结果作为准则函数设计的依据,但当印迹不完整时效果不理想.Tingting等[2]针对历史印章中的文字提出使用概率分布和决策树来提取印章中的字符.Cheng等[3]使用K-means聚类算法和局部阈值技术将印记与背景区域区分开,再去除最近邻分类器噪声.Li等[4]提出使用双密度二元树小波变换提取印迹特征.这些研究均能较好的提取印章的特征,但这些提取印章特征的方式在一定程度上忽略了防伪线的存在.Jin等[5]提出了基于SIFT的印章图像配准与鉴别,该方法采用SIFT算法提取关键点,采用随机样本一致性RANSAC算法和最小二乘法LSM得到变换矩阵,实现了印章的精确配准,然后基于残差图像提取不变特征,最后结合常规贝叶斯分类器NBC、K近邻分类器K-NN和支持向量机(SVM)对特征向量进行分类.Jin等[6]提出了一种基于SIFT(Scale-Invariant Feature Transform,尺度不变特征变换)特征的印鉴配准算法,为印鉴验证,特别是高质量假冒样品印鉴的验证做好了准备,其将匹配的SIFT特征之间的相似性和空间关系结合起来进行印章图像配准,根据二值模型印章图像和样本印章图像的相似性,对提取的SIFT特征进行匹配.Zhu等[7]设计了一种基于SIFT-SVM的嵌入式印章印记识别系统,使用SIFT提取印章特征.但SIFT算法时间复杂度高、算法耗时长.葛盼盼等[8]根据 Harris和SURF算法具备的特点,提出了一种新的遥感图像匹配算法,其算法主要是通过Harris 角点检测算法得到图像焦点和采用SURF 算法提取图像特征点,由此优化了遥感图像配准,但是该优化算法使用的合并方式增加配准点数量,因此其对噪声的过滤还有待提升.Liang等[9]提出将圆形区域转换为矩形区域的圆形印章对齐方法进行鉴别,但该方法对于印迹噪声比较多时错误率比较高.宋成璐[10]针对印鉴提取与识别的研究,提出采用先膨胀后腐蚀的方式对印迹进行修复.姚敏等[11]针对印章的检测定位与识别问题进行了研究,提出通过形态学的闭操作将待测印章中的噪声去除并恢复部分字迹,但这样的修复会影响防伪线的真实性,对印迹的鉴别带来影响.

通过对现有的印迹鉴别技术和计算机图形自动化鉴别技术的研究,发现现有的鉴别技术在针对高仿印章鉴别时鉴别率不高,经过对印章的制作的了解,发现每一枚印章都会由一条或多条防伪线将印章边框分割成不同的圆弧段.从这个点出发,本文提出将防伪线作为印章鉴别的重要特征,印章防伪线如图1所示.

图1 印章防伪线

由于印章和纸张的不光滑,印迹将会产生很多的空隙,这些空隙形成的镂空形状是无效特征,将会误导特征点的提取,增加计算量.印迹的有效特征点主要集中在轮廓的转角处,因此首先读取图形进行HSI色彩模型提取、去噪处理,然后通过Canny边缘检测算法的双阀值提取算法,提取出印迹的外围轮廓,再通过Harris检测角点,SURF进行特征点筛选,筛选时以Harris为中心建立4*4的搜索范围,可以加速生产特征描述.最后使用RANSAC算法进一步的优化配准效率.配准后在进行印迹的鉴别时将防伪线的作用利用起来,防伪线将印章圆形边框分为了不等的多段,因此本文鉴别时,在原有的鉴别基础上增加了对比分段数量和每段的差值来提高鉴别准确率.本文对圆形印章进行配准与鉴别的方法的核心流程如图2所示.

图2 圆形印章配准与鉴别核心流程

1 印迹预处理

高仿圆形印章印迹的预处理过程:1)首先利用HSI色彩模型对印迹进行提取;2)为了得到较完整的印迹,将圆形印章印迹进行分割修复,即利用改进的图像分割去噪方法对印迹进行二次处理.

1.1 HSI颜色模型提取

图像读取采用的是三原色光模式(RGB color model),即RGB(红绿蓝)颜色模型.是一种将所有的颜色看成由三种基础按照不同的系数进行叠加而形成的加色模型.而印迹作为印盖后形成的图案,它会因为受力的不均匀或纸张的不平整,出现颜色的有浅有深,人眼是很难给定RGB的各通道的提取阀值.由于HSI[12](Hue-Saturation-Intensity)数字图像模型比RGB颜色模型更符合眼睛对色彩的分辨情况,因此,本文选取HSI模型对圆形印章印盖后形成的图案进行转换,即转换为颜色模型进行提取.

1.2 改进的图像分割去噪方法

传统的形态学闭运算虽然去噪效果比较好,但是该算法会将防伪分割的线段去掉,这直接影响了最后的鉴别结果.因为在国家制定的印章机构中,申请的印章都是有防伪线,几乎所有的印章的防伪线都是不一样的,所以防伪线对于印迹的鉴别是很重要的.因此本文提出了一种改进的图像分割去噪方法.

改进的图像分割去噪方法步骤:

Step01:Otsu算法二值化.利用Otsu算法设定最佳阈值,将在阈值中的像素值变为1,在阈值外的像素值变为0.

Step02:确定印迹的中心点.

Step03:以中心建立坐标系,从0°开始,每45°建立扫描方向进行边框扫描,以得到圆形印章的印迹外围轮廓信息,即外围圆形轮廓信息.

Step04: 将印章外围轮廓和文字进行分割.通过步骤3扫描得到外围轮廓厚度信息,对圆形印章的印迹进行分割,即将印迹的外围圆形轮廓和内部文字分开

Step05:利用防伪线将外围轮廓进行分段.对步骤4分割后的圆形外围轮廓,沿顺时针方向进行分割扫描,以得到防伪线的位置,通过防伪线将圆形外围轮廓进行分段.

Step06:对分段后的圆形轮廓进行插值修复、对分割的文字部分进行先膨胀后腐蚀修复.

Step07:最后将修复得到的圆形轮廓和内部文字进行合并,得到较完整的印迹.

该算法首先对HSI模型提取的印迹进行二值化,然后通过步骤2获取到圆心(u,v)以及圆的半径.获得圆心和半径之后,以圆心为原点建立笛卡儿坐标系进行扫描以获得圆形轮廓信息,其中轮廓的厚度d通过预留的参考印模可以得到,如图3所示.

图3 印迹轮廓分割圆弧计算示意图

最后由外向内进行修复,每个像素点分为一层.这里举例圆形印章的修复方式,圆形的标准方程为(x-u)2+(y-v)2=r2,以圆心为原点则有x2+y2=r2,假设印迹轮廓的一个分割圆弧最外层的开始像素点为(x0,y0),结束像素点为(x1,y1) ,如图3所示,那么以原点到待修复的点的连线与X轴做直角三角形,则有修复的函数如公式(1),其中点(x,y)为修复的圆弧段,并且x=rcosθ,y=rsinθ.

2 印迹配准与鉴别算法

2.1 Canny边缘提取

Canny为了得到防伪线有关的准确信息,需要对印迹进行边缘提取.而Canny边缘检测作为边缘检测算法中比较优秀的算法,被广泛地用于图像的边缘提取,因此选择Canny算法作为印迹边缘提取算法.Canny边缘检测算法主要由四个步骤组成:

Step01:使用高斯滤波进行边缘平滑去噪,通过高斯函数后的像素点的灰度为:

Step02:计算梯度值和梯度方向,通过点乘一个sobel或其他算子得到不同方向的梯度值gx(m,n) ,gy(m,n).综合梯度通过以下公式(3)计算梯度值和梯度方向:

(3)

Step03:保留极大值,通过计算每个像素点的梯度保留极大值,对于不是极大值的舍弃,判别表达式如公式(4):

(4)

Step04:双阈值(Double Thresholding),设置两个阀值(threshold),分别为minVal和maxVal.凡是大于maxVal的保留,小于minVal的丢弃,另外从maxVal出发,连续且大于minVal的也保留.

推荐的阀值高低通道的值的比例最好为3∶1或2∶1,经过大量的实验,本文设置的是maxVal=240,minVal=80效果比较好.

2.2 基于HSURF的印迹配准算法

由于圆形印章的印迹鉴别与其他的复杂图像有所区别,圆形印章的印迹是一种比较简单的线条结构图像,其色彩单一,人眼的鉴别主要是通过其轮廓形状进行对比,而轮廓的对比首先就是对准防伪线,因此防伪线作为印迹的重要识别存在.防伪线的体现就在外围轮廓的缺口,缺口的特征主要是被分割的线形成的四个角.通常人类在对一些比较细微的纹理进行观察时,都会使用放大镜进行逐步查看,而Harris角点检测算法正是模仿人类的方式,通过建立小的窗口对对象进行扫描,随着窗口的移动,看到通过窗口观察的灰度值也随之变化.因此,利用Harris角点检测算法检测圆形印章印迹的角点.

此外,印迹的鉴别中尺度也是非常关键的信息,为此,我们必须要考虑尺度不变特征检测,SURF和SIFT都具有此特性,但SURF[13]用盒子滤波器替换了高斯滤波,使得其运行效率有了很大的提升,因此本文考虑结合Harris和SURF(即HSURF算法)实现圆形印章的印迹特征匹配.首先利用Harris角点检测出的角点作为滤波器扫描中心,再通过减小SURF的搜索范围,将3*3的滤波器扫描范围固定到以Harris角点为中心的4*4的范围内进行特征点定位,这可以快速地得到既有Harris特点又有SURF特点的特征点.

智能电网的发展要立足国家能源战略,结合我国能源资源禀赋和技术发展水平,并要充分考虑未来电网的发展趋势和形态特征,解决能源电力领域的核心问题。

HSURF算法步骤如下:

Step01:在2.1章节Canny算法提取的边缘轮廓基础上,利用Harris算法提取印迹角点.假设图像I(x,y),窗口从点(x,y)处移动了(Δx,Δy),那么灰度函数E(Δx,Δy)如公式(5)所示:

(5)

公式中的w(x,y)就是以点(x,y)为中心的窗口,I(x+Δx,y+Δy) 表示平移后的灰度值,I(x,y)表示自身灰度值.由泰勒展开对图像平移后做一阶近似,如公式(6)所示:

I(x+Δx,v+Δy)≈I(x,y)+Ix(x,y)Δx+Iy(x,y)Δy.

(6)

其中Ix,Iy为图像I(x,y)的偏导数,将I(x+Δx,y+Δy)带入E(Δx,Δy),可化简得到公式:

(7)

E(Δx,Δy)≅AΔx2+2CΔxΔy+BΔy2.

(8)

Harris定义角点响应函数即R=Det(M)-k×trace(M)×trace(M),其中Det(M)为矩阵M的行列式;trance(M)为矩阵M的直迹;k为经验常数0.04~0.06[14]定义当R>threshold时且为局部极大值的点时,定义为角点.

本文在仿真实验时使用的k是0.04,经过Harris 角点检测后可以提取特征角点,本文对于每一个像素(x,y)在3*3邻域内,计算2*2梯度的协方差矩阵.

Step02:极值点检测.利用SURF[15-16]提取印迹特征点,像素点极值的检测是通过计算Hessian矩阵的行列式进行判定,判定将每个像素点与周围的点进行比较,Hessian矩阵的判别式为:

(9)

在Hessian矩阵构造前,使用二阶标准高斯函数作为滤波器进行高斯滤波,可以让得到的特征点具备尺度无关性,经过高斯滤波的Hessian矩阵式如公式:

L(x,t)=G(t)·I(x,t).

(10)

通过卷积计算二阶偏导数,得出H矩阵的三个矩阵元素Lxx,Lxy,Lyy,从而计算出H矩阵,在点x处,尺度为σ的Hessian矩阵H(x,σ)定义如下[17]:

(11)

为进一步优化,使用盒状模糊滤波求高斯模糊近似值.其中每个像素的Hessian矩阵行列式的近似值如公式:

det(H)=Dxx×Dyy-(0.9×Dxy)2.

(12)

式中Dxx、Dxy和Dyy表示模板与图像进行卷积的结果,0.9(这是一个经验值)为滤波器响应的相关权重,目的是为了平衡因使用盒式滤波器近似所带来的误差.

Step03:以Harris提取的角点为中心建立4*4的搜索范围对SURF算法特征点进行筛选.

Step04:确定特征点主方向.由于印迹的配准需要有旋转性,为实现旋转不变性,计算扇形窗口内的图像的水平方向的Harr小波响应值dx和垂直方向的响应值dy,然后进行累加得到一个矢量(mw,θw):

(13)

(14)

最大Harr响应值累加所对应的方向即为主方向,也就是最长矢量所对应的方向[18],其公式如式(15):

θ=θw|max{mw}.

(15)

Step05:构建描述子向量.以特征点为中心取一个正方形的特征描述范围,正方形的宽度为框的边长为20s(s特征点所在的尺度).每个正方形描述都是有个主方向,这个主方向和step04得到的一致.将正方形区域划分为4×4个子块和垂直方向的Haar[19]小波特性,然后对响应值进行统计∑dx、∑|dx|、∑dy、∑|dy|形成特征矢量[20].

Step06:特征点匹配.

Step07:利用RANSAC方法剔除错误匹配点,然后进行仿射变换.仿射变换是将已知的两幅图中对应的点(x,y) ,(x′,y′) 通过旋转、变尺度、斜率的变换调整到同一位置.仿射变换关系如式:

(16)

仿射变化包含典型的图像几何变化,而图像的几何变换可能改变坐标系,而雅可比行列式J提供变换信息[21],如果图像的面积在几何变化作用下仍然具有不变性,则J=1,否则J=0.

(17)

仿射变化后得到的图像,采用多种相似度算法和分割鉴别算法进行融合鉴别.

2.3 鉴别方法

首先鉴别方法的优化主要是将传统的算法对比和印迹边框分割对比结合起来,即在传统算法中增加防伪线进行验证,以提高鉴别正确率.因为传统方式主要是鉴别灰度和通道的相似度,即通过均值哈希算法、差值哈希算法、感知哈希算法、三直方图算法、单通道的直方图算法分别计算相似度,通过每个算法设定阀值进行判断,一旦有低于阀值就判断为可疑印迹.而现在的仿制计算很发达,印迹的相似度很高,增加防伪线作为验证可以很大程度提升鉴别的准确率.本文主要是对防伪线分割的边框进行数量和局部对比,内部文字采用传统方法,以提高正确率.

3 实验结果分析

本文采用的实验数据为成都持有特种行业许可证的正规印章制作公司提供的测试用章8枚,其中一枚为真实印章,其余7枚为高仿印章,高仿印章主要是在印章的防伪线、印章的大小等地方做了部分的调整.每一枚印章分别模仿了不同的纸张、不同的力度等方式印了1000个印迹,实验总共拥有8000个印迹用于测试.待测印迹的采集使用的是CanoScan LIDE300扫描仪进行扫描得到的,印迹图片的分辨率为600dpi,保留的真实的印模是使用金雕软件雕刻制作的,雕刻模形分辨率为96dpi.实验的仿真软件为Python3.7、OpenCV 3.4.2、Windows 10专业版 (64位操作系统,基于x64的处理器),硬件设备为处理器Intel(R) Core(TM) i5-4210M CPU @ 2.60GHz 、内存(RAM)8.00G,开发工具PyCharm Community 2019.1.

3.1 验证优化去燥算法的高效性

本实验主要验证本文提出的去噪算法对Harris算法提取角点的效率是否有提升.实验内容为比较经过图像去噪算法后提取Harris 角点的效率和传统腐蚀方法去噪提取Harris角点的效率.为了验证这点,实验对比了三种方式提取印迹的效率和时间,分别为直接提取的印迹、经过先膨胀后腐蚀的印迹、本文提出分割修复后的印迹进行实验分组.

如图4所示, source image为HSI模型提取的印迹,OTSU为该实验直接提取印章印迹,Closing为图像形态学闭运算即先膨胀后腐蚀印章印迹,Segmentation为优化的分割去燥算法得到的印章印迹.

图4 去噪算法对比图

图5 直接提取的印迹提取Harris角点

图6 先膨胀后腐蚀后的印迹提取Harris角点

图7 本文优化后的印迹提取Harris角点

通过对比形态学闭运算与优化的分割去燥算法可得出,经过本文优化的分割去噪算法得到的图像轮廓饱满无镂空噪点.然后,分别将这三种印迹进行Harris角点提取,三种方式进行Harris角点提取后的对比实验结果如图5、图6、图7所示.实验数据对比结果如表1所示.

表1 Harris角点提取

通过分析实验数据,可以看出经过本文去噪算法处理后的印迹,再通过Harris算法提取角点时速度和质量都有所提高.通过图5、图6、图7可以看出本文去噪算法处理后的印迹的角点的有效性较高,主要是减少了很多外围边框的噪声角点,保留了防伪线分割特征角点,这样为后面SURF算法提取特征点提供了较好的搜索范围.因此实验证明本文改进去噪算法是有效可行的.

3.2 验证HSURF的印迹配准算法有效性

本实验主要验证HSURF算法的有效性,即验证本文Harris-SURF算法混合使用的性能;本实验验证分别仿真使用SIFT算法进行配准、SURF算法配准、本文算法进行配准.图8-10分别为SIFT算法、SURF算法和本文配准算法的仿真实验特征点配准连线的图,图中的连线为配准后的两点的连线.通过对比可以看出SIFT算法得到了匹配点的数量很少,将会影响配准的准确率;SURF算法得到的匹配点非常多,很多水平的线段都是错误匹配,将会加大配准时间消耗;本文算法得到的匹配点基于两者之间而且匹配点的准确率较高.通过100组仿真实验,得到如表2所示的实验数据以及图11的性能对比图.

图8 SIFT算法经RANSAC过滤后特征点配准

图9 SURF算法经RANSAC过滤后特征点配准

图10 本文算法经RANSAC过滤后特征点配准

表2 特征匹配算法比较

图11为三种算法在不同算法配准的正确匹配率的对比图.当旋转角度变化时,三种算法的正确匹配率也会随之改变.由图11可以看出,当角度不断增加时,三种算法的正确匹配率都在下降.但是从中可以看出SIFT算法的下降速度最快,本文算法是最稳定下降且最平缓.SIFT下降快主要是其对圆形光滑图形提取的特征少,仿射变化角度大则正确匹配率就低了.本文提出的算法结合了Harris算法的高稳定性和SURF算法的旋转不变性,使得算法具有了高可用性.

图11 三种算法正确匹配率对比

3.3 验证改进鉴别方法的准确率

实验内容为比较采用相识度对比验证和采用本文在其相识度对比算法中增加防伪线验证的效率.本文的鉴别算法与传统相似度对比方法进行40次鉴别.其中图12为高仿待测印迹与留档真实印模.表3是由这2类印章仿真实验后的时间和准确率,对这2类印章分别采用传统的即采用相识度方法进行鉴别,和采用本文在传统方法中增加防伪线进行鉴别.

图12 高仿待测印迹与留档真实印模

如图12左边为高仿待检测印迹,右边为留档真实印模.

表3 不同等级的仿制印章鉴别方法比较

通过表3可以看出,传统方法在时间消耗上比本文方法略有优势,但是针对高仿印章的鉴别准确率却很低.而使用本文提出的算法即增加防伪线的方法,其鉴别准确率对于高仿有较大的提高.

表4为高仿待测印章采用传统鉴别方法(均值哈希算法、差值哈希算法、感知哈希算法、三直方图算法、单通道的直方图算法)和采用本文增加防伪线进行鉴别时,检测值和阈值的情况以及最终对印章的判定结果.

表4 印迹鉴别算法比较

表4中阈值分为两种,一种是百分比,另外一种是数值个数.百分比的阈值是对每种算法进行了多次测试,经过分析得到每种算法的鉴别阈值.数值个数有两种,一种是轮廓防伪线数量为圆形印章圆形轮廓上防伪线的数量.轮廓防伪线分段数量即为圆形印章的圆形轮廓上由防伪线分割出的轮廓分段数量,都是通过人工预设每个印章的真实分段数量,这数量是一个准确值.通过数据我们可以看出,采用传统相似度方法进行鉴别时相似度都很高,即判断该高仿印章为真实印章,我们通过肉眼进行观察时也很难分别是否为真实印章.但是增加防伪线后,即增加轮廓防伪线数量和轮廓防伪线分段数量后,就可以很清楚的可以看出印章的不同,因此判定该印章不是真实印章.因此在针对高仿印章进行鉴别时,防伪线的使用是非常有效.

4 结束语

本文针对高仿圆形印章配准与鉴别难的情况,从印章的防伪线入手提出了一种基于Canny和HSURF 算法的配准与鉴别方法,同时对图像去噪算法和HSURF算法进行优化改进,最后利用防伪线分割外围轮廓的特点,对外围轮廓进行分段比较以提升鉴别的准确性.实验表明,利用优化后的去噪算法处理的印迹,再通过Harris算法提取角点时速度和质量都有所提高;利用HSURF算法在进行特征点配准连线时更加合理.在鉴别时通过防伪线分割的圆弧数量和每段的差值对比方法,可以有效地提高鉴别准确率.因此,对高仿印章进行鉴别时,本文的算法相比于传统的配准与鉴别算法,在准确率、效率、可用性、性能等方面都有很大的提升.本文研究的方法已经应用于四川电子印章平台实物印章一体化平台,并且使用效果良好.后续将采用人工智能方式提高去燥分割算法的准确率和优化鉴别算法的阈值.

猜你喜欢

角点防伪印迹
马 浩
INTEGRITYTM ECO100再生缝纫线引入防伪技术
走进大美滇西·探寻红色印迹
你知道古代圣旨和纸钞是怎样防伪的吗
成长印迹
基于FAST角点检测算法上对Y型与X型角点的检测
基于边缘的角点分类和描述算法
基于圆环模板的改进Harris角点检测算法
河北省高速公路通行卡信息防伪解决方案
印迹