APP下载

金融票据混沌水印加密算法研究与实现*

2017-11-03孙彦景

电子器件 2017年5期
关键词:加密算法票据关键

陶 锐,孙彦景

(中国矿业大学,江苏省煤矿电气与自动化工程实验室,江苏 徐州 210046)

金融票据混沌水印加密算法研究与实现*

陶 锐,孙彦景*

(中国矿业大学,江苏省煤矿电气与自动化工程实验室,江苏 徐州 210046)

针对金融票据关键信息内容的认证,提出了一种基于混沌水印的加密方法。对关键的数字信息,采用双重水印加密方法,对金融票据进行可见水印和不可见水印的双重加密,提高了信息安全程度。实验结果显示,利用混沌加密算法进行的票据认证,具有较高的实用价值,能有效提高金融系统的安全性。

混沌水印;信息隐藏;票据认证

数字水印是一种特殊的信息隐藏技术,票据数字图像中嵌入防篡改水印,即是一种以数字图像为载体的信息隐藏技术。自1994年Schyndel等人[1]发表了有关数字水印的文章以来,越来越多的研究者开始关注数字水印技术的研究。近年来,混沌数字水印成为了国际学术界兴起的一个前沿研究领域。

国内外研究者对混沌数字水印的研究可以归纳为混沌序列、混沌映射和混沌系统等3个角度[2]。混沌序列具有足够长的周期及良好的随机数统计特性,因此诸多研究者围绕混沌序列的生成方式及其非线性特性进行了研究,将其引入数字水印领域,显示出了混沌水印的诸多优良性能[3]。然而,随着研究的深入,人们发现数字化后的混沌系统普遍存在有限精度下的动力学特征退化[4],从而使得系统进入短周期轨道。这种有限精度下的短周期行为严重破坏了混沌序列的随机数特征,导致其统计学特性变弱,相应的密钥空间缩小。在基于混沌序列的数字水印系统之上,研究者们结合混沌映射[5],将其初值作为私有密钥,能够在一定程度上克服有限字长效应的影响和提高数字水印算法抵抗群举攻击的性能。从改善混沌系统结构的角度进行分析,研究者提出了多个混沌系统的混合叠加方法[6],提高了水印的安全性。

本文针对金融票据中的敏感信息,利用图像局部特征和深度神经网络,设计了对关键区域的检测定位系统,比较了现有的图像内容定位算法。提出了针对关键区域的混沌水印加密方法,有效的防止了对关键信息的篡改,提高了票据认证的安全性和效率。针对金融诈骗的预防,我们采用可见水印和不可见水印进行多重的信息保护。结合票据关键区域,所提出的多重水印加密方法,能够在票据认证的同时,显示票据的来源等属性,提高了票据的安全性,适合在实际金融认证系统中便捷的推广使用。

1 混沌水印加密算法

混沌是一种表面上无规则、杂乱的实际上则是由内在运动规律的现象。混沌的这种特性,使它天然的非常适合密码学算法的设计。混沌加密和传统加密算法的差别主要是:密码系统在有限离散集内,混沌系统处在连续的实数集合内。表1给出了传统加密算法与混沌加密算法的异同。

表1 混沌加密算法与传统加密算法的比较

基于混沌序列的加密方法如图1和图2所示,通过混沌序列对初值的极度敏感,可以达到较好的不可逆性。通过对序列输出值和明文的加密运算,能够有效的对明文进行置乱,达到加密的效果。

图2 基于混沌序列的解密过程

图1 基于混沌序列的加密过程

2 基于关键区域定位的多重水印加密

本文中,我们重点研究了金融票据中的关键区域定位与加密问题,如图3所示。在金融票据中,包含了需要重点保护的关键区域,例如金额、前面、日期等。这些区域比其他的一些背景纹理图案,具有更加关键的作用。以往的水印加密算法,并不能对图像的内容进行识别与区分,对重点区域无法进行重点保护。我们通过对图像纹理形状特征的提取,采用机器学习中的目标检测技术,对关键区域进行定位,进而采用多重数字水印进行加密。

图3 票据图像的混沌加密与关键区域定位

2.1 图像关键区域的预处理

票据的原始图像如图4所示,其中包含了文字和阿拉伯数字信息,以及印章图案信息。对其进行预处理,通过编译提取可以获得其中的像素梯度变化的关键信息,如图5所示。采用轮廓提取的方法,我们进一步可以将连通的区域区分出来,如图6所示,不同的彩色边缘代表不同的轮廓拓扑结构。各个轮廓的中心点,由白色圆形标出,代表了这幅票据图像中关键信息的分布区域,不同的票据具有特有的关键信息位置分布,如图7所示。在本文中,我们将对这些关键区域进行定位检查,以重点保护金融票据中的数值信息,防篡改的发生。

图5 关键区域定位中的自适应预处理步骤

图4 关键区域定位的票据样张

图6 关键区域的轮廓信息提取与标注

图7 关键区域的全局中心点位置自动标注

2.2 图像关键区域的检测

在实际应用中,数字是非常关键的信息,是最容易遭到篡改的目标。因此,对数值区域图像的检测与定位,具有非常广泛的应用价值。诸多计算机视觉与人工智能的算法都可以应用到这个领域中[7-11]。通常需要包含特征提取与 训练建模两个步骤。

我们采用一种非常有效的翻转不变SIFT特征(Scale-Invariant Feature Transform)[12],进行图像特征点的分析。通过模板匹配[13]、神经网络和支持向量机3种算法可以实现对模板的识别。模板匹配(Template Matching)可以通过式(1)实现:

(1)

式中:T为模板,F为目标区域。目标区域的灰度值的变化,会显著的影响相关运算的结果。其尺寸大小亦是一个重要的影响参数,我们进一步考虑参数的规整化,可以得到:

(2)

式中:E是图像灰度值的数学期望。通过一个滑动窗口,我们可以实现对金融票据图像区域的模板匹配。

除了模板匹配外,图像内容的检测算法,可以通过机器学习算法实现。其中需要对正性样本和负性样本的建模训练。将包含关键信息区域的图像作为正性样本,将包含背景区域的图像作为负性样本。在获得训练数据后,我们对图像进行尺寸的归一化预处理。在提取图像的翻转不变SIFT特征后,得到固定长度的特征向量。然后采用深度神经网络(Deep Neural Network)进行训练。

(3)

式中:zi(vl)=(wl)Tvl+al。w是权重向量,a是偏置向量。神经网络的输出层对后验概率进行最终的计算:

(4)

2.3 多重数字水印加密

在本文中,我们提出一种利用可见水印和不可见水印的多重加密方法,能够达到对金融票据来源信息的标识和对篡改的定位检测。未授权方即便截获了电子票据,由于可见水印的版权效果,对关键信息的恶意篡改无法隐藏原有票据的来源、版权等信息,提高了电子票据在金融领域的安全性。在保护敏感信息的同时,对篡改定位和票据防伪的认证通过不可见水印进行。

我们的可见水印嵌入算法首先将主图像进行分块DCT变换,分析每块图像的纹理特征和边缘信息,从而得到嵌入系数,其计算公式如下[15]:

(5)

(6)

如果考虑图像明暗对视觉容忍的影响,计算公式可进一步修正如下:

(7)

(8)

式中:DC是直流分量,max代表最大值,Xc0是分块直流系数。

嵌入可见水印图像的DCT系数变为:

(9)

同时我们根据视觉系统的特性建立了简化分块拉伸系数的步骤,利用率空间域的边缘信息提高水印嵌入效果[16]。

水印叠加公式如下:

cij=αncij(n)+βnWij(n)n=1,2,…

(10)

式中:αn和βn是块n的拉伸系数,图像和水印的DCT系数分别是cij(n)和Wij(n)

(11)

(12)

在本文中我们还研究了可逆可见水印(Reversible Visible Watermark)的生成算法。典型的可逆水印采用加性扩频技术插入水印信息,或是通过嵌入信息位的方式。可逆认证的原理由Honsinger等人[17]提出,为了防止灰度值溢出,可以采用模数运算来处理。为了防止椒盐噪声的畸变,可以采用无损压缩的方式来处理。

图8 不同纹理背景中的数值区域定位

3 实验结果

为了验证图像区域定位算法的有效性,首先我们在一定纹理背景图像中进行关键区域的检测,如图8所示。数字出现在图像背景中的不同区域,对数字区域的定位结果由矩形区域标出。在对训练数据进行预处理时,将包含不同数字区域的图像模板进行随机的剪切和拼接,以获得足够多的数据样本。在对背景纹理的预处理中,包含了不同尺寸的图像纹理样本,进行了随机的缩放,以获得尽量独立于某个特定纹理的负性图像分布。对待处理的输入图像,我们进行了不同尺寸的滑动窗口检测,对检测结果,以不同的矩形窗口表示出来,对距离接近到一定阈值的矩形窗口,进行了合并,以获得最终的合理的结果。对数值关键区域的定位,有助于节省水印加密的运算时间,有助于对篡改区域的定位。

如图9所示,我们在实际的银行票据中进行了关键信息的定位,对数字区域进行了识别检测。如图所示,其中的数字区域被准确的提取了出来。在我们的训练模板中包含了单个和多个数字的模板数据,在进行检测的过程中,我们通过不同的检测窗口尺寸进行识别对比。在获得单个孤立的数字区域时,进行了后处理强化,当其与其他结果接近时,进行区域的合并,否则抛弃,降低了区域的误检率。

图9 图像目标检测算法的定位效果

图10 区域定位的正确率(SVM)

图像面积比RBF核多项式核1%0.650.662%0.710.73%0.750.765%0.870.8310%0.940.92

如图10中所示,对关键区域定位的正确率进行了统计,纵坐标代表定位的识别准确率,即是否成功找出数字或字母内容的图像兴趣区域。横坐标代表所识别对象的相对大小,其性能与算法的初始化滑动窗口相关。对图像兴趣区域进行检测时,需要采取滑动窗口的方式来进行样本特征的初始化,窗口的尺寸采用金字塔结构进行分级的搜索。从实际票据中的需求看,当字符字体越小时,识别难度也相应增大。图中曲线代表了两种不同的核函数的识别性能,采用支持向量机对关键区域进行定位识别,当相对面积增加时,识别率上升,RBF核函数与多项式核函数的性能接近,RBF核函数略高于多项式核函数。

表3 浅层神经网络区域定位的正确率

如图11中所示,采用ANN进行识别,其正确率与隐层的节点数有关。采用BP算法训练传统的三层神经网络,随着隐层节点数的变化,定位的准确率也相应发生变化。三层神经网络的隐层节点数只能根据实验中的经验值进行设定。同SVN算法一样,随着字符面积的增大,ANN识别率也随之增大。从识别率曲线可以看到,当字符面积比小于1%时,识别正确率已经降到不足70%。当面积比在5%以上时,识别正确率在90%左右。实验测试结果说明,神经网络能够进行较好的关键区域检测识别,在实际金融票据上,字符的字体大小占据一定的尺寸(1%),因此能够满足实际应用的需求。

图11 区域定位的正确率(ANN)

图像面积比隐层节点617301%0.740.740.732%0.840.890.863%0.890.910.95%0.930.940.9310%0.950.990.96

采用深度神经网络的识别结果如图12所示,纵坐标代表关键区域检测的识别正确率,横坐标代表所建立的图像特征模型的尺寸,即滑动窗口与输入图片的面积比例。在训练阶段滑动窗口所定位的兴趣区域ROI与字符的所在位置吻合,在检测阶段滑动窗口遍历输入图片的各位置,其尺寸大小按照经典的金字塔法则设定。横坐标代表的尺寸比例在1%~10%之间变化时,识别性能也随之发生微小的变化。从实验结果可以看到,采用深度神经网络DNN获得了较好的识别性能,与传统的图像内容识别算法相比具有明显的优势。在网络的隐层数变化时,对关键区域的检测性能也发生一定的变化,隐层数量在17层时,性能达到最佳。

图12 区域定位的正确率(DNN)

对于字符的区域检测,可以在不同的分辨率上进行,对于加密与解密的实际需求而言,我们需要定位感兴趣的ROI所在,而不需要进行特征点的定位,这一点与字符识别OCR的需求不同。因此在后续的进一步实验中,我们将检测器的输出边界(Bounding Box)进行融合,获得更为稳定的区域检测结果。如图13所示,进行区域融合后,相邻区域的ROI进行合并,采用SVM的检测结果获得了提高,如图中的识别率曲线所示。我们可以看到,采用RBF和多项式核的算法都获得了提升。将近临的区域进行合并可以减少加密的运算量,更重要的是可以提高输入图像区域的稳定性,从而提高水印嵌入的稳定性。

图13 后处理区域合并对误检率的降低(SVM)

如图14中所示,采用合并子区域的检测方法,神经网络的识别率可以达到90%以上。

图14 后处理区域合并对误检率的降低(ANN)

如图15所示,深度网络的识别率明显超过了传统算法,对金融电子票据中关键的信息区域进行了准确的定位,每次定位的结果稳定在较大的兴趣区域中,对滑动窗口的检测过程具有较大的稳定性,有利于实际中的数字水印的准确嵌入,保护关键的数字、字母信息。如图中识别率曲线所示,3%以上的面积比例能够带来95%以上的识别率。

图15 后处理区域合并对误检率的降低(DNN)

图16 可见水印的多重加密效果

可见可逆水印的加密效果如图16所示,我们可以看到关键信息区域可以通过可见水印进行覆盖,可见水印可以表明票据的版权、来源等信息,便捷的进行票据的辨识,对金融诈骗有一定的防范效果。对可逆水印的应用,能够将遮盖的区域完整的复原出来,从而对票据进行混沌水印的解密验证。

4 结论

本文中,我们对图像的关键区域进行了定位,有助于降低图像水印算法的计算量,能够有效的进行关键区域的重点加密保护,以提高金融票据的安全性。我们通过翻转不变的SIFT特征提取了有效的图像信息,采用随机生产训练模板的方法增强了模型的通用性。结合票据关键区域、可见水印和不可见水印,我们深入研究了多重水印在金融系统中的实际意义。实验结果显示,所提出的加密算法具有较高的安全性,能够对金融票据中的篡改区域进行有效的定位。

[1] Schyndel R G V,Tirkel A Z. A Digital Watermark,IEEE International Conference on Image Processing,1994:86-89.

[2] Gupta V,Barve A. A Review on Image Watermarking and Its Techniques[J]. International Journal of Advanced Research in Computer Science and Software Engineering,2014,4(1):92-97.

[3] Maleki H,Sharabyan M T. Presentation of a Method for Watermarking by Multi-Dimensional Chaotic Functions[J]. J Appl Environ Biol Sci,2015,5(3):174-180.

[4] 彭再平,王春华,林愿,等. 一种新型的四维多翼超混沌吸引子及其在图像加密中的研究[J]. 物理学报,2014,63(24):240506-240506.

[5] Tao L. 基于混沌映射和DNA编码的图像加密算法[J]. 计算机工程,2014,40(6):70-74.

[6] 曲长波,杨晓陶,史双宇. 基于复合混沌系统的多小波鲁棒水印算法[J]. Computer Engineering and Applications,2014,50(24):101-106.

[7] 李昕,李立君,高自成,等. 基于偏好人工免疫网络多特征融合的油茶果图像识别[J]. 农业工程学报,2012,28(14):133-137.

[8] 王洋,曾雪琴,范剑英. 汽车牌照字符识别系统设计[J]. 哈尔滨理工大学学报,2012,17(1):90-95.

[9] 张锋,常会友. 使用BP神经网络缓解协同过滤推荐算法的稀疏性问题[J]. 计算机研究与发展,2015,43(4):667-672.

[10] 陈德忠,赵亮,何书静,等. BP 神经网络和SVR用于GPS高程拟合研究分析[J]. 测绘地理信息,2012,37(5):47-49.

[11] 丁世飞,齐丙娟,谭红艳. 支持向量机理论与算法研究综述[J]. 电子科技大学学报,2011,40(1):2-10.

[12] Zhao W L,Ngo C W. Flip-Invariant SIFT for Copy and Object Detection[J]. IEEE Transactions on Image Processing,2013,22(3):980-991.

[13] Delalandre M,Iwata M,Kise K. Fast and Optimal Binary Template Matching Application to Manga Copyright Protection[C]//11th IAPR International Workshop on Document Analysis Systems,2014:298-303.

[14] Han K,Yu D,Tashev T. Speech Emotion Recognition Using Deep Neural Network and Extreme Learning Machine[C]//Proc of Annual Conference of the International Speech Communication Association,Singapore,2014:223-227.

[15] Kankanhalli M,Ramakrishnan K R. Adaptive Visible Watermarking of Images[C]//Proc of ICMCS’99,1999:568-573.

[16] Mohanty S P,Ramakrishnan K R,Kankanhalli M. A DCT Domain Visible Watermarking Technique for Images[C]//Proc Int Conf on Multimedia and Expo,2000.

[17] Honsinger C W,Jones P,Rabbani M,et al. Lossless Recovery of an Original Image Containing Embedded Data. US patent application,Docket No 77 102/E-D,1999.

ResearchandImplementationofChaoticWatermarkEncryptionAlgorithmforFinancialNotes*

TAORui,SUNYanjing*

(Jiangsu Province Laboratory of Electrical and Automation Engineering for Coal Mining, China University of Mining Technology,Xuzhou Jiangsu 210046,China)

A chaotic watermark encryption algorithm is proposed for authentication of the key information content in financial notes. Aiming to improve the security of the information,dual watermarking encryption algorithm is adopted for the key numbers. At the same time,visible and invisible dual encryption algorithm is employed for the financial notes. Experimental results show that the note authentication based on chaotic encryption algorithm has a great potential value in practice and improves the security of financial system.

chaotic watermark;information hiding;note authentication

10.3969/j.issn.1005-9490.2017.05.047

项目来源:中央高校基本科研基金项目(2013RC1);江苏省煤矿电气自动化实验室基金项目(2014KJZX05);国家自然科学基金项目(61375028)

2016-07-15修改日期2016-09-02

TP319

A

1005-9490(2017)05-1297-07

陶锐(1982-),男,山西长治人,中国矿业大学博士在读。主要研究方向为图像压缩、防伪加密等,sxtaxtr@163.com;

孙彦景(1977-),男,山东滕州人,博士,2008年破格副教授,2011年破格教授,博士生导师,中国矿业大学矿山物联网研究所所长,中国矿业大学优秀青年学术带头人,江苏省“333高层次人才培养工程”培养对象推荐人选,江苏省“青蓝工程”优秀青年骨干教师,江苏省电子学会常务理事,煤炭工业通信监控设备分技术委员会委员,入选江苏省“六大人才”高峰和中国矿业大学力行计划。为校创新团队“矿井通信与监控”和江苏高校优秀科技创新团队“感知矿山物联网”的骨干成员。曾在霍州煤电集团有限责任公司李雅庄煤矿挂职矿长助理。多年以来一直从事煤矿综合信息化、矿井通信与监控、矿山物联网等相关的研究工作。主持国家自然科学基金项目2项,江苏省“六大人才高峰”高层次人才资助项目1项,作为骨干或技术依托单位负责人参与863重点、国家发改委、江苏省科技成果转化和江苏省高新技术项目多项。主要研究方向为挑战环境下的嵌入式实时系统、无线传感器网络、协作通信、信息物理系统等,yanjingsun_cn@163.com。

猜你喜欢

加密算法票据关键
硝酸甘油,用对是关键
高考考好是关键
2016年11月底中短期票据与央票收益率点差图
2016年10月底中短期票据与央票收益率点差图
2016年9月底中短期票据与央票收益率点差图
基于小波变换和混沌映射的图像加密算法
2015年8月底中短期票据与央票收益率点差图
Hill加密算法的改进
对称加密算法RC5的架构设计与电路实现
基于Arnold变换和Lorenz混沌系统的彩色图像加密算法