APP下载

隐马尔可夫模型下视频手写签名认证算法研究

2017-08-30

计算机测量与控制 2017年7期
关键词:手写特征算法

雷 涛

(华南师范大学 物理与电信工程学院,广州 510006)

隐马尔可夫模型下视频手写签名认证算法研究

雷 涛

(华南师范大学 物理与电信工程学院,广州 510006)

为了提高视频手写签名认证的准确率,确保身份认证的严谨性,需要对隐马尔可夫(Hidden Markov Models,HMM)模型下视频手写签名认证算法进行改进设计;使用当前算法对视频手写签名进行认证时,存在认证判断误差大、效率低的问题;提出基于HMM模型下视频手写签名认证算法;该算法将使用Wacom手写板采集手写签名特征点及压力数据,对采集到的手写签名特征与压力数据进行预处理,消除采集过程中环境和手写板产生的影响,并且规范采集的视频手写签名特征位置、尺寸,提取手写签名特征与压力数据,再以HMM模型对已提取的视频手写签名特征点与压力数据进行认证与计算,确定签名的真实度;实验仿真证明,所提算法提高了视频签名认证的性能。

隐马尔可夫模型;视频手写签名;签名认证

0 引言

视频手写签名认证是对个人特有的生理行为或生物特征进行认证的一种认证技术,随着科学技术的发展,该技术已受到人们的重视[1]。手写签名认证是身份认证的传统认证方法,但随着电子技术的发展,推出视频手写签名认证方法,现有的视频手写签名认证方法大多采用提取关键点或笔画特征来提高手写签名认证效果[2]。手写签名有很严重的连笔现象,使得视频手写签名不能稳定、准确的判断出真假签名[3]。而基于HMM模型下视频手写签名认证算法,使用Wacom手写板采集手写签名的特征点与压力数据,对采集到的手写签名特征与压力数据进行预处理,消除采集过程中环境和手写板产生的噪声干扰,利用高斯滤波器对视频手写签名样本的各个分量进行平滑化处理,并对采集到的视频手写签名特征位置、尺寸进行规范化,对自然笔画进行笔画分段,获得一个比较稳定的笔画序列,消除视频手写签名过程中书写大小及在手写板坐标系中位置的不同对手写签名认证结果产生的干扰,采用HMM算法有效的提取手写签名的每一个笔画特征,除去手写签名笔记中不稳定的因素,并对笔迹进行适当的划分,确保手写签名认证的准确性。通过HMM模型对视频手写签名进行认证。由于视频手写签名认证的普遍使用,使得视频手写签名认证受到许多社会人士的关注与重视,同时取得了一定的研究成果[4-5]。

文献[6]提出基于信息融合的视频手写签名认证算法。采用三种不同的计算方法分别计算出测试签名和参考签名的可信度,再将三种算法的计算结果加权融合,以加权融合的结果进行签名真假最终的判定。信息融合算法的误拒率和误纳率都有显著的提高,但该算法的计算量较多,计算复杂。文献[7]提出基于多项式的视频手写签名认证算法,主要采用多项式算法计算手写签名曲线中特征点的匹配情况。首先提取手写签名曲线中特征点位置坐标,再将手写签字特征的至高点与至低点提取出来,并以Fréchet距离对手写签字特征的至高点与至低点进行研究,手写签名曲线有一定的相似性,在此基础上建立手写签名曲线相似性的数学模型,并以多项式算法求解,但该算法认证视频手写签名真假的有效性较低。文献[8]提出基于DTW的视频手写签名认证算法,DTW算法结合距离测度和时间来认证视频手写签名的真假,对手写签名模板全部或局部的压缩、扩展或变形后的特点信息进行匹配,寻找出匹配模板与测试模板之间手写签名数据的匹配路径,解决动态模板的相似度和分类问题。该算法具有概念简洁、算法鲁棒的优点。但在准确率上需要进一步的研究。

针对上述问题,提出基于HMM模型下视频手写签名认证算法。实验仿真证明,HMM模型提高了视频手写签名认证的准确率。

1 HMM模型的基本理论

HMM是隐马尔可夫模型,该模型可以通过观察参数确定该过程中的隐含参数,然后利用这些参数来作进一步的分析,进而达到认证的目的[9-10]。可以用三元组表示一个标准的HMM,如:

λ=(A,B,π)

(1)

其中:A、B、π3个元素分别代表的意义如下:

(2)

bj,k=p(qt=Ok/qt=θj),1≤j≤N,1≤k≤M

(3)

3)HMM初始状态概率分布为:

πi=p(q1=θi),1≤i≤N

(4)

HMM的隐含状态在初始时刻t=1的概率矩阵为p(θ1)=p1,则初始状态概率矩阵为:

π=[P1,P2,P3]

(5)

其中θ表示HMM的隐藏状态,O表示HMM的可观测状态,N是自然数。

想要在视频手写签名认证中引用HMM算法,就要解决3个HMM的基本问题。

1)建模问题,调整模型λ的参数:λ=(A,B,π)使模型概率值p(O/λ)达到最大值。

2)预测问题,HMM的模型参数λ=(A,B,π)为未知,如何调整参数使观测序列O=O1,O2,O3......OT的概率值p(O/λ)最大化。

3)评价问题,已给定观测序列O=O1,O2,O3......OT,则HMM模型可以表达其意义上的状态序列为I=I1,I2,I3......IT。

2 HMM模型下视频手写签名特征抽取

2.1 HMM模型下视频手写签名特征收集

为了收集HMM模型下视频手写签名特征,将使用Wacom手写板、PTH451写图板或Por无线数位手写板收集视频手写签名特征。在手写板上签名经常会出现瞬间滑动和冲击,在加上Wacom手写板多数采用多维力传感器采集信号,使得产生的滑动和冲击导致签名过程中手写笔画的落笔与抬笔均出现短小转折,这种形式的转折与正常人们手写签名习惯中的笔锋不同,笔锋的出现和方向具有一定随机性,对HMM模型认证视频手写签名影响较小,因此我们将采用优化的多维力传感器进行特征点与压力数据的采集,它以100Hz的频率采集手写签名特征点与压力数据,采集到的特征点表示为(x,y),压力表示为p,在一定的范围内书写姓名时不与手写板接触也可以采集到特征点,不过此时P=0。

假如一个签名有R个特征点,则其整体特征可以表示为:

(6)

其中x、y表示横坐标和纵坐标,P表示特征点的压力,h表示从第一个视频手写签名特征点开始的相对时间,单位毫秒,其中p1≠0,pR≠0且相邻视频手写签名特征点的时间间隔固定,即ht+1-ht=const,为10毫秒。

2.2 视频手写签名特征预处理

由于在HMM模型下采集视频手写签名特征过程中,受到环境噪声、采集设备的差异、签名姿势等各种因素的影响,采集到的样本签名经常出现大小不一、倾斜程度不一、长度相差悬殊的问题,给HMM模型认证视频手写签名带来极大的影响,为了尽可能的消除各个影响因素,必须对采集的手写签名特征进行预处理。预处理包括两个步骤:平滑化和规范化,详细的步骤如下所示。

1)平滑化:对采集到的视频手写签名特征进行平滑化处理,利用高斯滤波器,对视频手写签名样本的各个分量进行平滑化处理,消除特征采集过程中环境和,平滑后x轴坐标为:

(7)

其中:

(8)

同理可得平滑后的y(t)、Fx(t)、Fy(t)、Fz(t)等各分量。在公式中高斯滤波器参数σ取为1,即取滑动窗宽度为5个特征点。

2)规范化:对采集到的视频手写签名特征的位置、尺寸进行规范化,消除视频手写签名过程中书写大小和在手写板坐标系中位置不同对认证结果产生的影响。视频手写签名位置的平移和尺寸的规范化与坐标变换同时完成:

x′(t)=[x(t)-xcenter]S/max(width,height)

(9)

y′(t)=[y(t)-ycenter]S/max(width,height)

(10)

其中:

(11)

(12)

公式(11)(12)为视频手写签名的宽度和高度;xcenter=width/2,ycenter=height/2为签名外接矩形中心的坐标;S是规范化后手写签名外接正方形的边长,规范化后将得到一个被标准正方形包围的视频手写签名,该签名能够有效保持原有的宽高比例。

视频手写签名笔迹中笔迹转折点的速度是最慢的,所以将速度最慢的点设置为笔迹分段的关键点。根据Fz方向的力值确定落笔和抬笔,得到手写签名的自然笔画,然后根据速度计算公式,计算出每个分段关键点的速度值,对于t时刻的手写签名关键点,选取任意两个相邻的手写签名关键点坐标代入公式(13)(14)分别计算该点在x和y方向的速度分量:

(13)

(14)

可以得到,t时刻点速度的大小为;

(15)

2.3 HMM模型下视频手写签名特征提取与认证

对预处理后视频手写签名的每一个笔画进行特征提取,将笔画的起始点与结束点视为特征点,开始点和结束点对笔迹形状起关键作用,HMM算法有效的保留笔迹特点,除去笔记中不稳定因素,并对笔迹进行适当的划分,在视频手写签名的认证过程中笔画分段是一个重要的步骤,笔画分段的稳定性和可靠性直接影响着手写签名的认证结果。能否通过曲线的转折点来对笔画进行分段,并结合手写签名速度,确保手写签名特征提取的稳定性,是视频手写签名特征点选取的关键,具体的HMM模型下视频手写签名特征点选取算法实现过程如下:

1)标记手写签名笔划的开始点和结束点,即手写签名的特征点。

2)设点pstart和pend为已求得的手写签名特征点,pi为pstart和pend之间的手写签名笔划段上的某一点,i∈(start,end),通过下列步骤求得pstart和pend之间的笔迹所有特征点。

①若pstart和pend之间不存在特征点,则结束计算。若pstart和pend重合,则转到第②步,否则转到第④步。

②计算pi和pstart之间的直线距离计算公式为:

di=d(pi,pstart)

(16)

通过公式(16)求得di的最大值dmax和对应点pn。

③若dmax>MinEdage,则转到第⑧步,否则结束计算。

(17)

通过公式(17)求得di的最大值dmax和对应点pn。

⑤若dmax>MinArc,则转到第⑧步,否则执行⑥步。

⑥分别计算pi到pstart和pend的距d(pi,pstart)和d(pi,pend)计算公式为:

(18)

公式(18)求得di的最大值dmax和对应点pn。

⑦若dmax>MinEdge,则转到第⑧步,否则结束计算。

⑧将点pn选取为手写签名的特征点,并使用HMM模型对新的笔划段pstartpn和pnpend进行处理。

HMM模型算法中的MinArc和MinEdge为定值,分别表示手写签名特征点的最小垂直偏离量和最小直线偏离量。在本系统中我们取MinArc=3.0,MinEdge=8.0。

τt=Meani-ω×Vart

(19)

其中Meani和Vart分别为第i用户训练样本集的规范化后输出概率的平均值和方差;ω为阑值系数,系统中所有用户取为相同值。

3 实验与分析

本实验将采用VC2004手写签名数据库,数据库包含60个人的汉字视频手写签名数据,每个人都有将近30个手写签名,其中有15个手写是真实签名,真实签名与模仿签名数据中包括手写签名汉字、每个时刻采集到的手写签名特征点的坐标位置X(t)和Y(t);并且包括手写签名时运笔压力P(t)笔倾斜的方位角Azimuth以及笔倾斜的高度角Altitude数据。该实验将VC2004手写签名数据库中的45个人的汉字视频手写签名数据平均分成3份实验数据集,分别以HMM模型认证算法、信息融合算法、多项式的算法以及基DTW算法进行实验。

实验中每个手写签名的起始点不同,为了避免手写签名起始点对算法的影响,需要对数据规范化处理,手写签名越复杂,认证的结果越准确,通过实验确定相关的参数,即惩罚因子为C=100 000方差的倒数1/σ2=0.08,而HMM模型我们则选择高斯密度函数连续的HMM模型,为了方便比较这3种算法认证视频手写签名的性能,将使用DET曲线中的等错率来体现。3种算法在各个状态及不同混合度下的等错率分别用3个表格表示,如表1、表2、表3所示。

表1 信息融合算法在各个状态及不同混合度下的等错率

为了显示HMM模型认证算法在各个状态及不同混合度数下的等错率,如表2所示。

表1、表2与表3对比可以看出,HMM模型认证算法相对于信息融合算法与DTW算法的手写签名认证在性能上有所提高。从表1中还可以看出,当多项式算法的认证状态数为1时,手写签名特征点数据出现大量混叠现象,使系统等错率提高,这主要是因为该算法采集到的时间函数包含视频手写签名特征信息,直接将视频手写签名特征信息代入时间函数,导致实际认证过程计算量过大,导致手写签名的数据出现大量的冗余数据,认证效果不理想。

表2 HMM模型认证算法在各个状态及不同混合度下的等错率

表3 DTW算法在各个状态及不同混合度数下的等错率

状态数N以及高斯混合度M对系统认证性能的影响从表1、表2、表3可以看出,当状态数N较小且高斯混合度M较低时,信息融合算法认证的效果较低,影响认证视频手写签名的准确性。当状态数N较大且高斯混合度M较高时,用信息融合算法进行认证耗时较长,导致认证数据不足。因此选择适当的状态数N以及高斯混合度M对于提高系统认证性能具有重要作用。正样本数对认证性能的影响从图1、图2所示。

在该实验中,任取10个人的手写签名样本,实验手写签名集包含100个模仿签名,而其中的真实签名样本数分别为1~15个,进行多次实验,实验手写签名集包含10个真实签名样本和90个模仿签名样本,并且此时系统的参数分别为惩罚因子为C=100 000,方差的倒数1/σ2=0.08,状态数为N=3,混合度M=6。得到结果如图1、图2所示,从中可以看出,实验中的正样本数越大则表现在测试集上的FRR拒真率越小,相反其在测试集上的FAR认假率越大。

图1 不同真实签名样本数对FRR的影响

图2 不同真实签名样本数对FAR的影响

4 结论

针对当前算法在视频手写签名认证的过程中不能稳定、准确的判断出签名的真假签名,降低了视频手写签名的认证效果。提出基于HMM模型下视频手写签名认证算法。仿真实验结果表明,所提算法提高了视频签名认证的性能。

[1] 范 菁,阮体洪,吴佳敏,等.基于二次谱聚类和HMM-RF混合模型的车辆行为识别方法研究[J].计算机科学,2016,43(5):288-293.

[2] 王相海,丛志环,方玲玲,等.混合种群多样性自适应遗传操作的HMM训练模型[J].计算机研究与发展,2014,51(8):1833-1844.

[3] 达吾勒·阿布都哈依尔,古丽拉·阿东别克.基于HMM的联机手写哈萨克文字的识别研究[J].计算机工程与应用,2014,50(1):145-148.

[4] 何 梦,吴仲城,李 芳.基于在线手写签名的密钥生成方法[J].计算机工程,2016,42(10):164-168.

[5] 张利利,马艳琴,卜春霞.标准模型下基于格的代理环签名方案[J].数学的实践与认识,2015,45(3):107-111.

[6] 张腾飞,张敏情,王绪安.新的标准模型下安全的数字签名方案[J].计算机应用,2014,34(5):1300-1303.

[7] 马 勇. 基于IBC机制的内容中心网络安全认证方案[J]. 电子设计工程, 2016, 24(13):88-91.

[8] 张延红,陈 明.标准模型下增强的基于身份部分盲签名[J].四川大学学报工程科学版,2014,46(1):95-101.

[9] 许 辉,热依曼吐尔逊,吾守尔斯拉木.基于HMM和GMM的维吾尔语联机手写体识别研究[J].计算机工程与应用,2014,50(11):202-205.

[10] 赵洪建,达汉桥.基于HMM-LSSVM组合模型的模拟电路故障诊断[J].计算机工程与应用,2014,50(19):237-240.

Research on Video Based Handwritten Signature Verification Algorithm Based on HMM Model

Lei Tao

(South China Normal University, School of Physics And Electronic Engineering,Guangzhou 510006,China)

In order to improve the accuracy of the handwritten signature verification and ensure the preciseness of the authentication, we need to improve the design of the HMM(Hidden Markov Models) algorithm. When the current algorithm is used to authenticate the handwritten signature, there are many problems such as low error and low efficiency. A video based handwritten signature verification algorithm based on HMM(Hidden Markov Models) model is proposed. The algorithm will use the Wacom tablet collection handwritten signature feature points and pressure data of handwritten signature features and pressure data collected for pretreatment, eliminate the influence of environment in the process of collecting and writing board, and standard video handwriting signature features location, size, feature extraction of handwritten signature and pressure data, and then to the HMM model of the extracted video signature feature points and the pressure data authentication and calculation, to determine the true degree of signature. The simulation results show that the proposed algorithm improves the performance of video signature verification.

hidden markov model; video handwritten signature; signature authentication

2017-04-01;

2017-04-24。

广东省省级科技计划项目:基于移动终端及网络的远程智能医疗监护平台(2013B010204019)。

雷 涛(1973-),女,四川成都人,博士研究生,讲师,主要从事信息安全方向的研究。

1671-4598(2017)07-0290-04

10.16526/j.cnki.11-4762/tp.2017.07.072

TP391

A

猜你喜欢

手写特征算法
根据方程特征选解法
离散型随机变量的分布列与数字特征
我手写我心
抓住身边事吾手写吾心
Travellng thg World Full—time for Rree
不忠诚的四个特征
进位加法的两种算法
基于集成学习的MINIST手写数字识别
一种改进的整周模糊度去相关算法
一种基于L-M算法的RANSAC图像拼接算法