基于ARM的文本独立笔迹鉴别系统设计
2014-01-17张乃千樊振方
张乃千,杨 海,樊振方
(1.国防科学技术大学 光电科学与工程学院,湖南 长沙 410073;2.国防科学技术大学 计算机学院,湖南 长沙 410073)
笔迹,是具有个人特征的书写文字符号的形象系统,与个人书写习惯有密切联系。利用计算机进行个人笔迹鉴别,是模式识别的分支问题,是通过分析比较不同人笔迹的书写风格来判断书写者身份的一种技术方法[1]。文本独立(Textindependent)是指进行鉴别时,对书写者书写的内容没有特殊要求,具有样本依存性小、信息采集方便等特点,具有广泛的应用前景。通过对笔迹分析做出身份判断,在计算机登录、电子商务、金融安全、文物监测、信息安全等方面具有重要应用。国内外对基于PC平台的笔迹鉴别系统算法进行了细致研究,师宝山[2]等人解决了纸质笔迹信息的预处理问题,张德贤[3]等人提出了笔迹信息的特征提取算法,刘海[4]等人提出了基于轮廓方向特征提取的笔迹鉴别方法,刘爱真[5]提出了利用希尔伯特-黄变换(HHT)方法对脱机手写体汉字特征进行提取,杨彩霞[6]提出了基于Gabor变换和最邻近分类器的笔迹鉴别方法,刘宏[7]等人提出了基于纹理分析优化Gabor变换和支持向量机(Support Vector Machines,SVM)的笔迹鉴别方法。这些方法的鉴别性较好,可实现性强,但都局限在PC系统层面,笔迹的采集方式复杂,不能实现实时的笔迹鉴别系统。本文提出了一种基于嵌入式系统的实时笔迹鉴别系统,该系统主要针对离线的文本独立笔迹进行嵌入式鉴别研究,使用ARM终端实时采集笔迹信息,使用Gabor滤波器提取笔迹样本的纹理特征,使用支持向量机(SVM)训练和识别笔迹信息的特征。
1 笔迹鉴别系统总体设计
基于ARM的文本独立笔迹鉴别系统主要由3个模块部分组成,包括笔迹采集端、数据传输部分、上位机处理部分。系统的总体设计原理如图1所示。
图1 系统设计原理图Fig.1 Design schematics of system
进行笔迹鉴别时,需要提前将书写人笔迹数据存入系统数据库中,以便于后期比对分析。待检测人需通过笔迹采集端的手写式触摸屏实时输入手写笔迹信息。笔迹采集端进行简单处理后通过数据传输部分传送给上位机,上位机接收数据后采取笔迹鉴别算法对实时采集的笔迹信息进行预处理和归一化操作。处理后的笔迹数据通过Gabor滤波器和支持向量机方法[7]与数据库数据进行比对,从而实时显示书写者的身份信息。
2 基于ARM的笔迹采集端技术及设计
文本独立的笔迹鉴别系统的笔迹采集端主要负责笔迹信息的实时采集及发送功能,主要由ARM核心处理器、触摸屏模块、书写信息显示模块和数据发送端口组成。
2.1 笔迹采集模块
触摸屏部分是笔迹采集的关键核心,主要由电阻式触摸屏和触摸屏控制器组成,负责笔迹信息的实时采集。采集的数据信息将被实时保存成图片格式并简单处理后发送。电阻式触摸屏的基层是玻璃,玻璃上面涂覆有两层透明氧化金属(ITO氧化铟)导电层,两导电层之间有细小的透明隔离点,这些隔离点起到了将两导电层隔离和绝缘的作用。当书写者的笔尖或手指按下触摸屏时,两个导电层就会相互接触而形成回路,通过测量接触点的电压值等特定数据就可得到屏幕上的坐标位置。采用电阻式触摸屏具有价格低廉、型号齐全、耐笔尖或手指磨损、感应度高、精确性好等特点。
除了通过触摸屏实时显示书写者的笔迹数据外,为了更便于书写者观察书写,设计了专门书写信息显示模块显示笔迹信息。该模块采用TFT液晶屏和液晶屏控制器组成。液晶显示屏收到来自核心处理器的笔迹数据信息后,实时地将手写笔迹显示在屏幕上方,使得书写者的笔迹输入更加直观。由于电阻式触摸屏采集到的笔迹信息是当前触摸点电压值经过模数转换后X坐标和Y坐标的数字值,对TFT液晶屏没有使用价值,因而需要通过坐标转换将触摸屏坐标映射到TFT屏幕上。具体转换过程可以由核心处理器及驱动程序完成。
笔迹采集端的核心处理器选择三星公司ARM9内核的S3C2440A处理器,它负责整个笔迹采集端的运行控制,包括负责完成触摸屏模块的显示和手写数据的采集、书写信息显示模块的数据输出、数据通信模块的管理控制,还负责包括坐标映射和简单笔迹数据处理等功能。
2.2 数据通信模块
数据通信模块主要负责笔迹采集端采集的笔迹信息实时传送到上位机端的功能。实现上位机与笔迹采集端的通信,主要包括有线和无线两种方式。
有线通讯方式即通过实体数据线路进行连接,包括串口线、USB通信线等方式。其中,USB通信模块是S3C2440A核心处理器的集成部分。S3C2440A核心内部包括USB控制器和外围电路,可以直接实现通过USB端口数据线将大量书写数据实时准确传送给上位机端的功能,具有简单实用的特点。
为增加系统的可用性,实现相对较远距离(10 m)的自由终端式笔迹采集模块,可以采用基于无线通讯方式进行数据传输。目前较常用的无线通讯方式包括蓝牙、Wi-Fi、基于nRF24L01工业模块等方式。其中,nRF24L01是一款使用2.4 GHz ISM开放频段、采用FSK调制、基于内部自有协议的无线通信模块,本身拥有126频道,可以实现点对点或1对多点的无线通信功能,通信速度可以达到2 Mbps。采用基于nRF24L01的工业化通信模块可以实现较小体积较远距离的数据传输,且开发方便,可以极大提高笔迹鉴别系统的实用性。
3 上位机文本独立笔迹鉴别模块的设计
文本的笔迹信息包括在线和离线两类。离线信息是指写在纸上的字符,具有采集方便、信息量小的特点。笔迹鉴别方法主要包括文本依存和文本独立两种,其中文本依存要求必须使用相同的文字进行比对,而文本独立是依据大量笔迹特征提取,与书写内容无关,应用更广。本文针对离线的文本独立笔迹信息进行研究,利用多通道Gabor滤波器,作为图像纹理特征提取分析方法,它被广泛应用于纹理分析、笔迹鉴别等领域。为了解决训练样本不足的问题[7],可以采用支持向量机(SVM)的方法对笔迹特征进行训练和识别。上位机端的算法流程设计如图2所示。
图2 算法流程图Fig.2 Algorithm flowchart
3.1 笔迹图像预处理
笔迹图像的预处理主要包括滤波、二值化、归一化等。首先将图像进行颜色聚类和二值化,以消除背景色的干扰,根据分布特征除去背景和网格线,并将图像二值化。然后需要进行滤波以消除噪点的干扰,常用的图像滤波方法有:中值滤波、邻域均值滤波和低通滤波。由于笔迹采集终端采集的图片质量较高,噪声多为小噪声的孤立点,因此可以采用盐和胡椒滤波法去噪[8]。然后将图像分别沿水平和竖直方向进行投影,以压缩空行和字符间的空白。为便于数据处理,需要按统一的行高对每行字符进行归一化处理,即调整不同字符的大小相同。归一化处理时可以根据笔迹图像的水平直方图做行的分割,图像的水平直方图就是图像在水平方向上的投影,即每一行像素值直接相加。实验中我们采集了20人的笔迹信息,每人两份,每份的汉字数量、内容、纸张、书写用笔均没有特殊限制。与此同时,实验还采用了哈尔滨工业大学多人手写库(HIT-MW)中的笔迹图像作为样本,共使用40份,由20个人书写,每人两份。对于采集的手写笔迹信息,我们将每个人的笔迹信息一分为二,一份用于训练,另一份用于测试,以保证两组数据完全不同。实验采集笔迹图像预处理效果如图3所示。
3.2 利用Gabor滤波器进行特征提取
笔迹信息进行预处理后需要分析笔迹图像的纹理特征,由于每个人的书写风格不同,书写的笔迹信息具有较强的方向性和频谱特征,需要采用时间频域分析。系统上位机部分采用二维Gabor滤波器进行特征提取,Gabor变换是1946年D.Gabor为解决傅立叶变换对分析非平稳信号有很大局限性而提出来的。二维Gabor函数具有方向选择性和带通性,能同时在时域和频域中兼顾对信号分析的需求,可以比较精确地提取图像的局部问题特征,相当于一种带通滤波器。纹理图像可类比为有周期性规律的信号,其能量集中在一定频率范围内。如果纹理图像的能量与Gabor滤波器的通频带吻合,那么这部分的信号就得到放大。在纹理分析中常用的Gabor变换公式:
图3 笔迹预处理效果图Fig.3 Renderings of handwriting pretreatment
其中 u,v 分别为在 x,y 轴方向上的空间频率;g(x,y)为Gauss函数。设置Gabor滤波器的3个参数为:径向中心频率f,方向θ和空间常数σ。选择不同的参数会构成不同的通道,它们组成了一组非正交基。实验中取σ=2π/f,相位角θ取0,π/4,π/2,3π/4,用这组基展开信号可以得到笔迹图像在不同的频率和相位下的频域信息。
3.3 聚类SVM分类器进行鉴别
SVM是一种旨在通过有限的样本学习,得到最好的推广效果的统计分类方法,它可以根据有限的笔迹样本信息在模型的复杂性和机器学习能力之间寻求最优方法。笔迹鉴别是一种多类问题,可以通过构造决策函数,实现多类问题转化为两类问题。SVM可以根据两类样本数据寻求问题解决的最优分类面,可以使分类间隔达到最大,准确度达到最高。系统中我们采用第k个分类器由包括第k类样本和不属于第k类的所有样本两部分组成,将n类问题转化为n个两类问题的方法,构造解决多类笔迹问题的分类器算法:
其中,x是输入的笔迹信息,fk(x)是第k类分类函数。通过对fk(x)的大小进行排序,就可以得到最可能为书写人的候选人信息。
4 结束语
基于ARM嵌入式系统的文本独立笔迹鉴别系统实现了实时采集书写笔迹信息,对采集笔迹进行数字化处理后传递给上位机功能。通过对笔迹信息的预处理和基于多维度Gabor变换的特征分析,最后使用多类SVM分类其进行笔迹鉴别,具有速度快、准确率高等特点,具有一定的应用前景。
[1]卢玉书.基于离线文本独立的笔迹鉴别系统设计[J].武警学院学报,2009(2):87-91.LU Yu-shu.Handwriting identification system design based on off-line text-independent[J].Journal of Chinese People’s Armed Police Force Academy,2009(2):87-91.
[2]师宝山,张贵州.笔迹鉴别预处理算法的设计与实现[J].电子器件,2008(4):1357-1360.SHI Bao-shan,ZHANG Gui-zhou.Design and realization of pre-processing algorithms in computer handwriting identification[J].Chinese Journal of Electron Devices,2008(4):1357-1360.
[3]张德贤,郭小波,刘永平.笔迹鉴别预处理与特征抽取技术研究[J].微计算机信息,2006(25):310-312.ZHANG De-xian,GUO Xiao-bo,LIU Yong-ping.The preprocessing and feature extraction research on computer handwriting identification [J].Microcomputer Information,2006(25):310-312.
[4]刘海,吕岳.基于轮廓方向特征的脱机手写中文笔迹鉴别[J]. 电视技术,2011(21):131-134,144.LIU Hai,LU Yue.Text-independent writer identification of offline Chinese handwriting using contour-directional feature[J].Video Engineering,2011(21):131-134,144.
[5]刘爱真.基于HHT的脱机手写体汉字特征提取[J].计算机应用,2009(S2):289-290,293.LIU Ai-zhen.Feature extraction of off-line handwritten Chinese characters based on Hilbert-Huang transform[J].Journal of Computer Applications,2009(S2):289-290,293.
[6]杨彩霞.基于Gabor变换与最近邻分类器的字符识别方法[J].西安文理学院学报:自然科学版,2010(4):83-85.YANG Cai-xia.On the character identification based on Gabor alternation and adjacent classifier[J].Journal of Xi’an University of Arts and Science:Natural Science Edition,2010(4):83-85.
[7]刘宏,李锦涛,崔国勤,等.基于SVM和纹理的笔迹鉴别方法[J].计算机辅助设计与图形学学报,2003(12):1479-1484.LIU Hong,LI Jin-tao,CUI Guo-qin,et al.Writer identification using support vector machines and texture feature[J].Jouranl of Computer-ided Design and Computer Graphics,2003(12):1479-1484.
[8]沈聪.基于改进的多通道Gabor小波变换的笔迹鉴别[D].北京:北京工业大学,2002.