基于多投影的脱机手写藏文字符特征提取方法
2016-02-23蔡晓娟黄鹤鸣
蔡晓娟,黄鹤鸣
(青海师范大学 计算机学院,青海 西宁 810008)
基于多投影的脱机手写藏文字符特征提取方法
蔡晓娟,黄鹤鸣
(青海师范大学 计算机学院,青海 西宁 810008)
脱机手写藏文字符的识别能够促进藏文化的发展和传播,其识别的方法是根据脱机手写藏文字符图像的特征进行识别。由于原始定义下的行列投影向量对于脱机手写藏文字符图像的表示不够充分,文中提出一种基于多投影归一化的脱机手写藏文字符特征提取算法。首先,对脱机手写藏文字符图像分别在横向、纵向、主对角线方向和次对角线方向进行投影,得到行投影向量、列投影向量、主投影向量和次投影向量;然后,对投影向量进行归一化处理,将归一后的向量合并成一个向量,即为该脱机手写藏文字符图像的特征向量;最后,使用KNN分类器对测试样本进行识别。对建立的脱机手写藏文字符样本数据库中的样本进行实验。结果表明,该算法不仅计算简单,而且有较好的识别效果。
脱机手写藏文字符;特征提取;投影向量;归一化;多投影归一化向量
0 引 言
手写体文字识别[1-3]是模式识别的一个典型应用。随着藏文信息化程度的不断提高,越来越多的研究者开始进行脱机手写藏文字符识别方面的研究[4-9]。脱机手写藏文字符识别的关键是提取能充分代表藏文字符信息的特征。
多投影归一化特征是把图像的多投影特征和密度归一化结合生成的一种特征[9-12]。文献[9]采用图像投影法对藏文字符进行特征提取;文献[10]给出了“投影归一化”的定义;文献[11-12]对图像的投影方向进行扩展,在原有的横向投影和纵向投影基础上,给出了主对角线方向投影和次对角线方向投影的定义。
文中提出了一种基于多投影归一化的脱机手写藏文字符特征提取算法。算法首先对藏文字符图像进行平滑去噪、倾斜校正、归一化、二值化等环节的预处理,得到大小为48×24的字符图像;然后,使用行投影、列投影、主对角投影、次对角投影分别抽取字符图像的投影特征;再将字符图像的投影特征密度归一化,得到该字符图像的投影归一化特征;最后,利用KNN分类器[13-15]对测试样本进行特征识别。该算法可以得到较好的识别结果。
1 特征提取
二维图像的投影法是指投射线通过图像,在指定方向投射,得到被投图像光点的方法。归一化是将数值的绝对值化为相对值,简化计算。
1.1 投影归一化原始定义
(1)
(2)
归一化行投影向量和列投影向量分别为:
(3)
(4)
1.2 投影方向的扩展
由于行、列投影特征对脱机手写体藏文字符信息表示不够充分,因此,文中给出了扩展投影特征的定义,即主对角线方向的投影和次对角线方向的投影。
eZhu=
(5)
eCi=
(6)
归一化主投影向量和次投影向量分别为:
(7)
(8)
式中:eSum为同行列投影的eSum;pZhu称为主投影归一化向量;pCi称为次投影归一化向量。
2 分类器的设计
由于KNN算法是一种简单、易于理解、易于实现、无需估计参数的分类算法,因此,KNN成为了一种应用很广泛的分类器。
2.1 KNN算法原理
对于一个未知样本,KNN把它与已知样本一一比较,找出距离未知样本最近的k个已知样本,即未知样本的k个近邻。这k个近邻中属于哪一类最多,则把这个未知样本归于哪一类。
KNN可以表示为:设有N个已知样本分属于c个类wi,i=1,2,…,c,考查新样本x在这些样本中的前k个近邻,设其中有ki个属于wi类,则wi类的判别函数为:
(9)
在实际应用中,k的取值需要根据样本情况进行选择,通常k的取值为奇数。
2.2 KNN算法步骤
使用KNN分类器对脱机手写藏文字符进行特征识别,具体步骤如下:
(1)将藏文字符图像提取出来的N维特征与该字符图像所属的类别对应,即将N维的特征向量扩展成N+1维。其中的前N维仍存放该字符图像的特征,第N+1维存放该字符图像所属类别的类别号。
(2)确定近邻个数k的值,近邻个数能够影响分类的结果,通常k为奇数。
(3)选择一个测试样本的特征向量X与训练集中所有样本的特征向量进行相似度比较。相似度是指两向量之间的欧氏距离。测试样本的特征向量X与训练样本的特征向量Y相似度表达式如下:
(10)
(11)
(4)对数组d中第1列数采用冒泡排序的方法,进行k次排序,得到数组d中第1列数的前k个值是按从小到大的顺序排列的。数组d中的第2列数也随着第1列数的变化而发生改变。
(5)对数组d中第2列数的前k个数进行分析比较,类别号最多的记为label,则该测试样本字符可以判定为label类。
(6)判断label与X(N+1)的值是否相等。若相等,则表示该测试样本识别正确;反之,则表示该测试样本识别错误。
3 实验结果和分析
文中提出的方法是在Windows7操作系统下使用MATLAB7.0编程实现的。
文中实验使用的数据是来自实验室自建的脱机手写藏文字符样本数据库。该数据库是由藏文字符的30个辅音组成,表1给出了每个藏文字符的样本个数。该样本数据库中样本的总数为8 658个,选择每个辅音字母样本的80%作为训练集,20%作为测试集。
表1 藏文字符对应的样本个数
图1为实验中用到的不同藏文字符的图像。
图1 部分藏文字符样本
文中实现的脱机手写藏文字符的识别系统有预处理、特征提取和分类决策。具体流程如下:
(1)脱机手写藏文字符图像经过预处理后得到大小为48×24的二值图像,即可以用0-1矩阵bw表示该字符图像。其中,1表示描述藏文字符的像素,0表示背景像素。
(2)对bw进行多方向投影分别得到行投影向量eRow、列投影向量eCol、主对角线方向的投影向量eZhu和次对角线方向的投影向量eCi。
(3)对投影向量分别进行归一化处理,根据式(3),(4),(7),(8)可以得到行投影归一化向量pRow、列投影归一化向量pCol、主投影归一化向量pZhu和次投影归一化向量pCi,然后将这些投影归一化向量组合成262维的多投影归一化特征向量,即投影归一化特征为:
(4)利用KNN分类器对1 743个待测手写藏文字符样本分别进行双投影归一化(行、列投影归一化)特征识别和多投影归一化(行、列、主、次投影归一化)特征识别。
表2给出了平均识别率以及识别一个样本需要的时间,即样本的平均识别率和识别时间。
表2 投影归一化特征的识别效果
根据对脱机手写藏文字符图像进行投影归一化生成特征向量,使用KNN分类器进行识别分类,可以得到该识别系统的识别效果。对这些识别效果进行分析可以得到以下结果:
(1)基于双投影归一化的特征提取方法,在k=1,2,3时,识别率随k的增加而增加,在k=5时达到最高。
(2)基于多投影归一化的特征提取方法,在k=3时,识别正确率最高。
(3)由表2可知,在k的取值相同时,基于多投影归一化特征的识别正确率要明显高于基于双投影归一化特征的识别正确率。在k=3时,识别正确率最高,最高达到91.34%。
(4)由表2可知,同一归一化特征的识别,识别时间随k的增加而延长。
(5)基于多投影归一化特征的识别时间要比基于双投影归一化特征的识别时间长。
4 结束语
文中提出了一种基于多投影归一化特征的脱机手写藏文字符特征提取的方法。使用KNN分类器,对1 747个待测样本进行测试。实验结果表明,与双投影归一化特征提取相比,多投影归一化特征提取的识别效果更好。
[1] 王建平,王梦泽.三枝粗糙集和变粒度原理的手写体汉字识别[J].计算机工程与应用,2014,50(22):223-227.
[2] 朱程辉,甘 恒,王建平.基于FSVM脱机手写体汉字分类识别研究[J].计算机工程与应用,2014,50(23):189-193.
[3] 姜 文,刘立康.基于实值Gabor能量特征的手写体维文字符识别[J].计算机工程与设计,2013,34(9):3273-3278.
[4]HuangHeming,DaFeipeng.WaveletandmomentsbasedofflinehandwrittenTibetancharacterrecognition[J].JournalofInformationandComputationalScience,2013,10(6):1855-1859.
[5]HuangHeming,DaFeipeng,HanXiaoxu.Wavelettransformandgradientdirectionbasedfeatureextractionmethodforoff-linehandwrittenTibetanletterrecognition[J].JournalofSoutheastUniversity(EnglishEdition),2014,30(1):27-31.
[6] 李永忠,王玉雷,刘真真.藏文印刷体字符识别技术研究[J].南京大学学报:自然科学,2012,48(1):55-62.
[7]MaLL,LiuHD,WuJ.MRG-OHTCdatabaseforon-linehandwrittenTibetancharacterrecognition[C]//Procofinternationalconferenceondocumentanalysisandrecognition.Beijing,China:[s.n.],2011:207-211.
[8]HuangHM,DaFP.Sparserepresentation-basedclassificationalgorithmforopticalTibetancharacterrecognition[J].Optik-internationalJournalforLightandElectronOptics,2014,125(3):1034-1037.
[9] 王维兰.藏文基本字符识别算法研究[J].西北民族学院学报:自然科学版,1999,20(3):20-23.
[10] 周治紧,李玉鑑.基于投影归一化的字符特征提取方法[J].计算机工程,2006,32(2):197-199.
[11] 盛业华,张 卡,叶 春,等.基于灰度投影的数字近景摄影立体影像匹配[J].光学学报,2005,25(12):1623-1628.
[12] 邵 楠,张 科.基于投影熵特征的图像识别算法[J].计算机应用,2013,33(10):2874-2877.
[13]MaLong,XiaoBaohua,WangChunheng.SparserepresentationbasedonK-nearestneighborclassifierfordegradedChinesecharacterrecognition[C]//ProcofPCM.Berlin:Springer,2010:506-514.
[14]WangMengzuo,ZhangDavid,WangKuanquan.Onkerneldifference-weightedk-nearestneighborclassification[J].PatternAnalysisandApplications,2008,11(3):247-257.
[15] 卜凡军,钱雪忠. 基于向量投影的KNN文本分类算法[J].计算机工程与设计,2009,30(21):4939-4941.
Feature Extraction Method of Off-line Handwritten Tibetan Character Based on Multiple Projection
CAI Xiao-juan,HUANG He-ming
(School of Computer Science,Qinghai Normal University,Xining 810008,China)
Off-line handwritten Tibetan character recognition can promote the development and propagation of Tibetan culture,and the method of classification is based on the feature of off-line handwritten Tibetan character image.Since original definition of projection entropy does not make full use of image information,a feature extraction method of off-line handwritten Tibetan character based on multiple projection normalization is proposed.Firstly,an off-line handwritten Tibetan character image is scanned in horizontal,vertical,main diagonal and secondary diagonal directions to create a row projection vector,a column projection vector,a main projection vector and a secondary projection vector.Secondly,all projection vectors are normalized to create a multiple projection normalized vector that is the feature vector for this character image.Finally,KNN classifier is used in classification.The proposed method is tested on the developed off-line Tibetan handwritten character sample database.The experimental results demonstrate that the proposed method is not only easy in calculation but also efficient in recognition accuracy.
off-line handwritten Tibetan character;feature extraction;projection vector;normalization;multiple projection normalized vector
2015-06-29
2015-09-30
时间:2016-02-18
国家自然科学基金资助项目(61462072);教育部春晖计划项目(Z2104020)
蔡晓娟(1991-),女,硕士研究生,研究方向为模式识别与智能系统;黄鹤鸣,教授,硕导,博士,研究方向为模式识别与智能系统。
http://www.cnki.net/kcms/detail/61.1450.TP.20160218.1636.078.html
TP301
A
1673-629X(2016)03-0093-04
10.3969/j.issn.1673-629X.2016.03.022