APP下载

一种改进的FCM算法在手写数字识别中的应用

2016-06-16郧阳师范高等专科学校计算机科学系湖北十堰442000

湖北工业职业技术学院学报 2016年2期

姜 琴(郧阳师范高等专科学校 计算机科学系,湖北十堰442000)



一种改进的FCM算法在手写数字识别中的应用

姜琴
(郧阳师范高等专科学校计算机科学系,湖北十堰442000)

摘要:模糊c均值(FCM,Fuzzy c-Means)算法是一种非常实用的模糊聚类算法,在非监督模式分类中占据着重要的地位。而手写数字识别在现实中也有着非常广泛的应用,如邮政编码、统计报表、银行票据等等。在FCM算法基础上,加入部分监督信息,并对手写数字图像用Zernike矩来筛选特征,最后通过MATLAB编程,验证了该改进的FCM算法对手写数字识别具有一定的可靠性。

关键词:FCM算法;手写数字识别;部分监督

0 引言

根据是否有教师指导,聚类方法分为无监督聚类和有监督聚类。对于没有任何先验知识来指导的分类,称之为无监督聚类;而有监督聚类,是指事先已知部分样本的隶属类别,需用一定的方法再对未知的样本划分类别的聚类。

在无监督聚类中,理论上比较完善并且应用非常广泛的是模糊c均值(FCM,Fuzzy c-Means)[1,2]类型的聚类算法。在实际中,若有一定的先验知识,即已知某些样本属于某个类别时,可以将该先验知识加入到FCM算法中,从而,人们研究出了多种具有部分监督信息的FCM算法。

1  FCM算法

设X={X1,X2,…,Xn}⊂Rn×q为样本集合,n为样本数,q为特征空间的维数。记c为类别数,U=[uij]c×n为模糊划分矩阵:其中uij(1≤i≤c,1≤j≤n)表示第j个样本Xj属于第i个类别的隶属度,uij应满足以下二个约束条件:

Bezdek定义了模糊c均值聚类算法的一般描述:

(3)式中V=(v1,v2,…,vc)为s×c矩阵,vj(j=1,2,…,c)∈Rs为第j类中心为点xj与第i类中心vi之间的距离公式。m为模糊指数,控制分类矩阵U的模糊程度。目标函数Jm(X,μ,v)是类内加权误差平方和目标函数,FCM算法就是一个使目标函数Jm(X,μ,v)最小化的迭代求解过程[3,4]。

2 改进的具有部分监督的FCM算法

假设ns为具有先验知识的样本个数,未知类别的样本数为n个,则总共样本数有ns+n个;其中n1个属于第一类,n2-n1个属于第二类,ns-ns-1个属于第s类。设具有先验知识的样本划分矩阵为U*,分类数依旧为c (s≤c),则划分矩阵U′=(U*,U),即为

则基于目标函数的改进的具有部分监督的模糊聚类一般描述为:

且满足下列条件:

其中,W为文献[5]所描述的特征加权矩阵。

根据拉格朗日乘数法,有如下计算步骤:

首先设定2≤c≤n,迭代停止阀值为ε,初始化聚类原型模式P(0),迭代计数器b=0;

步骤一:用下式计算或更新划分矩阵U′=(U*(b),U(b)):

(1)对于U*(b)的第k列,其最大隶属度为:

(2)无监督样本的隶属度矩阵U(b)为:

步骤二:用下式更新聚类中心P(b+1):

3 手写数字识别

手写体数字识别属于字符识别领域,其主要研究如何利用电子计算机来自动辨认人手写在纸张上的阿拉伯数字。相较于英文识别,汉字识别,脱机手写数字则是最难识别的。

在进行手写数字识别时,需要先对带有随机噪声的字符灰度值数字信号进行预处理。

通过预处理(参见文献[6],[7]),可将原始图像转二值化,并对尺寸和位置进行归一化处理。一般地,还需在预处理后的图像上提取特征,可用Zernike矩来筛选特征。

若图像的密度函数为f(x,y),其n阶Zernike矩的定义为

式(15)中,*表示取共轭,Zernike多项式Vnm(x,y)由下式给出:Vnm(x,y)=Vnm(r,θ)=Rnm(r)ejmθ,式中,n为非负整数并满足为偶数,实半径多项式Rnm(r)的定义为

Zernike多项式满足下述正交关系:

Znm在极坐标形式下可表示为:

Znm是一个复数,将实部记为Cnm,虚部记为和Snm,则:

根据正交性,Znm的反变换为

式中,M表示所需使用的矩的最高阶数。

考虑一幅图像,设其以α角度旋转,旋转后的图像用fr表示,则fr(r,θ)=f(r,θ-α)。设θ1=θ-α,旋转后的图像的Zernike矩的计算表示为:

令θ1=θ-α,则

可用项Rn-2,m(r)和Rn-4,m(r)来计算Zernike多项式Rnm(r)。迭代关系式的起始项可选Rnm(r)=rm。

这里:k1=(n-1)(n+1)(n-2)/2;k2=2n(n-1)(n-2);k3=-(n-1)3;k4=-n(n-1)(n-3)/2。对于不同的初始值m,都要重复整个过程。

4 改进的FCM算法在手写数字识别中的实验分析

现从UK测试表中截取了5000样本进行数据处理。先根据上面所说的特征提取方法提取出部分手写体数字的特征矢量,然后再将同一数字的不同矢量特征表达作为研究对象进行模糊聚类分析。如手写体的“2”的手写形式为,其特征矢量为C=[-1 -1 -1 0 -1 -1 -3 1 1 0 3 3 3 0 0];而的特征矢量为C=[-1 -1 0 -1 -2 0 -1 -1 -1 6 3 0 0 0 1]。以此类推。

表1 实验结果(ε=0.0015)

从上表可以看出,数字“2,3,4,5,8,9”的识别率都比较高,而“0”和“6”,“1”和“7”这两组数字,因为在字形上有些相近,人们在书写的时候,由于字迹潦草、习惯等原因,使得识别率相对于其他数字稍低。但总体来讲,此算法对手写数字识别具有一定的可靠性。

[参考文献]

[1]闵珊华,贺仲雄.懂一点模糊数学[M].北京:中国青年出版社,1985.

[2]Zadeh L A. Fuzzy sets[J].Information and Control,1965,8(5):338~353.

[3]王士同,夏祖勋,陈剑夫.模糊数学在人工智能中的应用[M].北京:机械工业出版社,1991.

[4]Bezdek J C. A review of probabilistic,fuzzy,and neutral model for pattern recognition[J].Journal of intelligent and fuzzy systems,1996,4(1):1~25.

[5]Xiaojun Tong,Qin Jiang,Haitao Gan,Shan Zeng,Kai Zhao. Research on the Calculation Mothod for Weight of the Feature Weight Fuzzy Clustering Algorithm[A]∥DCABES2008:677~682.

[6]夏德深,傅德胜.现代图像处理技术与应用[M].南京:东南大学出版社,1997.

[7]姜琴.模糊聚类分析及其在数字图像处理中的应用[D].武汉工业学院,2009.

Application of Improved FCM Algorithm in Handwritten Numeral Recognition

JIANG Qin
(Department of Computer Science,Yunyang Teachers College,Shiyan 442000,China)

Abstract:Fuzzy Means(FCM)algorithm,a practical fuzzy clustering algorithm,plays an important role in the unsupervised pattern classification. The hand -written numeral recognition is widely applied in different fields,such as postcodes,statistics statements,bank bills,etc. Partial supervision information is added in FCM algorithm,and characteristics are selected by Zernike moment with hand-written numeral images,and the improved FCM algorithm is proved to be reliable to the hand-written numeral recognition by means of MATLAB programming.

Key words:FCM algorithm;handwritten numeral recognition;partial supervision

中图分类号:TP391

文献标识码:A

文章编号:2095-8153(2016)02-0105-04

收稿日期:2016-03-27

基金项目:湖北省教育厅2015年度科研计划项目(Q20156002);郧阳师范高等专科学校科研基金项目(编号2012B03)阶段性成果。

作者简介:姜琴(1978-),女,郧阳师范高等专科学校计算机科学系讲师,硕士,研究方向:计算机图形图像及计算数学方面教学。