APP下载

基于MATLAB的字符特征提取及编码实现

2020-10-26

科教导刊·电子版 2020年22期
关键词:白点二值字符

(洛阳师范学院 河南·洛阳 471000)

0 引言

字符识别广泛应用于生活的各个方面尤其是在车牌识别和医疗图像识别等切实关系到人类日常生活质量的场景中,提高字符的识别率也显得尤为重要,而字符特征提取作为识别中的重要一步,直接关系到识别率,因此字符特征提取的研究也极具意义。

字符特征提取是指从经过尺寸归一化处理后的二值图像中提取出字符的关键特征,同时要满足特征向量的维数尽可能少,正确分类的精度尽可能高,系统有较高的稳定性和鲁棒性的要求。针对在实际生活中常用的数字和英文字母字符,本文提出一种将轮廓特征提取法和投影特征提取法相结合的方法,设置一个特征向量=[行轮廓特征,列轮廓特征,行投影特征,列投影特征]作为字符特征以便更好的进行字符识别。

1 字符图像预处理

在日常的得到的数字和英文字母字符图像常常存在大小不一致的问题,因此要将得到的字符二值图像进行尺寸归一化处理,本算法中采用的是双三次插值算法并将二值图像统一尺寸为10*18,其中图像的宽为18个像素点,长为10个像素点,在MATLAB中使用语句imresize(img,[10,18],'bicubic')编码实现。

2 字符特征提取

本文采用的是轮廓特征提取法和投影特征法相结合的方法,将这个方法提取到的特征用一个特征向量表示,将特征向量用于BP神经网络的自学习,进而得到训练好的BP神经网络。

2.1 轮廓特征提取法

轮廓特征提取法为分别选取二值图像中每行或每列的第一个白点(二值图像中值为1的像素点)到该行或该列中最后一个白点的距离作为特征向量值,若某一行或某一列中没有白点则设为0,若只有一个白点则为1。设置特征向量矩阵Fr=[]、Fc=[]分别用来表示行轮廓特征和列轮廓特征。

2.2 投影特征提取法

字符的投影特征在字符图像处理中广泛应用,其通过统计字符图像在行上或列上的每个像素点的像素值即白点(二值图像中值为1的像素点)或者黑点(二值图像中值为0像素点)的总数来分析字符特征。在本文中分别统计字符图像在每行以及每列的白点的数目作为投影特征,设置行投影特征向量Pr=[],列投影特征向量Pc=[]。

2.3 结合轮廓特征和投影特则

通过轮廓特征提取法和投影特征提取法分别得到了行轮廓特征Fr、列轮廓特征Fc、行投影特征Pr和列投影特征Pc,进而可设置总的特征向量Feature=[Fr,Fc,Pr,Pc]。

3 结论

本文分别提取轮廓特征和投影特征组合成字符的特征向量,用于字符识别,既能避免因单一特征造成识别的局限性,又增加了多个特征点进而提高识别率。

猜你喜欢

白点二值字符
医 学 指甲上有小白点是缺钙吗?
粉刷匠的孩子,真让我羡慕
消除大型锻件内白点缺陷的工艺方法浅析
刷子李
混沌伪随机二值序列的性能分析方法研究综述
支持CNN与LSTM的二值权重神经网络芯片
字符代表几
一种USB接口字符液晶控制器设计
基于二值形态学算子的轨道图像分割新算法
消失的殖民村庄和神秘字符