基于在线序列极限学习机的车牌字符识别方法

2015-07-24崔雷涛

网络安全与数据管理 2015年23期

关键词：字符识别学习机训练样本

崔雷涛，陈亮，马强

（东华大学信息科学与技术学院，上海 201620）

基于在线序列极限学习机的车牌字符识别方法

崔雷涛，陈亮，马强

（东华大学信息科学与技术学院，上海 201620）

当前基于神经网络方法的车牌字符识别技术都使用固定的训练样本，学习的效果受初始样本限制，对于识别过程中新出现的不同角度、光线等特征的字符图片不能自适应地学习。本文针对这个问题提出了基于在线序列极限学习机（OS-ELM）的车牌字符识别方法。在样本实时更新中使系统自适应调整网络权值，不断提高识别准确率。本文设计了汉字、字母、字母混合数字三个字符分类器，根据车牌字符的排列特征识别相应的字符。通过与传统ELM方法和BP神经网络法对比，结果证明该字符识别技术达到了较高的识别率，在训练速度上也比BP神经网络法提高了2～3个数量级。

车牌字符识别；极速学习机；在线序列；特征提取

0 引言

车牌识别是智能交通系统（Intelligent Transportation System，ITS）的重要组成部分。在交通拥堵、停车场管理和套牌检测等众多领域得到了广泛的应用。在车牌识别系统中字符识别是核心与难点，目前字符识别方法主要有模板匹配法、神经网络技术，以及两者的联合应用。

中国大陆车牌字符中含一位汉字且汉字结构复杂，识别困难，出错率高，模板匹配法对于相似的字符区分能力差，同时受光线和天气等复杂情况的影响，在特征数据维数过大时效率较低。神经网络技术以 BP（Back Propagation）算法居多［1-2］。BP神经网络具有良好的自学习性和存储知识的能力，但网络的训练速度慢，存在局部最优解等问题。因而基于该方法的车牌字符识别只能离线训练样本，测试精度也较依赖于初始样本的全面性。

Huang等［3-5］提出了极限学习机（Extreme LearningMachine，ELM），设置合适的隐藏层节点数，为输入权值和隐藏层偏差随机赋值，输出层权值通过最小二乘法得到，整个过程一次完成，无需迭代，与 BP神经网络相比学习速度显著提高，于是出现了一些基于ELM及其改进算法的车牌识别方法。Gou Chao等［6］利用 ELM算法构建分类器，设计了完整的车牌识别系统，取得了较好的分类性能。但是所采用的训练样本始终是初始样本集，对于车牌识别，初始训练样本包含全部拍摄角度的车牌字符图片是比较困难的，所以ELM算法对于新出现的字符样本没有学习能力，限制了网络的鲁棒性和泛化能力。因此有必要寻找一种算法，可以将就近识别的样本加入训练集，做到实时训练。

本文设计了基于在线序列极限学习机［7］（Online Sequential Extreme Learning Machine，OS-ELM）的车牌识别分类器，能够在小样本数量的基础上，实时训练，自适应调整网络参数，可快速地获得高识别率。并提出一种新的适合神经网络结构的特征提取方式，以降低提取特征的维度，满足车牌识别准确性、鲁棒性和实时性要求。

1 车牌字符的特征提取

本文主要采用字符的网格特征和图像矩阵行列信息作为待识别的字符特征。由于汉字字符笔划错综复杂且分布不均，而字母和数字字符相对比较简单，容易提取特征值，因而在提取特征方法的具体实施上两者有所差别，以便后续投入不同的分类器。

对汉字的特征提取具体步骤为：

（1）网格特征提取。将归一化后的汉字字符（大小为32×16）平均划分成 4×4大小相等的子区域，计算每个子区域中白色像素值数量，产生 32个网格特征。

（2）行列特征信息提取。从汉字图像第一行开始，提取第一行中白色像素点的个数，之后将每隔两行的下一行定为目标行，逐一统计目标行中的白点数。用同样方法对图像矩阵列进行操作。至此，提取出 17个行列特征信息值。汉字“浙”的字符特征提取过程示例如图1。

图1 汉字字符特征提取过程示例

对于英文字母字符和数字字符的特征提取，也是采用网格特征结合行列特征的提取方法。但是由于字母、数字结构简单，为便于训练，提取较小维数的向量作为特征向量。本文提取了 16个网格特征和 9个行列信息特征共 25维特征向量。

2 车牌字符分类器的设计

本文根据车牌字符的排列特点构造了三个基于OS-ELM的子网络分类器，分别为汉字字符分类器、字母字符分类器以及字母/数字混合字符分类器，一方面降低了识别时间，另一方面也提高了识别精度。三种分类器如图2所示。

分类器配置方面，提取的特征向量维数即输入节点数目。训练样本中汉字字符有 14种，分别为鲁、京、浙、豫、粤、陕、辽、苏、吉、琼、沪、桂、冀、闽；车牌中没有 O和 I两个字母，所以字母有 24种，字母加数字有 34种。三种分类器配置如表1。

图2 分类器组合

表1 分类器的配置

3 OS-ELM车牌字符识别算法设计

传统的极限学习机只能学习不变的数据，而如果初期训练样本不能包含全部角度的字符图片，则新字符图片由于具有不同角度，以及受遮挡、污迹等影响特殊特征会难以识别，故而限制了网络的泛化能力。部分特殊特征的字符图片如图3所示。

图3 部分倾斜、受遮挡的字符图片

所以本文采用OS-ELM算法，将后继车牌样本分批加入训练，增强网络的泛化能力，构建基于在线序列极限学习的车牌识别方法。网络的基本结构如图4。以汉字分类器设计为例，将提取 400张汉字字符图片特征数据均分为4批先后输入网络，学习过程如下：

图4 网络基本结构

（1）初始化阶段。取 k=0，其中 k为送到网络的字符数据批次。给定激活函数 g（x）=隐层节点数目L和初始训练数据 Z0=｛（xi，ti）｝N0，其中 xi为输入特征向量，ti为每个特征向量对应的字符类别，N0=100，L由交叉验证法试验后取为 40。随机产生输入权值向量 ωj和偏置bj初始化网络，则由参考文献［6］，输出权值向量 β（0）= P0H0TT0。其中：

（2）在线学习阶段。给定第 k+1批数据，计算出隐层输出矩阵为 Hk+1，输出权值向量为：

令 k=k+1，返回到在线学习阶段，不断更新参数 H和 β，直到学习完 4批数据。

4 实验结果及分析

实验中选取了100幅实际的车牌图片。用三个OSELM分类器进行整体的识别。隐藏层节点数目本文用5折交叉验证法选择最优数目。识别速度取 50次测试结果的平均值。识别结果如表2所示。

表2 三种OS-ELM分类器识别性能

本文还将 OS-ELM法与已有的ELM法、BP神经网络的车牌字符识别方法进行了实验结果的比较。具体比较为：从大量准确分割出的单个字符中选取 100张包含字母及数字的字符图像作为对比测试样本，100张作为ELM法和 BP神经网络法的训练样本，同时作为 OSELM训练样本的第一批输入样本，再选取200张字符图片分别作为ELM法的第二、第三批训练样本。测试结果如表3所示，其中识别结果采取50次识别结果的平均值。

表3 不同算法性能对比

从表2、表3的实验对比结果可以看出，BP神经网络算法由于本身繁琐的迭代过程，因而训练耗费时间很长。OS-ELM法相比于BP神经网络法不仅在字符的识别率上表现出了更令人满意的效果，能达到 90%以上，而且在识别速度上更是体现出很大的优越性，训练速度比BP法高出近200倍。与ELM法相比，识别速度相差不多，但有更好的泛化性能。

5 结束语

本文采用在线序列学习机算法对车牌字符进行识别，与BP法相比训练时间短，能够满足在线训练的要求；与ELM法相比有更好的泛化能力。采用字符的网格特征和图像矩阵行列信息提取的特征提取方法，降低了特征维数。针对车牌字符的排列特征，设计了汉字、字母、字母与数字三个分类器，能够提高分类准确率并且缩短运算时间。该车牌字符识别技术可以应用于道路监控中对实时性要求较高的场合。

［1］KOVAL V，TURCHENKO V，KOCHAN V.Smart license pattern recognition system based on imaging processing using neural network［C］.Procedings of the Second IEEE International Workshop on Intelligent Data Acquisition and Advanced Computing System-technology and Applications.Lviv，Ukraine：IEEE press，2003：123-127.

［2］刘雄飞，朱盛春.车牌字符多特征提取与 BP神经网络的识别算法［J］.计算机仿真，2014，31（10）：161-164.

［3］HUANG G B，ZHU Q Y，SIEW C K.Extreme learning machine：theory and applications［J］.Neurocomputing，2006，70（1）：489-501.

［4］HUANG G B，WANG D H，LAN Y.Extreme learning machines：a survey［J］.Intelligent Journal of Machine Learning and Cybernetics，2011，2（2）：107-122.

［5］HUANG G B，ZHOU Hm，DING X J，et al.Extreme learning machine for regression and multiclass classification［J］. IEEE Transactions on System， Man， and Cybernetics，2012，42（2）：513-529.

［6］Gou Chao，Wang Kunfeng，Yu Zhongdong.License plate recognition using MSER and HOG based on ELM［C］.IEEE Service Operation and Logistics，and Informatics，2014：217-221.

［7］Liang Nanying，Huang Guangbin，SARATCHANDRAN P，et al.A fast and accurate online sequential learning algorithm for feedforward networks［J］.IEEE Transactionson Neural Networks，2006，17（6）：1411-1423.

License plate character recognition method based on online sequence extreme learning machine

Cui Leitao，Chen Liang，Ma Qiang
（College of Information Science and Technology，Donghua University，Shanghai 201620，China）

Current license plate character recognition technology which based on neural network method always uses fixed training samples， so learning effect isrestricted by theinitialsampleand can not learn adaptively forthe new appeared characteristics in indentifying process，like different angles and light.This paper presents a new license plate character recognition method based on the online sequence learning machine（OS-ELM）method，which makes system adjusts network weight selfadaptively in real-time updating，and improves recognition accuracy.This paper designs Chinese characters classifier，letters classifier and letters mixed number classifier on the order of each character， which recognizes corresponding characters according to the arrangement of license plate character features.After compared with the traditional ELM method and BP network method，the result proves that this character recognition technology not only achieves a higher recognition rate，but also computes faster than the BP neural network for 2～3 orders of magnitude on the training speed.

license plate character；extreme learning machine；online sequence；feature extraction

TP391.4

1674-7720（2015）23-0030-03

崔雷涛，陈亮，马强.基于在线序列极限学习机的车牌字符识别方法［J］.微型机与应用，2015，34（23）：30-32.

2015-07-26）

崔雷涛（1990-），通信作者，男，硕士研究生，主要研究方向：极限学习机算法、车牌识别等。E-mail：717633923@qq.com。

陈亮（1970-），女，博士，副教授，主要研究方向：机器学习、数据挖掘等。

马强（1990-），男，硕士研究生，主要研究方向：布匹瑕疵检测、极限学习机算法等。