物联感知和生物识别在实名制票务中的研究
2013-03-03李云飞
钱 玥,李云飞,陈 良
1.苏州大学 计算机科学与技术学院,江苏 苏州 215006
2.苏州大学 机电工程学院,江苏 苏州 215006
1 引言
车票实名制是指公民在购买火车票和乘坐火车时,需要登记、核查个人身份的一种制度。车票实名制是保障乘车安全,防范恐怖袭击,杜绝“黄牛”倒票,解决“一票难求”等社会顽疾的有效措施。
自2011年6月1日起,全国动车组列车全面推行了购票实名制度。旅客凭有效身份证件购买火车票,车票票面上增印有旅客身份信息,旅客进站时需持购票时所用的身份证件和车票,经车站核对相符后,方可进站。这一技术方案存在以下三点不足:(1)现有的实名制票务依赖于身份证,导致购票时间长且丢失后难以补票,给乘客带来不便;(2)印有个人信息的实名制车票存在隐私泄漏的风险;(3)实名制车票依赖人工进行检票,检票效率低,当前实名制系统只能保证5%的抽检率,检票实名制难以保证,严重影响了实名制票务系统应用的实际效果。
本文针对现有的实名制票务方案的缺陷,提出了基于物联感知和生物信息识别的实名制票务系统。系统采用2.4 GHz RFID标签取代普通车票,并创新性地引入生物识别技术,可实现一种全自动的实名制售检票流程。目前国内尚无这一方面的研究。
2 系统设计
系统采用最新的物联网层次模型并集成于现有的轨道交通AFC系统,由前端的检票系统和后端的售票系统组成。售票可通过网络售票、手机售票和站台售票三种方式进行,在售票时录入乘客的生物信息。检票系统在保留原有AFC接口的基础上,通过RFID阅读器和视频采集模块采集乘客的生物信息进行比对,自动完成检票流程。实名制票务系统框等如图1所示。
图1 实名制票务系统框架图
该系统具有以下优点:(1)以生物信息取代身份证信息,具有普遍性、典型性和代表性;(2)克服纸质车票没有存储空间的缺陷,存储乘客信息和车票信息,实现双重认证;(3)通过射频识别实现“非示出型”检票,极大地提高通行效率。
下面分别对售票模块和检票模块予以阐述。
售票模块:采用RFID电子标签作为车票的载体。售票模块通过购票者上传照片或者现场照相采集购票者的人脸信息。人脸图像采集完成后,系统利用人脸特征提取算法提取购票者的人脸特征信息,并将特征信息、车次信息以及标签ID号上传到服务器。
检票模块:检票模块的总体框图如图2所示。
图2 检票模块框图
检票模块安装于闸机设备上,对乘客身份进行校验。核心微处理器通过UART与RFID阅读器连接,控制阅读器的读写和操作频率;通过I2C总线与RTC连接,读取当前的时间信息;通过SPI总线与片外Flash相连,该Flash存放闸机放行的合法车次信息;通过网络接口与服务器相连接,根据ID号查询下载乘客的生物信息与车次信息;通过UART与人脸识别模块相连,人脸识别模块提取视频采集图像的特征信息,并将提取到的信息发送给微处理器进行比对,通过距离测量比较图像中人脸特征与数据库中存储的人脸特征之间的相似性[1-2],判定两幅图像是否为同一人。
模块的工作流程见图3。当乘客进入RFID读写器问询范围内时,标签被读写器发射的信号唤醒,其ID号被读取。微处理器产生一个中断,从服务器中查询车票ID所对应的车次信息和乘客身份信息,将车次数据与Flash中存储的车次数据进行比较,如果不符则报警;如相符则微处理器发送命令驱动摄像头获取一帧图像,并运行人脸检测算法,如果采集到的图像中不含人脸,则驱动摄像头再次获取视频图像;反之,则对检测得到的人脸图像进行预处理,提取其特征信息,并与车票对应的人脸特征信息进行比对。如果匹配成功,则闸机放行乘客通过;反之,则说明乘客未携带合法车票,闸机口关闭。至此,完成车次和身份的双重校验。在此流程中,乘客无需出示车票,无需提交身份证明,单人通关时间可控制在1 s左右。
图3 检票模块工作流程图
由上文可见,实名制票务系统的两个关键技术为射频识别技术与生物特征识别技术。考虑到RFID及其读写器已经相当成熟,因此,本文研究重点主要集中在乘客生物特征尤其是人脸特征的识别与提取上。人脸检测和人脸特征提取是人脸识别过程中的两个关键步骤,两者选用的核心算法很大程度上决定了实名制系统的性能,特别是实时性。本文研究表明,现有标准Viola-Jones算法和Fisher脸算法在人脸检测和识别速度方面有待改进,无法满足大批量乘客同时进行实名制检票的实时性要求。因此,本文对相应算法进行了一些优化和改进,并引入了遗传算法以期缩短人脸检测及识别时间。
3 关键技术
3.1 人脸检测
人脸检测是指在图像中确定人脸是否存在并对其进行定位的过程。实名制售检票系统所采集的视频图像中人脸位置未知,因此,从图像中找到人脸并将其从背景中分离开来是进行下一步特征提取工作的前提。考虑到检票模块的实时性和准确性要求,人脸检测算法应满足检测率高、计算复杂度低的要求。
2001年,剑桥大学的Pual Viola和Michael Jones提出Cascade-Adaboost人脸检测方法[3],该算法基于Adaboost算法[4],引入了“积分图像”的概念以加快人脸检测的计算速度,具有实时性好、误检率低的优点。但该算法对光照较为敏感[5],考虑到实名制票务系统应用的环境光照条件稳定良好,因此,本系统选择Cascade-Adaboost算法进行人脸检测。分类器的训练过程如下:
(1)从i=1开始,训练第i级的强分类器(共有强分类器Ng个):
①初始化样本的误差权重。
②进行T次迭代,每次迭代执行以下操作:
(a)权重归一化;
(b)计算矩形特征j在训练样本集上的特征值cj(x),并构造弱分类器函数如下:
其中 p指示不等式方向,θ为阈值;
(c)计算当前权重误差,选择本轮训练中具有最小训练误差的分类器;
(d)更新样本对应的权值,增加被误分类的样本权值。
③将选出的弱分类器加权累加形成强分类器。
(2)将Ng个强分类器串联形成级联分类器。构造级联分类器时存在两个矛盾[6]:
①降低强分类器的阈值在增加检测率的同时也增加了误检率;
②增加弱分类器个数在降低误检率的同时也增加了计算时间。
实际应用中,实名制检票系统对实时性有极高的要求。一旦出现对误检人脸的情况,系统将重新获取人脸图像并运行检测程序对图像中的人脸进行二次检测,大大增加了系统的通行时间。因此,为满足系统的实时性和准确性要求,本文在以下两个方面改进了算法,以在保证检测率的前提下最小化误检率和检测时间。
首先,对强分类器的最大误检率 fmax和最小检测率dmin的选择进行优化。Viloa-Jones算法采用预先设定 fmax及dmin值的方式训练每一层的强分类器,当第i层分类器满足误检率 fi≤fmax且检测率di≥dmin时,第i层分类器训练完成。本文采用了一个动态的方法[7]来决定每一层分类器的 fmax、dmin以及阈值θi,算法过程如下:
(1)找出ROC(Receiver Operating Characteristic)曲线上所有的点(fi1,di1),(fi2,di2),…,(fin,din)。
(2)求解以下优化问题,以得到解xk:
其中,Fi和Di分别为1至i-1层分类器所达到的误检率,Fg为系统所允许的最大误检率,Ng为级联分类器的层数。
(3)令 xa、xb为上式两个非零解,以满足 fa<fb。
(4)如 xb≥1,则返回 (fib,dib)对应的阈值 θb;反之,则返回(fia,dia)对应的阈值θa。
其次,利用遗传算法[8]对强分类器训练过程中的特征选择进行优化。算法将每个染色体定义为一个包含ni个弱分类器的第i级强分类器,ni的值可由θi确定。染色体的适应度定义为分类器的误检率。算法过程如下:
(1)初始化,利用贪心法训练S个染色体。
(2)对每一代染色体种群进行进化迭代:
①杂交和变异。定义杂交系数Pc=0.5,变异系数Pm=0.1。
②Adaboost学习,确定染色体的适应度参数。
③将适应度分数小于平均适应度的k个染色体淘汰,将适应度分数最高的k个染色体加入到染色体种群。
(3)进化迭代完成后,选择适应度最高的染色体作为第i级分类器。
经过以上优化,系统通过训练得到25层级联分类器,与传统的Viloa-Jones算法相比,检测速度提高约50%。此外,检测过程中可舍弃对待检图像进行图像金字塔操作的步骤。由于人脸在待检图像中的大小可以被确定,因此无须对待检图像进行缩放处理,进一步加快了检测速度,可满足实名制售检票的应用要求。
3.2 特征提取
任何图像都可看成是高维空间的元素,在利用统计方法对人脸图像进行处理、分析和识别时,可采用线性或非线性的处理方法将它们投影到低维的空间上。线性投影处理包括PCA、ICA和LDA等方法,而非线性投影处理则有傅里叶变换、小波变换和滤波算子等方法[2,9]。本系统所研究的人脸识别任务属于认证任务,即判断某人的脸相是否符合非图像信息(RFID车票)所声称的身份,为一种一对一的识别任务,计算量相对较小。在保证实时性的前提下综合考虑鲁棒性、认证率及错误接受率是算法所需考虑的主要性能评估指标。Fisher脸方法[10]结合了PCA和LDA算法,强调了不同人脸之间的差别,对于光照、姿态及视角变化具有较强的鲁棒性;同时,Fisher脸方法克服了LDA方法计算矩阵维数过大、求解困难的问题。然而在实践中,Fisher脸方法得到的特征子空间存在冗余的现象,去除特征空间中的冗余信息。不仅可以加快识别速度,而且可以提高识别的准确度。人脸特征选择是从一组数量为D的原始特征中选出数量为d(D<d)的一组最优特征,消除冗余信息。因此,本文采用一种改进遗传算法(OGA)[11]来对人脸特征提取进行优化。改进的Fisher脸算法步骤如下:
(1)计算训练集图像的PCA子空间。
(2)将所有中心化后的图像,中心化后的类内平均图像和总体平均图像投影到PCA子空间。
(3)求解第i类的类内散布矩阵Si和总的类内散布矩阵Sw。
(4)计算类间散布矩阵SB。
(5)计算Sw和SB的广义特征值和特征向量,得最佳分类子空间WLDA。
(6)组合PCA和LDA的子空间,得最优人脸投影子空间。
为消除冗余,在得到投影子空间后,用OGA方法对子空间进行优化:
(1)初始化群体规模为n,均匀设计初始化群体,将染色体定义为一个人脸特征子集。
(2)计算染色体的适应度(人脸识别正确率),对染色体进行混合选择。
①杂交和变异,定义杂交系数Pc=0.5,变异系数Pm=0.1。
②淘汰适应度低于设定阈值的染色体,剩下m个个体。
③如果m≠n,则动态补充新子代:将上一代的a×n(a=0.2-0.4)个个体进行3~5次随机变异,生成n-m个新个体投入子代,继续循环;反之,则跳出循环。
(3)判断人脸特征子集的适应度是否达到预设值,如果达到,则退出循环;反之,继续搜索特征子集的优化解。
经过OGA方法的优化,本文算法较之Fisher脸方法,其运行速度约提高10%,识别率约提高8%左右。
4 实验结果
为验证实名制票务系统的可行性与稳定性,搭建了检票模块的实验平台(参见图1的检票系统),并招募了79名志愿者模拟检票进站的乘客。实验平台包括检票用闸机一台、RFID读写器、RFID车票、摄像机、图像处理模块及运行数据库程序的服务器。人脸检测及识别程序运行在实验平台上用于乘客生物特征的识别与校验,以实现实名制功能。
实验过程中,光照条件及采集图像时乘客与摄像机间的距离受到严格控制。实验过程模拟单一通道检票过程,79名志愿者模拟乘客携带(无需出示)RFID车票依次通过闸机。任意RFID车票具有唯一的标签ID号,及其所对应的车次和乘客人脸特征信息(在购票环节记录于服务器的数据库中)。在检票时,经摄像机拍摄的人脸图像,其特征信息如车票ID对应的人脸特征一致,则该车票定义为“合法车票”;反之,则为“非法车票”。
通过在这一单通道实验平台上进行多次实验,得到包括识别率、检测及识别时间在内的多项实验数据,以得到该平台的性能指标。
首先,给出以下指标定义以表征人脸检测实验结果:
PASS,合法车票持有者被闸机正确放行;
FAIL,合法车票持有者被闸机错误拒绝;
FIND,非法车票持有者被闸机正确拒绝;
MISS,非法车票持有者被闸机错误放行。
考虑到系统运行的实时性要求,可适当降低错误接受率即MISS值的要求,以加快识别速度。实验中,当MISS值控制为1%时,系统的正确通行率可达99.5%。具体数据如表1所示。
表1 系统识别率指标(MISS=1%)
其次,通过在程序中加入计时函数,统计系统从获取图像到得出识别结果之间的运行时间。通过多次实验,得到实验结果如表2所示。
表2 人脸检测及识别时间实验结果
最后,实验还对79名志愿者依次通过检票口的总时间进行了统计,共进行了10次重复实验,每次的通关时间及总体平均时间等数据,如图4所示。
图4 通关时间(平均时间T=75.6 s)
根据以上数据,可得实名制票务系统的具体性能指标如表3所示。可见,RFID车票可以在0.1~1.0 m的距离范围内可以被精确射频识别,实现“非示出型”检票,同时人脸检测和特征识别速度控制在0.2 s以内,检票环节的整体通关时间可以控制在1 s之内,是现有手工实名制查验效率的30倍。
最后,考虑一个实际应用案例。目前,停靠及始发高铁、动车的火车站通常为列车开设A、B两个检票口,每个检票口安装有4台检票闸机。假定列车停靠某站时,等待检票上车的乘客有300人,则每个通道平均需要检票37.5人次。在实际检票过程中,乘客往往随身携带行李,较之理想的实验条件下的通关过程,速度应略有下降。以实际通关速度为2 s来计算,则完成检票需要75 s可以满足实际应用的需要。
表3 系统性能指标
5 结语
实名制是轨道交通产业的热点问题。由于生物特征具有普遍性、唯一性、可测量性和稳定性的特点,生物识别技术为实名制车票提供了一个可行的解决方案。本文的创新之处在于:(1)利用RFID技术实现了闸机对乘客身份信息的主动感知;(2)改进了Viola-Jones人脸检测算法,并且利用基于OGA方法改进的Fisher脸方法对乘客身份进行认证,对姿态、视角变化有较强的鲁棒性,提高了识别率和运行速度;(3)利用物联感知和生物识别技术,对车票和乘客身份实现双重认证。实验证明系统具有较高的可行性及广泛的应用前景。
[1]周辉.基于嵌入式Linux的人脸识别系统的研究[D].西安:长安大学,2009.
[2]李武军,王崇骏,张炜,等.人脸识别研究综述[J].模式识别与人工智能,2006,19(1):58-66.
[3]Viola P,Jones M J.Robust real-time face detecion[J].International Journal of Computer Vistion,2004,57(2):137-154.
[4]Freund Y,Schapire R E.A decision-theoretic generalization of on-line learning and an application to boosting[J].Journal of Computer and System Sciences,1995,55(1):119-139.
[5]李外云.基于ARM架构的嵌入式人脸识别技术研究[D].上海:华东师范大学,2008.
[6]塔娜.基于ARM的人脸识别系统设计与实现[D].长春:东北师范大学,2009.
[7]Brubaker S C,Wu J,Sun J,et al.On the design of cascade ofboosted ensembles forface detection[J].International Computer Vision,2008,77(1):65-86.
[8]YangM,Crenshaw J,AugustineB,etal.AdaBoost-based face detection forembedded systems[J].ComputerVision and Image Understanding,2010,114(11):1116-1125.
[9]李江.红外图像人脸识别方法研究[D].长沙:国防科技大学,2005.
[10]Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfacas vs fisherfaces:recognition using class specific linear projection[J].IEEE Transactions on Pattern Analysis and Machine Intellicgence,1997,19(7):711-720.
[11]吴建龙,罗海兵.遗传算法在人脸识别中的应用研究[J].计算机仿真,2010,27(12):283-292.