面向智慧校园的视频人脸检测算法
2019-03-19陈雪婷浙江经济职业技术学院图书信息中心
陈雪婷 浙江经济职业技术学院 图书信息中心
1 引言
随着智慧城市概念的提出,智慧校园作为数字化校园的高级形态已逐渐成为高校信息化建设的热点。近年来,随着视频监控与互联网技术的不断发展与普及,将其应用在高校信息化建设当中已成为普遍现象。相比以往人工找出人脸位置以完成人脸检测,智能化的人脸检测技术不仅能极大的减少时间和精力的消耗,对于校园内敏感区域(如校长室、财务室、机房等)出现的异常情况也能及时报警。虽然人脸检测已经经过几十年的研究,但目前较成熟的人脸检测技术在处理多种非理想条件下的检测问题时仍存在挑战。本文将深度学习理论引入视频人脸检测,通过建立类似于人脑分层次学习的机制,对输入数据逐级提取从底层到高层的特征。同时,通过深度学习逐层构建的多层网络使其能学习隐藏在数据内部的关系,从而使学习到的特征更具推广性和表达力。为了避免数据维度转换对检测结果的影响,本文采用深度学习中的卷积神经网络对视频图像进行全局扫描,利用多层次的卷积和采样保留下图像中的人脸区域,最后将这些区域在视频图像中框出以完成人脸检测。
2 卷积神经网络
卷积神经网络(Convolutional Neural Network,CNN)是一种共享权值的深度学习网络结构,其结构如图1所示。
图1 卷积神经网络
它由多个相邻的卷积层Ci和采样层Si组成(图1中仅画了两层),每一层都是由多个二维平面组成。其中,卷积层是由多个不同的卷积核与前一层每一个二维平面卷积得到。卷积过程如下:
卷积核每次只作用于输入平面的局部区域,称该小区域为局部感受区域,该感受区域经过卷积映射操作后产生的值赋给卷积层中对应二维平面上对应位置的神经元,因此该神经元的值保留了该感受区域的某一特征属性,而该神经元的位置保留了感受区域的位置信息。不同的卷积核用于提取不同的特征信息,同一卷积核在二维平面中滑动以判断不同位置上是否具有该卷积核所表示的特征。
采样层是对卷积层中每一个二维平面上的每一个m×m小区域进行采样,即
CNN这种局部权值共享的特殊性不仅降低了神经网络的复杂度,同时使其对尺度缩放、平行移动、旋转等各种形式变化具有较高的不变性,而不同卷积核之间相互无影响使得CNN得以并行训练。另外,卷积层和采样层相邻的设计模式也更接近于真实的生物神经结构,将其应用于多维图像处理中可以避免在特征提取和分类过程中由于数据重建而引起的复杂度。
3 实验结果与分析
本文利用caffe构建具有5层卷积层、5层采样层的卷积神经网络,其中卷积层的映射函数采用ReLU函数,采样层的采样函数为3×3区域内各像素值的最大值,最后的分类函数采用sigmoid函数。
本文通过LFW人脸库和CAS-PEAL人脸库来完成卷积神经网络的训练。分别从LFW人脸库中选取6000张的人脸图,从CASPEAL人脸库中选取5000张人脸图,归一化到33×33大小,构成训练的人脸样本集。同时,构造10000张不含人脸的样本集,同样将大小归一化为33×33,构成训练的非人脸样本集。
通过随机地从LFW人脸库中选取除训练样本外的6000张人脸图测试本文方法对单人脸的检测性能。检测结果表明,本文方法能实现98.7%的正确检测率。利用PKU-SVD-B数据集进行多人脸检测,实验结果表明本文方法对于多人脸图,其误检率低于3.5%,漏检率低于11.5%,具有较好的检测效果。
4 结束语
针对智慧校园监控系统所获得的多人脸多角度的检测特性,本文提出一种基于卷积神经网络的视频人脸检测算法。该算法利用深度学习对人脑视觉神经系统的模拟逐级提取从底层特征到高层语义,根据最后的语义特征准确地实现非理想条件下的视频人脸检测。卷积神经网络相比于其他深度学习网络,具有权值共享特性,能避免数据维度的变化从而较好的实现对二维图像的特征提取。仿真实验表明,该算法不仅对单人脸图像具有很好的检测性能,同时对多人脸图像也能实现较低的漏检率和误检率。