基于神经网络的有遮挡图像分割方法
2015-12-20张国光
张国光
(昆明船舶设备研究试验中心第1研究室,云南昆明 650051)
脸是人类最主要的形象特征,是人类与外界沟通重要的表现工具,这些特征也是对一个人认定的唯一特点,在人的目标识别中起到了重要作用。尤其是在国家安全、公安、民政、银行以及保险公司赔保时都起到了重要作用,并且比传统的指纹识别、虹膜检测技术更方便快捷,在国家安全这种特殊场合中,可以更加隐蔽地监视恐怖分子,应用前景广泛[1]。而进行人脸识别的基础就是人脸图像分割技术,这一技术涉及到了图像目标特征提取、自动识别等技术。
目前典型的图像目标分割技术主要是阈值分割、边缘分割等方法,对于动态的人脸图像通常采用神经网络的算法进行人脸分割计算,首先提取静态的目标图像进行学习训练,再对动态图像进行迭代运算,最终得出需要的结果。
不过传统的神经网络算法对于动态图像不连续点的检测效果不好,对于一个活动目标,人脸部位不可能完全与训练图片完全吻合,总会出现遮挡,对于遮挡部分就会出现一些与训练图像不相吻合的断点,本算法的原理是采用神经网络曲线拟合方法将真实的人脸部分通过拟合的方式完成,进而完成人脸分割,提高人脸的识别能力。
1 神经网络人脸识别算法结构
神经网络是近代数学发展出的一种先进的目标识别算法,其原理是一种误差逆传播算法训练的多层前馈网络,这是目前应用最广的神经网络算法模型之一[2]。神经网络算法可以学习和存贮大量的输入-输出模式映射关系,而无需事先确定这种映射关系的数学方程。基本的学习规则是使用最大下降法使得整个算法在在设定误差处收敛,并且使用最短的时间内完成,通过反向传播来不断调整网络的权值和阈值,使网络的误差平方和最小。神经网络模型拓扑结构包括输入层(input)、隐层(hide layer)和输出层(output layer),BP神经网络结构如图1所示。
图1 神经网络算法结构
人脸分割采用的神经网络学习训练步骤由前向与后向两个方向组成,具体分为3步:
步骤1 随机将起始权值ωkij和阈值bi进行赋值。其中ωkij是第k层第i个神经元与前面一层第j个神经元的关系权值。
步骤2 对于每个学习样本进行前向计算。得
其中,Nk是k层的神经元总个数。经过式(1)计算后,产生的误差向后传递,输出层表示为
隐层表示为
权值阈值经过修正后得到
其中,η表示为学习率。
将式(1)~式(5)代入计算后得到式(6)和式(7)。从而
步骤3 不断重复步骤2的计算,直到误差到达预设值,停止学习计算,将权值阈值固定下来。
针对人脸识别算法,首先根据初步检测确定出人脸的位置与大致的轮廓;然后再根据采集初始图像的人脸轮廓对检测对象的人脸轮廓进行初始限定;通过神经网络算法按照限定的轮廓进行描绘,并对被遮挡的部位进行预估匹配;最后将所有的点采用曲线拟合算法进行估计平滑,最终成为一个完整、连续的人脸边缘,从而实现把人脸提取分割出来。基本的神经网络人脸分割识别算法流程如图2所示。
2 人脸特征提取与建模
图2 神经网络人脸分割识别算法流程
每个人的脸部特征各不相同,比如眼部就有很多不同的特征,例如大小,眼间距或单双眼皮等。但并不是每种特征检测都适用,因为在实际摄录过程中某些特征不易被提取到,因此将人脸特征进行分布提取计算。
首先进行肤色分割,在自然光照射下,人的肤色通常会集中于CbCr色度中的一小片区域内,肤色分割就利用这一特点,将图像通过变换矩阵变换到CbCr色度空间内,根据色度空间内肤色所在区域对图像中属于肤色的区域进行初步提取,这里采用低通滤波的方式对人脸轮廓进行处理,人脸轮廓检测后的图像如图3所示。
图3 脸轮廓检测后图像
经过肤色提取提取后,将人脸进行模糊化处理,只提取特征的轮廓,例如眉毛、眼睛、鼻子以及嘴的特征。根据各个特征部位的位置关系,计算出人脸特征,与需要比对的对象进行比对,完成最后的检测。
对人脸进行初始检测后会得到人脸的三角结构图,然后确定左眼位置Ple(x,y),右眼位置Pre(x,y)以及嘴的位置Pm(x,y),根据眼嘴的位置坐标可以计算出眼间距Dee和眼嘴距Dem,其中Dem是嘴的位置坐标到Dee垂直距离。定出这3个坐标点后可以确定人脸的其他五官部位,例如鼻子耳朵等。
根据人的通常脸部特征,人脸的总宽度为5个眼睛的宽度,人脸的高度为眼嘴距Dem的3倍。由于Dee确定,根据脸宽度是眼睛宽度的5倍,因此在通常情况下Dee是眼睛宽度的两倍。而3倍的Dee则已经超出了人脸的范围。对一个立体拍摄到的图形进行坐标转换,使得人脸图像变为一个平面图像,如
式(9)中,α是图像面的参数,取值如下
通过式(13)和式(14)可以得到人脸的中心点
人脸的三角区的基本轮廓是一个椭圆形,一般情况下可以用一个椭圆函数对人脸三角区进行轮廓拟合,三角区的脸长为椭圆的长轴,三角区脸宽为椭圆的短轴。由此建立椭圆函数的参数方程,如
确定了人脸三角区的函数后,由某个离散化的θ下椭圆轮廓的点与图像中心点Po(x,y)的连线延伸到外部矩形轮廓的交点,以这条连线作为搜索路径,每一条连线上有且仅有一个点是人脸的外轮廓点。不过由于遮挡会出现一些地方存在多个轮廓点的情况,通常会加入一些自适应算法进行计算,本文采用了结合自适应算法的神经网络算法来进行搜索计算。椭圆图像分割框选定如图4所示。
将搜索路径Lθ进行计算其最大边缘梯度,梯度算子为
图4 椭圆图像分割框选定
如果其结果满足
则认为此点是Lθ上的初始边缘点,然后通过坐标变换公式
计算后如果满足
则表明此点为确定边缘点,然后进行下一条路径的边缘点搜索。如若不满足式(20),则修改Rth,直到满足条件为止。经过搜索后的图像与搜索路径的初步连线如图5所示。
图5 经过搜索后图像与搜索路径连线图
最终搜索拟合的结果出来后,会出现一些不连续点,需要将这些点进行平滑拟合。这里采用神经网络进行曲线拟合。以曲线特征为BP神经网络的输入量,人脸图像的Lθ为BP网络的输出,分别采用传统计算方法与加入自适应算法后BP神经网络计算法计算,整个网络采用4层结构,每个节点的个数为10,输出节点为5,隐层节点的个数由式(12)得到,经计算后选取12为隐层节点个数。轮廓点拟合结果如图6所示。
图6 轮廓点拟合结果
对上式进行拟合分解,相当于对其求解一个线性方程。结果为
根据系数进行拟合,如果拟合的系数过大,最终会出现发散,如果采用的系数小且阶数较小,最终可能达不到需要的精度,这里采用5阶拟合算法,经过700步拟合的结果如图7所示。
图7 700步拟合的收敛性图
经过拟合修正后的人脸分割路径结果如图8所示。
图8 经过拟合修正后的人脸分割路径
最终经过人脸分割以后的图像结果如图9所示。
图9 经过人脸分割以后的图像
3 有遮挡人脸分割实验分析
通过对40幅不同角度的人脸图像进行分割,结果表明,本算法对人脸图像分割的效果较好,达到了85%的图像分割完成率,而传统的人脸分割算法仅能达到78%。选取了代表性的图片进行仿真分析,这些图片中人脸部分被头发手指或其他物体遮挡,同时图片的任务并非都是正面照,对图片进行人脸分割提取研究,经过此算法进行处理后,都可以对这些人脸进行精确的人脸分割。
如图10所示,这幅图的人脸部分被手与头发遮挡,因此判断人脸的具体位置具有一定的难度,采用本算法后,有遮挡人脸可以被准确地估计和分割,分割搜索路径如图10所示,有遮挡人脸分割结果如图11所示。
图10 有遮挡人脸分割搜索路径
图11 有遮挡人脸分割图
4 结束语
本文采用神经网络算法对人脸进行分割计算,并在传统的神经网络人脸分割算法的基础上加入曲线拟合估计算法。同时对人脸进行建模分析,分析了人脸的一般特征,结合一般特征,对有遮挡的人脸进行拟合计算,得到了真实的人脸分割曲线,弥补了普通人脸分割算法无法对有遮挡的人脸进行分割的缺陷。
[1]王蕴红,范伟,谭铁牛.融合全局与局部特征的子空间人脸识别算法[J].计算机学报,2005,28(10):1657 -1663.
[2]Senthil Arumugam M,Rao MVC,Aarthi Chandramohan.A new and improved version of particle swarm optimization algorithm with global- local best parameters[J].Knowledge Information System,2008(16):331-357.
[3]宋淑彩.面向Web的数据挖掘技术在网站优化中的个性化推荐方法的研究与应用[J].科技通报,2012,2(28):118-119.
[4]温雪.一种基于随机图像序列的三维人脸识别算法[J].科技通报,2012,10(28):141 -143.
[5]徐子豪,张腾飞.基于语音识别和无线传感网络的智能家居系统设计[J].计算机测量与控制,2012,20(1):180-182.
[6]穆文全.基于遗传算法和BP算法的多层感知机杂交训练算法[J].电子科学学刊,1997,19(2):190 -194.
[7]John J,Mckeown.Some numerical aspects of the training networks[J].Proceedings IEEE,1996,84(10):1562 -1568.
[8]龙飞,庄连生,庄镇泉.基于小波变换和Fisher判别分析的人脸识别方法[J].模式识别与人工智能,2005,18(2):223-227.