基于人体肤色识别征的敏感视频分类方法

2016-06-29梁鹏林智勇贾西平

电脑知识与技术 2016年13期

梁鹏　林智勇　贾西平

摘要：为了快速、有效地分类出敏感视频，提出一种基于人体肤色识别的敏感视频分类方法。首先通过帧差图像提取前景运动区域，然后构建人体肤色模型，并结合前景运动区域识别出视频中的人体，最后用多因素的级联分类器进行敏感视频分类。实验结果分析表明，文中方法有较好的分类准确率和查全率。

关键词：敏感视频分类；肤色识别；前景运动；级联分类器

中图分类号：TP18 文献标识码：A 文章编号：1009-3044（2016）13-0181-03

Abstract：In order to effectively classify the obscene videos， a novel obscene video classification approach based on human skin recognition is proposed. We first extract the foreground motion area by using frame difference images. Then we make up the human skin model and recognition human body by combing with the extracted foreground motion area. Finally， the multi-feature cascade classifier is used for classify the obscene videos. The experimental results show that our proposed method has better precision and recall rate.

Key words：obscene video classification； skin recognition； foreground motion； cascade classifier

随着互联网视频内容的不断增加，如何有效识别敏感视频信息已成为信息安全中的一个重要的课题。图像视频比起传统文本具有更丰富的信息，因而，它的危害性更大。鉴于传统过滤技术的弊病，以图像分析与图像理解技术为支撑的基于内容的不良视频过滤技术正在成为网络信息过滤技术研究的一个重要方面。基于图像内容的图像分类系统层出不穷。

早在20世纪90年代就开始了对敏感图像识别的研究，Fleck[1]等人通过肤色分割和人体姿态的几何特征检测来识别敏感图像，其基本思想是将人体看作是按照一定规则的若干柱状区域的组合。然而其缺点是仅能够处理单一类型图像，缺乏适应性和通用性，处理速度较慢，图像的识别率较低。Kim[2]等人提出基于肤色检测、纹理分析以及特征向量分类来识别敏感图片。由于使用的是简单的肤色模型，其判断结果很大程度上依赖皮肤区域提取的结果，存在很大的局限性。王金庭[3]在此方法的基础上，在YCbCr空间构建肤色模型，并进行亮度自适应提供分类的精度。Hogyun Lee[4]等人利用关键帧通过构建XYZ模型，以单帧的检测为X轴，以组帧为Y轴，以X轴、Y轴为参数构建Z轴来判断该帧是否含有敏感图像。此外在利用颜色和纹理，也有部分的研究成果[5-10]，但是由于其特征的单一性，实际应用的效果不理想。吕丽[11]等提出了基于光流的敏感视频检测的算法，而其主要是使用光流方法提取关键帧结合传统方法来检测的。提供了利用光流进行检测的新思路。

综上所述，本文提出了基于人体肤色识别的敏感视频分类算法。该算法在文献[3]的基础上，将人体肤色模型与前景运动区域结合，并采用多因素的级联分类器提高视频分类的效率和准确率，实现了在复杂背景、光照不均、复杂类型下的敏感视频分类。

1 前景运动检测和分割

前景运动区域反映了视频中运人体运动所处的区域，体现了视频的主要内容。本文将采用一种基于高阶统计量的自适应前景区域提取算法。

在视频中，由于背景噪声的存在和运动对象的变化，帧间灰度差不为零，背景噪声服从均值为零的高斯正态分布，运动变化区域服从非高斯分布，因此，在多个帧间差的图像中区分变化前景区域和未变化背景区域可以看成是在高斯数据中识别非高斯数据。具体做法是采用帧间差的高阶统计量假设检验，确定运动对象的位置，自动分离运动区域与背景区域。

简单的2帧差图像包含的运动信息较少，提取的运动对象含有空洞，运动信息不完整，所以采用多帧差累积来获取充分的运动信息，本文采用的是5帧差图像。假设第一帧图像是，则帧差图像计算如下：

接着采用高阶统计量方法自动区分运动区域与背景区域，假设5帧差图像噪声服从高斯分布，对每个像素进行假设检验，判断该像素属于背景部分还是运动部分，最后通过对帧间差累积图像的局部4阶矩与背景区域估计的高斯噪声的4 阶矩进行比较来确定运动对象的位置。具体做法如下：在图像中，用5×5的窗体在图像内从上至下、从左至右滑动，计算窗体内的均值和方差：

表示滑动窗体内的像素个数，是窗体移动的顺序号，检测阈值与帧差图像图像中噪声方差的平方成正比：

是经验参数，根据实验结果取。当窗体的4 阶矩时，该窗体属于运动区域；当，该窗体属于背景区域。最后通过数学形态学对噪声区域和孤立小面积区域进行过滤，过滤面积小于图像面积20%的前景区域。图1是前景运动区域的实验结果图。

2 基于肤色检测的人体识别

在敏感视频中，一个很显著的特征是出现有较大比例的裸露人体肌肤，因此提取人体肤色区域是敏感视频识别的重要工作。

本文提出的基于肤色检测的人体识别算法是在YCbCr空间上建立肤色模型，然后根据肤色模型选取出图像中的人体皮肤区域，并最终根据计算出的肤色阈值对图像进行分割，得到人体肤色区域。

为了很好的分割出不同光照条件下和复杂背景环境下的人体肤色区域，我们利用混合高斯模型来描述人体肤色分布情况。在文献[12]中给出在非线性彩色空间YCbCr中的色度CbCr概率分布为：

其中是图像中的一个像素点，经过标准化处理。基于肤色检测的人体识别算法如下：

[输入：随机截取20480个大小为100×100的皮肤样本图像块

输出：分割好的人体肤色区域

1. 将肤色图像块从RGB颜色空间转为YCbCr颜色空间；

2. 统计肤色图像块集合的均值和协方差：

3. 根据公式（5）计算测试图像的概率灰度图

4. 根据最大熵阈值分割方法[40]分割人体肤色区域

5. 结合前景运动区域的计算结果，过滤非前景运动区域内的人体肤色区域 ]

算法1. 基于肤色检测的人体识别算法

图2是基于肤色检测的人体识别实验结果图：

3 敏感视频分类器设计

判断一个视频是否含有敏感成分，单单依据某一因素是不能有效地作出判断的，因为不同性质的视频亦存在相同的属性因素，例如游泳视频也同样出现大量的人体肤色区域。因此针对敏感视频的重要特征，我们提出了一个多因素的敏感视频分类器。其主要判断有：

1）相比较正常视频，敏感视频中的皮肤区域都具有较大的比重，一般不小于30%；

2）敏感视频中人体运动是视频的主要运动部分，而正常视频中即使出现人体运动，也通常包含其他物体的运动；

根据上述的判断，本文提出了3种特征来进行构造分类器：

假设含有个图像帧的视频中，每一帧图像大小为，对应的前景运动区域大小为，对应的人体皮肤区域大小为：，在前景运动区域内的人体皮肤区域大小为：，则三个判断特征为：

1）皮肤暴露程度：

2）整体的平均运动皮肤率：

3）运动区域的平均运动皮肤率：

敏感视频分类器的设计需要能够满足较高的分类准确率的同时，也要满足高效、速度快的要求。视频每秒包含图像帧在25-30之间，对所有的图像帧都进行上述3个判别特征的判断，所需要的耗时会很大。为此本文将构建一个基于级联的敏感视频性质分类器，其设计流程图如图3所示：

其中为，，是实验过程中给定的阈值。通过这种级联的分类判断，大部分的正常视频都可以在前面的分类判别阶段被过滤掉，省去了后面阶段的计算，从而可以大大提高分类效率。只有满足所有的判别分类条件的视频才判断为敏感视频，能有效保证分类的正确率。

4 实验及讨论

实验机器是CPU为Intel CoreTM2 Duo 2.33GHz、内存为2GB的台式机.实验中所需的参数设定为=0.3， =0.2， =0.15.所采用的测试数据集包含了36个敏感视频和50个正常的视频，其中包括了广告、电视剧、卡通片、音乐MTV等.评价准则为准确率、误检率、查全率和漏检率：

4.1 人体肤色区域识别实验

首先对文中提出的基于肤色检测的人体识别方法进行实验，从测试数据集中随机提取出10个敏感视频用于对本文方法进行测试，其中包括了不同大小、不同人体姿态、不同人体数量的视频。

为了更好地体现本文方法的性能，我们将本文方法与文献[3，9，10]提出的两种方法进行对比，测试的结果如表1所示：

从上表的实验数据可以得出，本文所使用的基于肤色检测的人体识别方法能更有效地确定皮肤区域，具有更好的查全率和查准率，这是因为在综合了运动区域和皮肤模型之后，有效地过滤了部分不属于运动区域的类肤色区域。本文方法的部分识别结果图如图4所示：

4.2 敏感视频分类实验

针对本文提出的多因素级联敏感视频分类器进行实验，用测试数据集中的36个敏感视频和50个正常视频进行分类，分类结果如表2、表3所示：

从实验结果可知，本文提出的级联分类器能在前两个分类阶段就过滤掉大部分的敏感视频，同时又能保留大部分的正常视频。最终在得到较好的查全率的同时，保证了较高的准确率。

5 结论

本文提出了基于人体肤色检测的敏感视频分类方法，通过结合前景运动区域和人体肤色识别，有效的识别出复杂背景下的裸露人体。此外通过多因素的级联敏感视频分类器，能够快速地对视频进行分类。实验结果表明，本文所提出的敏感视频分类方法具有较好的效果。但本文方法仍存在不足之处，在实验过程中发现，肤色样本库的构建对被检测肤色的适应性具有重要的影响。如何选取具有代表性的样本以及各种样本之间的比例关系是今后工作的重点。

参考文献：

[1] Forsyth D A， Fleck M M. Identifying Nude Pictures[C].Proc. of the 3rd IEEE Workshop on Applications of Computer Vision，1996：103-108.

[2] Jeong C Y， Kim J S， Hong K S. Appearance-based Nude Image Detection[C].Proceedings of the 17th International Conference on Pattern Recognition. 2004： 1051-4651.

[3] 王金庭，杨敏.基于YCrCb空间的亮度自适应肤色检测[J].计算机系统应用，2007（6）：99-10.

[4] Hogyun Lee， Seungmin Lee and Taekyong Nam. Implementation of High Performance Objectionable Video Classification System[C]. ICACT，2006（2）：20-22.

[5] Jiann-Shu Lee，Yung-Ming Kuo，Pau-Choo Chung.The Adult Image Identification Based on Online Sampling[C]. International Joint Conference on Neural Networks， 2006. IJCNN '06. 16-21 July 2006 Page（s）：2566-2571.

[6] Arentz W A， Olstad B. Classifying offensive sites based on image content[J].Computer Vision and Image Understanding.， 2004，94（1-3）：295-310.

[7] Wu Y L， Chang E Y， Cheng K T，et al. Morf.A distributed multimodal information filtering system[C]. IEEE Pacific Rim Conference on Multimedia， 2002：279-286.

[8] 吕东辉，王滨.YCbCr空间中一种基于贝叶斯判决的肤色检测方法[J].中国图象图形学报，2006，11（1）：47-52.

[9] Shen Xuanjing，Wei Wei，Qian Qingji. The Filtering of Internet Images Based on Detecting Erotogenic-part[C]. Third International Conference on Natural Computation， 2007（2）：732-736.

[10] 钱俊，魏锴.YUV-KL变换在人脸肤色检测中的应用[J].武汉大学学报：信息科学版，2003，28（5）：623-625.

[11] 吕丽，杨树堂，陆松年，李建华.基于光流法的不良视频检测算法[J].计算机工程，2007，33（12）： 220-221.

[12] 赵丽红.人脸检测和识别算法的研究与实现[D].沈阳：东北大学，2006.

电脑知识与技术

2016年13期

基于人体肤色识别征的敏感视频分类方法

杂志排行

电脑知识与技术的其它文章