APP下载

基于深度学习的网络色情图片识别算法综述

2019-09-24杨云吴恋邱南亚罗集景黄小朝

电脑知识与技术 2019年21期
关键词:深度学习模型

杨云 吴恋 邱南亚 罗集景 黄小朝

摘要:本文旨在基于深度学习图像识别的技术上对网络色情图片进行识别及过滤进行研究与探讨。在人工智能的机器学习上的一个新兴的探讨方向就是深度学习,其技术可以实现在图像中辨别出异类的目标和对象的效果,为实现这种效果此技术运用了多种算法对图像進行必要的操作。图像识别技术的核心在于对图像的特征进行提取和分类,其中图像识别技术中最主要的技术是图像的特征的提取,也是用来权衡一个图像识别算法的好与坏。本文通过基于深度学习的图像识别技术进一步对色情图片的识别及其过滤的模型进行探讨。

关键词:深度学习;图像识别算法;模型

中图分类号: TP311        文献标识码:A

文章编号:1009-3044(2019)21-0191-02

开放科学(资源服务)标识码(OSID):

21世纪,互联网不仅可以作为人与人之间的一种通讯方式,还成了资源传输和共享手段,而手机作为终端处理器,不仅仅局限于通讯和发短信,人们还可以利用手机更加快捷地获得所需要的信息,显然互联网对于人们的生活方式起到了不少的促进作用,但互联网相比传统的媒体传播介质有所区别,互联网显得更加难以管理。这也导致了一些为了获取网络暴力的不法分子利用了互联网的特性进行违法犯罪。各种不良信息诸如色情图片,色情小说等,也在互联网上肆意传输,这给网络带来了很多不健康的信息,对网络使用者造成了伤害,特别是对于未满18岁使用者的身心健康。那么如何对这些不良的色情图片进行拦截就显得至关重要了。本文将运用图像识别技术来对网络上的色情图片进行拦截。

1 深度学习图像识别的发展及历程

近几年来,人工智能在深度学习方向上的研究有了非常可观的突破,特别在图像识别方面。图像识别的研究经过了三个阶段,这三个阶段分别是对字图像和物体的识别。而这些技术原理都离不开神经网络。可以不夸张地说,如今出现类似的模型都是属于神经网络的模型,比如著名的反向传播算法[1],这一算法从1986年被威廉姆斯、欣顿和鲁梅尔哈特在《自然》杂志上发表到现今都是普遍运用的。神经网络的主要发展方向有两个方面,其一:由2012年和2014年的ImageNet竞赛冠军获得者用到的模型来看[2],模型的层次在加深,这也意味着未来研究模型的层次会不断加深。其二:为使识别的正确性达到最佳,模型的结构复杂度会逐渐增加。有结果表明,为了在不同尺度上实现融合图像的有效信息效果,需要并行多分辨率起始结构,才能在不同尺度上实现融合图像的有效信息效果。另一方面,采用低秩分解的方法构造了参数尺寸较大的隐层,大大减小了模型的参数尺寸。可见神经网络的发展对于图像识别技术能在未来更多领域得到应用起到了不可磨灭的作用。图像识别技术在未来的生活中必将随处可见,它的应用前景是不可估计的。

2 基于深度学习图像识别的模型及算法

建立在深度学习的基础上,在对图像识别方向进行研究的过程中,许多网络模型被运用到,其中就包括了递归神经网络、卷积神经网络以及图像处语义分割算法。下文将探讨基于深度学习图像识别的网络色情图片识别与过滤常用到的几种网络模型及算法。

2.1 卷积神经网络(Convolution Neural Network,CNN)

卷积神经网络是由多种算法层组成的神经网络,通过这些层的计算,可以实现海量图像数据的降维,最终使其能够被训练达到识别图片的目的,卷积网络简单可以划分为卷积、池化和上采样三步来完成。对于传送的图片来说,要让计算机判断出该图片是否是色情图片,需要完成三个步骤,首先是卷积,需要选择一个合适尺寸的卷积核(也可看作过滤器)来对图片进行卷积操作,过滤掉各个小区域,由此可以在现实训练中取到过滤掉的小区域的特征值;其次是池化(也就是下采样),将原始图片不断缩小到一个很小的尺寸得到一个特征图,不断缩小是因为即使做了卷积图片还是很大,所以下采样来降低数据维度;最后是上采样(反卷积),其和卷积相像,运算的方法都为相乘和相加,上采样目的是为了放大还原图片。通过这些操作来实现对计算机的训练,使之实现在使用网络时可以自动清除掉那些色情图片的效果和目的。

2.2 图像语义分割算法

在对海量的图片数据进行处理和理解时,图像的语义分割和自动标注技术在工作中占据主要地位[3],为了使计算机实现视觉上与人类相同的目的,人们研发出了很多技术和模型,其中就有图像语义分割算法技术,此技术也成了计算机在视觉上的核心技术。语义分割过程就像PS抠图一样,需要尽可能地贴合每个物体的边框,由此让计算机对图片完成像素级的理解,并给图片中的各个像素点进行标注标签和分类。对于网络上的发送传播的色情图片,需要对该图片进行语义分割,完成图片的分割、标注和理解。图像语义分割的实现需要用到以下三类方法,分别为“阈值法”、像素聚类法和图像边缘分割法,在色情图片的分割上,利用这些方法获取到前后背景、图片纹信息和边缘信息,最终得到预期的分割结果。

3 基于深度学习的网络色情图片识别算法分析

3.1 色情图片识别原理分析与探究

色情图片识别是利用神经网络的模糊识别来实现的,就像人类可以辨别并判断出很多颜色各异或形状不一的图像是什么类型的图像一样,这就是所谓的模糊识别。图片的模糊识别需要对图片的特征进行提取和训练,并对图片进行分类处理,大概流程如图1所示。这里主要探讨的是图像分割技术在图片识别中的实现。为了提取到图片的特征,可以对图片颜色、形状和纹理等进行分割标记。最后利用统计法、结构法、神经网络发、模板匹配法和集合变换法进行图片识别。在这过程中也会用到BP[4]来确定权重的数值表示,随后构建FP[5]来确定图片是否是色情图片。

3.2 图片特征提取

图片识别过程中,对图片的特征提取是很重要的一个步骤,为了达到提取这些特征的目的,人们研究出了很多算法和技术。基于在网络上传送的图片大部分都是有明显差异的,比如颜色,可以利用颜色直方图的方法在海量图片数据中进行色情图片和非色情图片的比对,如图2所示,可明显看出图片的差异。但是在这海量的图片数据中还有很多图片是颜色相近的,这就很难使计算机识别出哪些是色情图片而非健康的图片,因此只能从除颜色以外的特征去获取其他的特征信息,比如形状和纹理特征,利用卷积算法和图像分割算法等算法来对图片进行特征提取和分类。

4 总结与展望

图像识别其实就是在做视觉上的认知,让计算机能模拟人的思想去辨别、认识事物。要想实现对图片的识别工作其实难度不是很大,因为该技术的基本算法思想并不是很复杂,只是在实现信息处理上较为麻烦。提取出的特征信息有时会十分突出,有时又很个别,这便会影响机器的识别速率,然而图像特征信息通常是用来表示图像的信息的,这些问题都是可以解决的。因此图像识别技术会更多并且更好的应用在人们的生活中。有了图像识别技术就可以解决网络的发展带来的色情信息的泛滥的问题,堵截色情图片的发送与散播,可以给广大网民朋友营造一种健康舒适的网络环境,这个举措对提高各界网民的综合素质有着不可或缺的作用,也对网络能够在未来建造出一个健康且文明的环境有着很大的意义。

参考文献:

[1] Rumelhart D E, Hinton G E, Williams R J. Learning internal representations by error propagation. Nature, 1986,323(99):533-536.

[2] Szegedy Christian. Going deeper with convolutions.arXiv preprint arXiv:1409.4842 (2014).

[3] 董志贵,王福林,宋庆凤,等.基于BP神经网络的无约束优化方法[J].统计与决策,2019(1):79-82.

[4] 吴福朝,张铃.基于FP算法的神经网络综合方法[J].小型微型计算机系统,1998(1):69-72.

[5] 曹攀,钱军浩,陈智,等.基于图像分层树的图像语义分割方法[J].计算机应用研究,2018,35(8):2514-2519.

【通联编辑:唐一东】

猜你喜欢

深度学习模型
适用于BDS-3 PPP的随机模型
p150Glued在帕金森病模型中的表达及分布
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
有体验的学习才是有意义的学习
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
3D打印中的模型分割与打包
FLUKA几何模型到CAD几何模型转换方法初步研究