APP下载

深度卷积网络在数据审核校验中应用研究*

2019-10-09闫玲博韦占坤吴庚杰

通信技术 2019年9期
关键词:网络结构校验卷积

范 亮,闫玲博,韦占坤,金 星,吴庚杰

(1.中国人民解放军75837部队,广东 广州 510000;2.国防科技大学信息通信学院,陕西 西安 710106)

0 引 言

随着社会的发展与进步,人们的日常生活已经与各式各样的数据息息相关。基础数据作为社会服务的支撑,已经开始让大家意识到公共服务质量的好坏在很大程度上依赖于基础数据的规范性与准确性,特别是对于涉及公共服务的基础数据则显得尤为重要。当前为了改善数据的规范性和准确性通常采用以下两种方式:在数据采集录入时,基于数据录入要求和填报规则等约束条件实现数据准确与规范;在数据汇聚整编时,基于规则匹配和人工核对相结合的审核校验方式实现数据准确与规范。由于前一种方式往往对系统部署统一性要求较高,在当前大数据相互融合汇聚的趋势下并不能完全解决基础数据的规范性和准确性的所有问题,因而第二种方式始终作为数据管理的一项重要的补充手段受到大家的重视。

当前数据审核校验通常采用基于规则和模式匹配的方式[1-2]实现结构化数据的自动化审核校验,然而对于文本、媒体等非格式数据的审核校验往往只能基于人工核对的方式进行筛选判断,因而当面对大量数据的审核校验任务时则显得力不从心,进而影响了基础数据在公共服务中的支撑保障效果。

得益于近些年来计算资源的升级和机器学习算法的发展,人们已经在人工智能领域取得了长足的进步。特别深度神经网络算法的再度兴起,人工智能算法当前在部分领域所展现的工作能力足以与人工相媲美。例如,在文献[3-5]介绍了采用深度卷积网络实现图片媒体数据中特定物体特征属性的自动化学习,并实现了泛化样本中相应物体的检测与判别。通过在ImageNet等公开数据集上的测试,上述算法的识别准确率已经超过人工识别水平取得令人惊喜的实际效果。相较而言,当前基础数据中非结构化媒体数据上的审核校验依旧依靠人工比对的方式进行,因此在工作效率和保障效果上都存在较大缺陷。例如在人力资源系统中审核相关人员照片的级别、岗位等信息内容时,只能粗粒度核查重要岗位领导人员的信息。

针对上述等问题,为了有效缓解当前非结构化媒体数据自动化审核手段不足的问题,本文以人力资源系统中人员媒体数据的审核为切入点,通过深度卷积网络实现非结构化媒体数据的自动化审核校验,有效提高人力资源系统中人员媒体基础数据的审核校验,为基于机器学习的方式实现非结构化数据审核校验探索了新思路,因而具有较好现实意义和实际应用价值。

本文的后续内容安排如下:第二部分主要介绍了深度卷积网络(Convolutional Neural Network,CNN)的基本组成和概念;第三部分主要以非结构化人员媒体数据为研究对象,综合考虑计算资源和设计复杂度等因素,设计提出了基于VGG卷积网络结构(Visual Geometry Group network,VGG)的人员媒体数据自动化审核校验方法;第四部分通过实际采集的数据对本文提出的审核校验方法进行了测试,验证了该方法在实际工作中的可行性与有效性;第五部分对全文内容进行了总结。

1 深度卷积神经网络

卷积神经网络(Convolutional Neural Network,CNN)作为一种特殊的前馈神经网络[6],是由上世纪60年代Hubel和Wiesel等人在研究猫脑皮层时发现的一种独特的网络结构。该网络结构相较于传统全连接形式的反馈神经网络而言具有复杂度较小的优势,为实现当前构建深度神经网络提供有利条件。随着人们对深度卷积网络的研究和实践,人们发现CNN网络在图像模式识别与分类领域具有突出优势,能够自适应的实现特征的学习与选择,有效避免传统图像处理技术中复杂的特征选取等预处理操作,因此具有广泛的应用价值。

CNN网络通常主要包括卷积层(Convolutional Laye,Conv)、线性整流层(Rectified Linear Units Layer,Relu)、池化层(Pooling Layer,Pooling)以及全连接层(Fully-Connected Layer,FC)等4种基本结构,其基本组成形式如图1所示。在实际应用中通过对上述4种基本单元的组合与设计,能够形成如ResNet、AlexNet、VGG、Inception等各种不同模式的深度卷积网络。

(1)Conv层:该单元通过构建具有宽度(Width)、高度(Height)、深度(Depth)的三维神经元来对输入层的局部特诊进行过滤筛选。靠近网络输入端的卷积层通常能够实现图像中边缘、线条和拐角等特征的识别与提取。随着卷积层的深入迭代,在靠近输出端的卷积层则能够进一步识别图片中具有具体语义的物体特征,最终实现物体属性的识别。

(2)Relu层:该单元通过构建非线性的激活函数,使得整个神经网络结构具备非线性特征的学习能力。相较于传统的Sigmod,Tanh激活函数,Relu激活函数在保证网络具有非线性特征的基础上,具有运算复杂度小、反馈梯度导数简单特点,因此广泛被应用于深度卷积神经网络的设计过程。

(3)池化层:该单元能够对图像中所提出特征进行聚合和汇聚,同时剔除局部重复特征的冗余信息实现特征参数的降维,节省计算资源。另一方面,由于该网络层能够通过对局部特征的筛选,减少非重要特征对分类判别的影响从而对网络的过拟合学习具有一定的抑制作用,从而在一定程度上提高了系统的泛化能力。

图1 CNN网络基本结构示意图

(4)全连接层:该单元通常为卷积网络的输出单元,主要实现根据前端网络提取的特征参数实现对输入数据的分类与判别。

2 媒体数据审核校验网络的设计

在综合考虑算法性能和计算资源的基础上,当前较为通用灵活的CNN网络主要分为AlexNet、GoogleNet、VGG、以及ResNet等类型,其中Alex网络结构较为简单但存在着随网络层数的增加参数规模急剧增加的缺点;GoogleNet网络为了适应图像中不同大小的结构特征采用不同尺度的卷积核有效提高了图像分类的准确性,但其在网络结构拓扑设计上往往需要较强的专业知识,因此也是一项十分艰巨的任务;VGG网络则通过多层小尺寸的卷积核来覆盖大尺寸卷积核视野的方式,有效地简化了网络结构,降低了训练参数规模,具有算法性能较好、训练速度快等优点;ResNet则为了适应更高深度卷积网络的学习训练,通过残差的方式进一步提高网络深度,取得更好的学习分类效果,但其对计算资源的要求则更为苛刻。

本文在综合考虑计算资源和网络结构设计复杂程度等因素,主要以VGG卷积网络结构为基础,设计提出了针对人力资源系统中人员媒体数据的自动化审核校验方法,实现人员媒体数据中岗位级别的判断与审核。

2.1 VGG卷积神经网络

VGG网络结构是由英国牛津大学Visual Geometry Group团队与2015年提出[7],正如上节介绍的,该网络结构能够通过多层的小尺寸的卷积核得到与大卷积核同样效果的“感受野”,从而减少网络参数,使得网络结构样式能够简单和统一,有效缓解大家对于深度神经网络拓扑结构的设计压力。VGG网络具有从A到E共5种配置方式,卷积层数也从8层到19层,具体参数如图2所示。

图2 各型VGG网络结构配置示意图

2.2 媒体数据审核网络

在实际应用可知,在针对媒体数据进行审核校验时,可以根据媒体数据的具体特点设计调整相应网络参数,以较低的计算资源开销取得较好的审核效果即可。因此本文以人力资源中警务系统的人员媒体数据为对象,重点实现对警务人员的岗位级别数据的审核校验。由于警务人力资源系统中人员媒体数据相对规范,具有规定大小和分辨率,因此可以适当选择规模较小、相对简单的网络结构实现岗位级别的判断。通过对于实际数据进行分析预处理后,本文主要从以下3方面对原始VGG网络的进行调整配置:

(1)由于媒体数据采集规范的约束,当前录入的人员媒体数据通常具有固定的分辨率,即为宽295像素、高413像素的RGB彩色照片。人员岗位级别标识通常在照片中相对固定的位置,因此可以通过裁剪的方式抠取媒体数据中岗位级别标识,以此剔除相关干扰信息,提高算法的识别准确率。

(2)由3.1节可知,原始VGG网络最大可设计为19层神经网络层,同时各层卷积网络所使用的卷积核数量(64、128、256、512)和全连接层神经元个数(4 096)都十分庞大。因此在综合考虑当前单个笔记本独立运行的硬件资源约束以及识别任务相对简单等因素,本文主要在VGG-A网络结构的基础上将输入媒体尺寸调整配置为宽128像素、高128像素的RGB彩色照片;减小各卷积层的卷积核数量,相应分别配置为16、32、64、128;实际判别人员岗位等级较少,将最后两全连接层的神经元个数减少为1024。

(3)为了适应深度神经网络的快速收敛,在每个卷积网络的激活单元前端添加了批归一化操作(Batch Normalization,BN),使激活层的数据输入满足0均值、方差为1的标准化分布,从而解决网络内部因协变量偏移造成网络训练效果不理想的问题[8]。为了进一步提高训练模型对实际数据的泛化能力,在全连接层后引入了Dropout操作[9],通过随机抑制部分神经元的活性来使得整个网络更加倾向提取数据中的本质特征,进一步防止模型的过拟合。

为了增加网络对媒体数据的旋转角度、亮度、对比度以及颜色等的泛化能力,提高鲁棒性,在进行预处理时本文通过随机旋转,调整亮度、对比度、色度以及清晰度等操作对媒体数据进行变化,一定程度上丰富样本数据的数量,克服数据样本的随机性干扰。通过上述调整即可完成对人员媒体数据进行审核校验的卷积网络设计,整个网络模型的训练流程如图3所示。

图3 针对媒体数据自动审核校验示意图

3 实际数据实验结果与分析

为了验证本文所提出方法的有效性,本节以实际采集收录的2 000幅人员媒体照片作为训练数据对2.2节所提出的网络模型进行训练,并另取1 000幅人员媒体照片作为测试数据对训练后的模型进行测试验证。训练过程中,以80副人员媒体数据作为一批(Batch)进行训练,总共迭代训练30 000次;以网络判别概率分布与实际期望的概率分布之间的交叉熵[10]作为网络识别损失;配置学习率为0.000 5的Adam优化算子作为模型的优化方法,配置选择随机概率为0.5的Dropout算子,进行网络学习训练。通过上述配置,整个模型的最终学习曲线如图4所示。

图4 媒体数据审核校验网络训练学习曲线

由图4可知随着不断的训练迭代,整个网络的识别损失在逐步下降并逐渐趋于平缓,其原因在于随着网络模型的不断收敛,Dropout操作所引入的随机性逐渐变成了网络不确定性的主要因素,因此在整个训练的最后阶段网络仍旧以较小的幅度进行的震荡。当迭代步数达到25 000时训练准确率已经可以达到92.3%,因此可知最终训练后的网络已经具有较好的判别能力。

在网络训练结束后,以1 000幅人员媒体数据作为测试样本,对训练的模型进行验证。在实际数据审核校验中人们更加关心媒体数据与相关采集的信息是否一致的问题,因此在该部分主要结合数据审核校验的实际工作目的,对实际数据进行判别检测,其检测结果如表1所示。

表1 实际数据在审核校验中的测试结果

通过表1数据可知,本文所提出的模型能够有效对人员媒体数据中岗位级别信息进行一致性审核校验,其准确率接近80%。因此在实际应用过程中,可以通过该网络的自动识别后,依靠人工辅助的方式对判别结果进一步进行核准,即能够快速完成大批量非结构化媒体数据的审核校验,从而有效地减缓人工作业压力,具有良好的现实意义和实际应用价值。

4 结 语

为了缓解当前依靠人工方式进行非结构化媒体数据审核校验的现状,本文在综合考虑计算资源和人员媒体数据基本特点的基础上,设计实现了一种基于深度卷积网络的媒体数据自动化审核校验方法,为实现非结构化基础数据的自动化审核给出了一种有效的解决思路。该方法能够通过机器学习的方式对媒体数据中的特征进行自动提取,并能实现相应规则的判断与识别,进而实现媒体数据自动化审核校验,有效地减轻数据整编作业压力,具有较高的实际应用价值。最后,以实际工作中人员媒体数据的审核校验为实际应用场景,对现实数据进行训练与测试,其测试结果表明本文所提方法能够有人员媒体中岗位级别的重要基础信息,从而实现媒体数据的自动化审核校验,有力的验证了本方法的实用性和现实价值。

猜你喜欢

网络结构校验卷积
使用Excel朗读功能校验工作表中的数据
基于3D-Winograd的快速卷积算法设计及FPGA实现
快递网络结构研究进展
卷积神经网络的分析与设计
基于AutoML的保护区物种识别①
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
智能电能表的现场快速校验方法探讨
电子式互感器校验方式研究
基于时效网络的空间信息网络结构脆弱性分析方法研究