APP下载

基于深度学习的赤足迹性别自动分析研究

2018-10-08史力民赵悦岑

中国刑警学院学报 2018年3期
关键词:足迹准确率卷积

史力民 李 硕 赵悦岑

(中国刑事警察学院痕迹检验技术系 辽宁 沈阳 110035)

1 引言

足迹是犯罪现场遗留率、提取率最高的痕迹之一,在确定侦查方向和范围、刻画嫌疑人特征、串并各类案件等方面具有明显优势[1]。以足迹对犯罪嫌疑人性别进行的分析一直以来都是基于以往总结的专家经验知识,即利用男女性在行走过程中产生的赤足或鞋底结构形态特征、步态特征以及磨损特征的不同进行性别分析。对于穿鞋足迹的性别分析,往往根据鞋样式种类、鞋底花纹特征的男女性差异即可做出分析判断,而对于赤足足迹的性别分析,则是利用男女性赤足足型特征的差异来区分性别[2]。但随着近些年女性罪犯增多,对于在人群中占较大比例的160cm~175cm身高段男女性,他们的赤足迹在长、宽等特征中易出现特征交叉,特征区分不明显的情况,导致上述传统的赤足迹性别分析方法在目前的实践应用中分析准确率不高,分析效果不理想。

近年来,从图像识别、语音识别到自然语言处理、无人驾驶等领域,各类优秀的人工智能研究成果已纷纷落地应用,象征着计算机技术步入大数据、大计算、大决策的人工智能信息技术新时代。这也给足迹分析领域带来了一个全新的思路:利用深度学习[3]的方法对足迹图像进行自动分析识别。深度学习是人工智能下机器学习中一种基于对数据进行表征学习的方法,其不再需要人工对足迹特征进行提取、分析和判断,而是将特征提取过程、分析识别过程交由神经网络,摆脱了足迹分析过程对于以往专家经验知识的依赖,更有效地提取已知特征和发现潜在特征,达到对足迹图像完全自动化的分析识别。

深度学习主要通过深层的神经网络来模拟人大脑的学习过程,每层的神经元接收更底层神经元的输入,通过输入与输出之间的非线性关系,将低层特征组合成更高层的抽象表示,并发现观测数据的分布式特征。它是一个自动的无人工干预的过程,借鉴人脑的多层抽象机制来实现对显示对象或数据(图像、语音及文本等)的抽象表达,整合特征抽取和分类器到一个学习框架下,并利用分类器或者匹配算法对顶层的输出单元进行分类识别。

2 足迹性别自动分析的卷积神经网络

卷积神经网络(CNN)是一种专门用来处理具有类似网格结构数据的神经网络,例如可以看作二维像素网格的图像数据。本文选择深度学习Caffe平台下的AlexNet卷积神经网络对赤足足迹图像进行性别自动分析研究。Caffe意为快速特征嵌入的卷积结构,由UC Berkeley BVLC实验室发布的深度学习开源工具,是目前使用最为广泛的深度学习实验平台之一。AlexNet是2012年ImageNet的冠军网络,它证明了CNN在复杂模型下的有效性,大幅提高了卷积神经网络在图像识别方面的准确性,推动了有监督深度学习的发展,是以后各种卷积神经网络的基础,有着大网络、速度快和防止过拟合的优点[5]。

AlexNet网络包括5个卷积层和3个全连接层,其中每一层又具有不同功能的子层。从总体看该模型的8层结构,其中输入层不包括在内,layer1~layer5是卷积层,layer6~Output为全连接层,最后的一个输出层也是全连接层,且能看作1000维输出的softmax分类器,最后的优化目标是最大化平均的多项logistic回归[5]。每一个卷积层以及全连接层后紧跟的操作是 ReLU操作;Max pooling最大池化操作是紧跟在第一个norm1,norm2,以及conv5层;Dropout操作是在最后两个全连接层。AlexNet网络结构如图1所示。

图1 AlexNet网络结构图

3 材料与方法

3.1 主要仪器与设备

本实验的数据采集工作主要使用中国刑警学院足迹实验室恒锐成趟足迹采集仪,该仪器实现了大幅面(4.8m×0.6m)、高精度的成趟足迹采集工作,利用了数字图像技术重现现场足迹以及形象增强技术实现足迹特征及隐含信息的形象显现。采集完成后生成以黑底为背景的足迹图像,图像信息丰富,清晰易处理。

3.2 数据采集与处理

实验采集了中国刑事警察学院共112位本科生、研究生及干训学员正常行走下的成趟赤足电子捺印样本每人6幅,共672幅。

采集完成后利用MATLAB软件将成趟赤足图像分割成单枚赤足图像,等比例缩放并填补空缺部位后,得到如图2所示的256×256像素统一大小的jpg格式单枚赤足图像。所有图像处理完毕后,筛选掉部分重叠足迹、残缺足迹,共得单枚赤足图像2712幅,其中男性62人,共1457幅,女性50人,共1255幅,单人赤足图像均在24幅以上。

图2 图像处理后所得单枚赤足图像

3.3 数据分组

训练组样本与测试组样本按7:3的数量比例在样本库中随机挑选,选取42位男性、35位女性的所有图像样本作为训练组数据,其余20位男性、15位女性的所有图像样本作为测试组数据,保证训练组与测试组没有个体上的交集。重复以上随机过程10次,产生10组不同数据集用于实验。

3.4 实验方法

本实验在windows环境下采用CPU运行,为了在实验中得到更多的训练数据,所有的图像均被左右翻转以便将数据集加倍。本实验对实验图像采取有监督的学习方法[6],实验前对训练组与测试组男女性实验图像全部进行分类标记,男性图像样本标记为0,女性图像样本标记为1,并对所有实验图像进行全局对比度归一化。实验过程中不断使用训练组样本进行分析模型的训练,并用已标记好的测试组样本对训练模型进行性别分析测试,得到分析准确率;通过误差反向传播和梯度下降算法,不断迭代更新权重和偏置,当达到设定的迭代次数后,得到最终的分析模型及模型分析准确率。

为了在实验中对AlexNet网络设置合适的网络参数,实验前随机选取一组数据集进行预实验,不断调整网络参数以优化实验结果,最终将预实验最优结果的网络参数值确定为本次实验的网络参数,详细参数设置如表所示。神经网络的测试间隔为200次迭代,即每进行200次迭代训练后利用测试组对模型准确率进行一次测试,训练的基础学习率为0.001,学习策略为步进,每迭代1000次学习率下降0.5倍,最大迭代次数为6000次,神经网络参数优化算法为随机梯度下降,输入的图像分批次处理,训练图像每批次处理的图像数量为64幅,测试图像每批次处理的图像数量为32幅。

表 实验所用AlexNet网络参数设置

4 结果与讨论

10组数据集实验结果如图3所示,其中x轴代表迭代次数,双y轴分别代表训练模型准确率与损失函数值,10对同颜色折线分别代表每组数据集随迭代次数的增加准确率与损失值的变化曲线。从图中可以看出,随着迭代次数增加,各数据集网络模型迅速收敛,分析准确率迅速提升并伴随着损失值的降低,网络在2000次迭代后趋于稳定。10组数据集训练所得最终性别分析模型平均准确率为92.2%,其中准确率最高的分析模型为95.5%,最低的为87.3%。在损失函数方面,10组数据集最终训练模型损失值相较于训练之前,损失值平均降低0.49,其中最低损失值达到0.15。

5 结论

本文以二分类的性别分析作为开端,对深度学习方法在足迹分析领域的应用进行了研究尝试:应用卷积神经网络AlexNet对赤足图像进行训练、测试,各数据集训练所得最终性别分析模型的平均准确率为92.2%,最高可达95.5%,准确率高于人工性别分析准确率。实验表明,深度学习方法在赤足迹性别分析领域可以较好地应用。在今后的实际案件和研究实验中,均可利用实验所得模型对新收集的赤足迹图像进行性别自动分析工作,避免人工特征提取与分析过程,有利于提高工作效率和进一步提升赤足迹性别分析准确率,从而为分析犯罪嫌疑人人身特点提供更有力的依据。

图3 各数据集实验数据折线图

本文的实验成果为下一步利用深度学习方法对案件现场赤足迹的性别分析研究奠定了实验基础,同时也为下阶段对身高、体态、年龄等其他人身特点的分析、足迹的人身识别等方面的研究做了实验准备。另外,本文的研究工作还存在着模型训练时间较长、实验图像样本比例不均衡、个别实验参数有待优化等问题,在接下来的研究工作中还有待提高。

猜你喜欢

足迹准确率卷积
基于3D-Winograd的快速卷积算法设计及FPGA实现
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
2015—2017 年宁夏各天气预报参考产品质量检验分析
卷积神经网络的分析与设计
从滤波器理解卷积
成长足迹
红色足迹
高速公路车牌识别标识站准确率验证法
基于傅里叶域卷积表示的目标跟踪算法