鞋印几何特征的提取
2019-07-11邬文蔚周启茹
邬文蔚 周启茹
上海市公安局浦东分局刑侦支队刑事科学技术研究所,上海 200125
在鞋印识别中,鞋印几何特征的有效提取变得非常关键。一般而言,对于鞋印图像,描述其特征可以有不同的方式,比如:颜色特征、纹理特征、形状特征、位置特征等。当然,要实现图像的匹配,提取到的特征,要具备独特性、鲁棒性、独立性,为了便于处理和分析,这些特征点还具备数量少的要求,这就需要深入研究相关的提取技术和方法,在提取过程中能够综合应用。
一、鞋印识别与刑事侦查
在刑事侦查中,工作人员会根据案发现场情况采集相应的痕迹数据,比如指纹、脚印、脸纹以及使用过的工具痕迹,这些痕迹对侦破案件提供了有力的帮助。但是,与其他痕迹相比,脚印痕迹具有独特的优势,比如不容易被消除干净,与人身特征具有非常紧密的关系,以此就可以推测出犯罪嫌疑人的年龄特征,以及其他相关的特点,从而圈定嫌疑人的范围,通过进一步的处理,为案件的侦破提供有力的证据,因此,鞋印识别在刑侦领域应用非常广泛。
二、常用鞋印图像预处理方法
鞋印图像的预处理,是鞋印识别中的重要环节,其处理结果直接关系到后续的各项分析。而预处理过程又包含多个流程,最终处理使得图像轮廓变得凸显、鞋印图像变得清晰。
(一)灰度化处理
一般情况下,从现场采集到的图像都是彩色的,从视觉效果来看,呈现的信息非常丰富。但是,在鞋印的几何特征提取中,信息越丰富,意味着待处理的信息量很大,而且颜色在鞋印识别中意义不是很大,因此,需要将其灰度化处理,最终形成黑、白化的二值图像。
具体处理可以使用像素的分量,也可以使用亮度等级进行转化,后者的处理,有一个很著名的心理学公式,其表达式为:gray=0.299R+0.587G+0.114B。在二值图像上,提取有价值的点和线,是非常容易的,而且对于计算机而言,运行速度也很快。
(二)图像滤波技术
在鞋印的图像处理过程中,会出现一些噪声数据,这些噪声数据会成为特征提取的障碍。因此滤波主要是对噪声数据进行削减,对图像质量起到保护。当然,在去噪和图像质量之间需要根据实际需求进行平衡。从目前的技术来看,主要有均值滤波、线性滤波、中值滤波和高斯滤波。均值滤波可以利用图像周围的像素点的均值对此噪声点进行替换;线性滤波的主要功能是消除和模糊噪声;中值滤波通过排序筛选出中间位置的点并以此点作为对噪声点的替换;与前面方法相比,高斯滤波可以起到很好的滤波效果。
(三)图像锐化
图像锐化属于图像增强技术,使图像的质量有所改善,物体的边缘更加鲜明,其主要方法有微分法和高通滤波法。在算法实现上,主要有梯度算法、罗伯茨梯度算法、索伯尔(Sobel)算法、普瑞维特算法、拉普拉斯算法(二阶差分)、LoG算法等。
当然,每一种算法有其自身的应用场景,但是,从实验效果来看,Roberts算法提取信息较弱;而Sobel算法和Priwitt算法处理效果基本相同;Laplacian算法可以脱离微分的计算原理,在模板系数的基础上产生Laplacian变形算子,对噪声比较敏感;Log边缘算法也称为拉普拉斯高斯算法,是效果较好的边沿检测器,具体工作过程是先平化掉噪声,再进行边缘检测,这样在减少计算量的同时,提高了算法的效率。
三、几何特征的提取
通过前面一系列的处理,获取到的鞋印已经是得到了去噪并得到强化的二值图像,在此基础上,就可以提取外纹轮廓特征和内部纹理特征。当然,为了使得提取的特征有效,并符合处理要求,就需要对其进行降噪和矫正等处理。在一副图像中,可以有很多描述图像信息的特征,这些特征对图像信息的贡献大小不一,因此需要特定的方法进行降维处理,其中最经常使用的就是主成分分析,将贡献大的筛选出来。
在此过程中,涉及到鞋印的二次定位,第一次定位是将鞋印边缘轮廓上的点通过像素坐标的方式生成一个2*n的矩阵,然后通过特定运行抽取出构造生成的协方差的特征值和特征向量,运用主成分分析方法,在保证信息量丢失很少的前提下,得到较大的特征值和特征向量,再进行图像的旋转,从而完成第一次定位。然后,在提取出鞋印上、下、左、右四个点,需要执行从上到下、从下到上、从左到右和从右到左的搜索,得到这四个点后,左右、上下相连形成交点,以该点为中心进行鞋印的旋转和变换,从而完成鞋印的第二次定位。这里所产生的上下左右四个点,通过连接会形成一个四边形,其作用主要是基于其边长比及角度特征,简化鞋印的外纹轮廓处理。
需要说明的是,通过上述过程得到的四个点形成的四边形是一个不规则的四边形,也就是说其变长极有可能都是不相同的,但是这对描述鞋印没有任何影响,同样在描述鞋印外纹轮廓上具有很强的鲁棒性。
鞋印图像经过二次定位后,继续对其做灰度化、四点搜索等处理,从而最终得到所需要的四边形,对其求取四个角的角度,从而形成鞋印的外部轮廓特征。
四、几何特征的匹配
获取到鞋印的特征点后,就可以按照特定的方法计算特征点的相似度,以此度量鞋印的相似性,具体由多个数据属性描述,通过距离的计算来刻画。常用的度量方法有:欧式距离、马氏距离、明氏距离、巴氏距离等。欧氏距离可以计算出相同维数上的不同点的空间距离,然而这些点必须处于维度相同的空间;马氏距离是一种对协方差距离的计算,具有尺度无关性,但前提是需要已知类别样本,从而限制了其使用的场景;明氏距离融合了欧氏距离和曼哈顿距离的优势,在度量上有一定的灵活性;巴氏距离消除了量纲对样本测量的影响,用于测量两离散概率分布,比较适合归一化后的直方图和模板向量相似度的计算。
这里根据鞋印识别的实际,在匹配过程中采用巴氏距离作为衡量标准。通过多次试验,得到鞋印的相似度变化图,见图1。
在图1中,横轴表示鞋印图像的个数,纵轴表示相似度。从总体来看,相似度集中于两个区间上,一个是0.4到0.5之间,一个是0.7到0.8之间,这说明了特征点与同一只鞋的相似度可以高达0.7以上,而与不同的鞋的相似度仅仅停留在0.4上下。从而可以说明,采用巴氏距离度量鞋印特征点的相似度,能很好地对鞋印进行区分。
五、结束语
本文详细阐述了鞋印几何特征的提取过程,主要的环节有:鞋印的预处理、鞋印的第一次定位和第二次定位、外部轮廓特征提取、相似度匹配。事实上,在整个处理过程中,图像的预处理非常的重要,一方面过滤掉不重要的数据点,另一方面使得重要的信息凸显出来,从而为后续的特征提取做好准备。
[1]管燕,李元金.外轮廓与花纹特征相结合的平面鞋印图像识别的研究[J].长江大学学报(自科版),2010,07(2):74-76.
[2]王红星,张燕.基于整体特征的鞋印匹配算法[J].科学技术与工程,2017,17(15):268-272.
[3]管燕,李存华,仲兆满.基于轮廓特征的平面鞋印自动识别算法的研究和实现[J].计算机应用研究,2008,25(8):2413-2415.