APP下载

基于最小卡方统计的刑侦图像目标提取算法

2016-12-22范九伦

西安邮电大学学报 2016年6期
关键词:作案工具鞋印卡方

雷 博, 范九伦

(西安邮电大学 通信与信息工程学院,陕西 西安 710121)



基于最小卡方统计的刑侦图像目标提取算法

雷 博, 范九伦

(西安邮电大学 通信与信息工程学院,陕西 西安 710121)

针对刑侦图像的自动目标提取问题,提出一种基于最小卡方统计的图像阈值化分割算法。该算法在图像一维直方图的基础上,利用卡方统计计算原图像与二值化后图像之间的相似性程度,从而获取最佳的分割阈值,提取图像中的目标区域。在实际刑侦图像库上的测试结果表明,该算法可以有效提取不同类型刑侦图像中的目标区域。

刑侦图像处理;目标提取;卡方统计;阈值化分割

随着图像采集设备的发展,刑侦办案过程中会产生大量的图像数据,如何有效管理和利用这些图像数据,为破案提供有用线索,是目前刑侦图像处理的一个重要研究方向[1]。在进行刑侦图像处理时,有效目标区域的提取,将会被后续识别和分析处理所用。

图像分割是自动目标提取的常用技术,也是成功进行图像分析、理解与描述的关键步骤[2]。其目的是把图像中具有均匀性质的不同区域区分开来,使得这些区域互相不交叉且每个区域都满足特定区域的一致性[3]。虽然已有基于边缘提取的图像分割技术、基于区域的图像分割技术、基于聚类分析的图像分割技术和基于阈值化的图像分割技术等多种方法,但由于图像分割定义的病态性,并没有可以适用于所有图像的图像分割方法[4]。在进行刑侦图像分割时,效果往往不理想。阈值化技术[4]是常用的图像分割算法之一,其原理简单、实现起来比较容易。常用的阈值化技术有基于统计理论的方法、基于模糊理论的方法以及基于粗糙集理论的方法等[5]。

卡方统计(也记为χ2-统计)[6]是信息论中用来度量假设分布与观察数据匹配程度的数学工具。本文拟将χ2-统计引入图像的阈值化分割,提出一种对应的阈值化分割算法并将用于刑侦图像的目标区域提取。

1 最小卡方统计法

设N1,N2,…,Nk是不同的k个类的观察次数,p1,p2,…,pk是假设的一个正态分布的概率值。衡量假设概率对于观察值的匹配程度的准则[7]为

(1)

其中,O是观察值,E是期望值,N是观察值的总数。

(2)

χ2-统计常用于度量假设分布与观察数据匹配的程度,χ2的值越大,匹配的越好。χ2的表达式也可看成是期望频率与观察频率的平方偏差的加权和。

χ2-统计和相对熵[8-10]有着密切的联系[11]。给定数据集X={x1,x2,…,xk},qxi是样本xi出现的频率,N是数据总量,则xi出现的次数为Nqxi。设P=(p1,p2,…,pk)是先验概率分布,pi对应于出现Nqxi的期望频率。假定概率分布Q=(q1,q2,…,qk)中的qi和pi相差为一个值很小且均值为零的具有对称性的随机变量εi,即

qi=pi(1+εi) (i=1,2,…,k),

(3)

则Q和P之间的相对熵为

(4)

(5)

式(5)即为相对熵和χ2-统计之间的近似关系。

χ2-统计是概率论中用来度量两个概率分布之间差异程度的测度,将其推广可用来计算两个向量之间的距离。假设X={x1,…,xn}上的两个数组(向量)A={a1,…,an}和B={b1,…,bn}满足

其中C>0为常数。A与B的匹配程度可描述为

(6)

式(6)称为广义χ2-统计,常数1/C在具体计算时可以忽略不计。

2 基于最小卡方统计的图像阈值化算法

将χ2-统计用于图像的阈值化选取。设有一幅大小为M×N的数字图像F=[f(i,j)]M×N,其中f(i,j)表示像素(i,j)处的灰度值,f(i,j)∈G,G={0,1,…,L-1},L为图像的灰度级。图像中灰度为g的像素点总数记为l(g),则图像中每一灰度值g出现的概率可表示为

(7)

设阈值t将图像分为目标和背景两类,分别记为C0和C1,C0=[0,…,t],C1=[t+1,…,L-1],则这两类的先验概率分别为

(8)

(9)

这两类的均值分别为

(10)

(11)

(12)

忽略掉常数因子MN可得

(13)

χ2(t)还可写为

(14)

(15)

即为最小χ2-统计阈值化算法的目标函数。

3 实验结果及分析

为了验证最小χ2-统计阈值化算法的有效性,分别利用Otsu法[12]、交叉熵阈值法[10]和本文算法对作案工具、车辆和鞋印等3种不同类型刑侦图像目标区域进行分割提取,结果分别如图1、图2和图3所示。

(a) 原图 (b) Otsu法分割结果

(c) 交叉熵法分割结果(d) 本文算法分割结果

图1 作案工具目标区域提取结果

由图1(b)可以看出,Otsu法不能很好地提取图像中的作案工具,有大量背景区域被错分,而由图1(c)和图1(d)可见,交叉熵算法和本文算法可以较好的将作案工具区域提取出来。

(a) 原图 (b) Otsu法分割结果

(c) 交叉熵法分割结果(d) 本文算法分割结果

图2 车辆图像目标区域提取结果

由图2(a)可知,该图像背景比较复杂,对于车辆而言,车牌是提取图像中的关键信息。由图2(b)所示, Otsu法提取出的车牌信息不够清晰,而图2(c)和图2(d)所示的交叉熵算法和本文算法,可以较好的提取出车辆的车牌信息。因此,交叉熵阈值法和本文算法的分割结果优于Otsu算法。

(a) 原图 (b) Otsu法分割结果

(c) 交叉熵法分割结果(d) 本文算法分割结果

图3 鞋印图像目标区域提取结果

图3与图1所示图像背景区域较为单一,能够较容易获得其目标区域。图3(b)给出的Otsu算法,基本将鞋印部分提取出来,但在背景上含有大量的噪声,将很多背景区域错分为目标区域。然而,交叉熵算法(图3(c))和本文算法(图3(d))可以完全将鞋印区域与背景区域区分开来,清晰的提取出鞋印区域的信息,且本文算法对于图像左下角的噪声去除更干净。

4 结语

基于信息论中测量两个概率分布之间差异性的测度——χ2-统计,参照交叉熵阈值法的原理,通过对其进行简单推广,提出了一种基于最小χ2-统计的图像阈值化分割算法,并将该算法用于刑侦图像的目标区域提取。实验结果表明,该算法可以有效提取不同类型刑侦图像中的目标区域。交叉熵和χ2-统计是两个不同的信息距离测度,根据它们的相拟性,有必要将χ2-统计列入图像的阈值化分割,以比较这两种测度在图像处理中的特点和适应性。

[1] 刘颖,范九伦,李宗. 现勘图像数据库检索技术实例探讨[J]. 西安邮电大学学报,2015,20(3): 11-20[2016-07-10]. DOI:10.13682/j.issn.2095-6533.2015.03.002.

[2] SAHOO P K, SOLTANI S, WONG A K C. A survey of thresholding techniques[J/OL]. Computer Vision, Graphics and Image Processing, 1988, 41(2), 233-260[2016-07-10]. http://dx.doi.org/10.1016/0734-189X(88)90022-9.

[3] GONZALEZ R C, WOODS R E. 数字图像处理[M].2版,阮秋琦, 阮宇智,译.北京:电子工业出版社, 2003.

[4] SEZGIN M, SANKUR B. Survey over image thresholding techniques and quantitative performance evaluation[J/OL]. Journal of Electronic Imaging, 2004, 13(1):146-165[2016-07-10]. http://dx.doi.org/10.1117/1.1631315.

[5] 雷博. 基于图像不确定性信息的阈值分割方法研究[D]. 西安:西安电子科技大学,2013:1-7.

[6] RAO C R, Linear Statistical Inference and Applications [J/OL]. Wiley, 1974: 17(1):225-228[2016-07-10]. http://www.researchgate.net/publication/269502081_Linear_.

[7] PEARSON K, On the criterion that a given system of deviations from the probable in the case of correlated system of variables in such that it can be reasonable supposed to have arisen from random sampling[M]. Breakthroughs in Statistics, 1992: 11-28.

[8] KULLBACK S, LEIBLER R A. On information and sufficiency[J/OL].Ann.Math.Stat., 1951,22(1):79-86[2016-07-10]. http://projecteuclid.org/euclid.aoms/1177729694.

[9] LI C H,LEE C K. Minimum cross entropy thresholding[J/OL]. Pattern Recognition, 1993,26(4):617-625[2016-07-10]. http://dx.doi.org/10.1016/0031-3203(93)90115-D.

[10] FAN J L. Notes on Poisson distribution-based minimum error thresholding[J/OL]. Pattern Recognition Letter. 1998, 19(5-6):425-431[2016-07-10]. http://dx.doi.org/10.1016/S0167-8655(98)00028-2.

[11] SETH A K,KAPUR J N. A comparative assessment of entropic and non-entropic methods of estimation, in Maximum Entropy and Bayesian Methods[J/OL]. Maximum Entropy and Bayesian Methods,1990(39):451-462[2016-07-10].http://link.springer.com/chapter/10.1007/978-94-009-0683-9_31.DOI:10.1007/978-94-009-0683-9_31.

[12] OTSU N. A threshold selection method from gray level histograms[J/OL], IEEE Transactions on Systems, Man and Cybernetics, 1979,9(1): 62-66[2016-07-10]. http://dx.doi.org/10.1109/tsmc.1979.4310076.

[责任编辑:祝剑]

An object extraction algorithm for forensic images based on minimum chi-square statistics

LEI Bo, FAN Jiulun

(School of Communications and Information Engineering , Xi’an University of Posts and Telecommunications, Xi’an 710121, China )

To extract objects in forensic images, a minimumχ2statistics image thresholding segmentation algorithm is proposed. In this algorithm, the best threshold is obtained by extracting the object regions from the image and by calculating the minimumχ2statistics between the original image and the threshold image based on the one-dimensional histogram of the image. Experiment results on the actual forensic image database show that the proposed method can extract the object regions from the different forensic images effectively.

forensic image processing, object extraction,χ2statistics, thresholding segmentation

10.13682/j.issn.2095-6533.2016.06.004

2016-06-30

国家自然科学基金资助项目(61340040, 61601362);陕西省国际合作与交流计划资助项目(2015KW-005);陕西省教育厅专项科研计划资助项目(15JK1658)

雷博(1981-),女,博士,副教授,从事数字图像处理方面的研究。E-mail:leileibo@xupt.edu.cn 范九伦(1964-),男,博士,教授,从事数字图像处理方面的研究。E-mail:jiulunf@xupt.edu.cn

TP391

A

2095-6533(2016)06-0020-04

猜你喜欢

作案工具鞋印卡方
卡方检验的应用条件
卡方变异的SSA的FSC赛车转向梯形优化方法
卡方检验的应用条件
关于聂树斌案的证据学思考
作案工具失踪了
奇怪的鞋印
大盗面具
卡方分布的性质与应用探讨
可疑的鞋印
谁留下的鞋印