高光谱成像技术在黑色中性笔检测方面的研究
2018-06-06王伟利赵曰峰
王伟利 赵曰峰
摘要:应用高光谱成像技术识别篡改的字迹,还原原本数据,以及重现同色掩盖的字迹。提取特征波段后,可以对样本数据做出初步的区分。对每个样本依次进行降噪、IsoData、建立眼膜、去除背景和PCA分析处理。并结合数学统计分析提出了识别篡改字迹和重现掩盖字迹的方法。该方法对18种品牌黑色中性笔的篡改字迹识别率和重现掩盖字迹识别率分别为75.8%和57.3%。
关键词:高光谱成像;字迹;篡改;掩盖;主成分分析
中图分类号:O433.4 文献标识码:A 文章编号:1009-3044(2018)07-0236-02
Abstract: Hyperspectral imaging technology is used to recognize handwriting,to restore the original data,and to reappear the same color masking handwriting.After extracting the characteristic bands, we can make a preliminary distinction between the sample data.Each sample was then subjected to noise reduction, IsoData, the establishment of eye mask, removal of background and PCA analysis.Combined with mathematical statistics analysis, the method of identifying tampering handwriting and reproducing cover handwriting is put forward.The recognition rate and cover up rate of black neutral pens of 18 brands were 75.8% and 57.3% respectively.
Key words:Hyperspectral imaging ;Handwriting;Tampering;cover;principal component analysis
人眼在可见光范围内对光敏感,根据颜色来区分材料。然而,人类是无法区分两个相同的颜色。黑色中性笔墨水稳定,字迹不褪色,很多重要的文件用黑色中性笔书写,例如合同、收据、证件、支票等文件,这些文件上面的数字、时间、文字等,容易被添加或篡改,识别篡改的字迹和重现掩盖的字迹都是刑事诉讼的重要证据,因此,在多数民事以及刑事案件中,很多文件鉴定都需要对黑色中性笔的字迹进行鉴定。鉴别字迹的主要方法有有损检测和无损检测两种方法。高光谱成像是近年来出现的一种有效的非破坏性的工具,已越来越广泛地应用于农产品品种的识别[1-3]。在字迹检查方面,国外研究者Zohaib Khan等[4]基于高光谱成像技术研究墨水不匹配检测,黑色墨水识别率最高达89%,但实验材料仍然局限在几种不同品牌的墨水,实验结果缺乏普遍性,国内一般用黑色中性笔书写,同时也缺乏在国内的实用性。本文以市场热卖的18种黑色中性笔为对象,探索一种更有效的字迹识别方法,为字迹刑侦鉴定提供研究基础。
1 材料与设备
1.1 实验材料与实验样品制备
实验样品为市场热卖的18种品牌的黑色中性笔,18种品牌中性笔相互篡改和掩盖。用18种品牌的中性笔分别写上数字“1”,24小时后被其他品牌中性笔篡改成数字“40”,制作了306个篡改实验样本。如图1中(a)、(b)为1号笔被2号笔篡改前和篡改后的图片。从图1中可以看出,1号笔被同种颜色的2号笔篡改后,用肉眼完全看不出篡改的痕迹。用18种品牌的中性笔分别写上各自对应的数字序号,24小时后被其他品牌中性笔分别掩盖,制作了306个掩盖实验样本,如图1中(c)、(d)为14号笔被15号笔掩盖前和掩盖后的图片。从图1中可以看出,掩盖后的字迹用肉眼完全不能识别。
2 结果与讨论
2.1 字迹篡改和掩盖重现的识别结果
以1号笔和17号笔相互篡改为例,图2中(a)是数码照片,(b)是没有去除背景的主成分分析处理结果,(c)是去除背景的主成分分析处理结果,(d)是假彩色合成的处理结果。从图2可以看出,去除背景信息的干扰后,处理结果更清晰。大量数据分析得知,假彩色合成对字迹篡改的识别效果最好。没有见过原数据的人,能成功识别篡改后的字迹,即该组样本可以识别。
以2号中性笔被13号中性笔掩盖样本为例,图3中(a)是样本的数码照片,(b)是没有去除背景的主成分分析处理结果,(c)是去除背景的主成分分析处理结果,(d)是假彩色合成的处理结果。大量数据分析得知,去除背景的主成分分析处理对字迹掩盖重现的识别效果最好。
3 结论
1)在720-1000nm波段范围内不同品牌中性笔光谱反射率差异较大,是识别字迹的最佳波段。
2)国产笔和日产笔的识别效果可达100%,这为商品的假冒伪劣提供了理论基础。
3)研究表明,去除背景信息后,再次进行分析处理,识别效果更新清晰。
4)本文通过降噪、IsoData、建立眼膜、去除背景和PCA分析处理对字迹进行识别,经过不同的方法处理后,都会识别出不同的样本数据。306组黑色中性笔的篡改样本数据中,有232组数据可以被识别出来,识别率达到75.8%。306组黑色中性笔的掩盖样本中,175组数据可以被重现出来,识别率达到57.3%。
5)研究的结果表明高光谱成像技术可以用于不同品牌的黑色中性笔之间的篡改和掩盖的识别,为字迹的刑侦鉴定提供了研究基础。
参考文献:
[1]肖波,毛文華,梁小红.基于高光谱图像和判别分析的草地早熟禾品种识别研究[J].光谱学与光谱分析,2012,32(6):1620-1623.
[2]迟茜,王转卫,杨婷婷.基于近红外高光谱成像的猕猴桃早期隐性损伤识别[J].农业机械学报,2015,46(3):235-242.
[3]刘瑶,谭克竹,陈月华.基于分段主成分分析和高光谱技术的大豆品种识别[J].大豆科学,2016,35(4):672-678.
[4]Zohaib Khan,FaisalShafait,AjmalMian.Automatic ink mismatch detection for forensic document analysis[J].Pattern Recognition,2015(48):3615-3626.
[5]连园园,李伟,王桂强.光谱成像检验同种同色涂抹掩盖字迹研究[J].刑事技术,2011(1):22-27.
[6]黄威,许小京,俞涛.应用光谱成像技术鉴别同色墨水[J].光谱实验室,2012,29(6):3439-3442.