基于颜色数字化特征的朱墨时序判断研究
2017-04-10孟朝阳
衡 磊, 孟朝阳
(辽宁警察学院, 辽宁大连 116036)
基于颜色数字化特征的朱墨时序判断研究
衡 磊, 孟朝阳
(辽宁警察学院, 辽宁大连 116036)
目的 建立朱墨时序的量化、数字化研判方法。朱墨时序判断的依据不是基于外观特征和理化性质,而是将肉眼难以辨识的朱墨交叠区域的颜色特征进行数字化,从而实现数字化模式下的朱墨时序科学研判。方法 采用RGB、Lab两种颜色模式方法,将颜色信息转化为具体的数字,应用多元参数的方法进行颜色表征。采用统计学的原理和方法对大量的数据进行处理,直接得到朱墨时序的判定结论。结果 通过黑色签字笔书写字迹、打印字迹分别与印泥、印油印文的朱墨时序实验表明,只要选定适当的颜色模式表参数,根据显著性差异P值就可以进行朱墨时序的研判。结论 这种基于颜色数字化特征的朱墨时序研判方法,为朱墨时序的检验提供新方法,为文件检验数字化提供借鉴。
文件检验; 朱墨时序; 颜色模式; RGB; Lab
0 引言
目前,朱墨时序的研究和应用基于外观特征和理化性质两个方向。外观特征是交叉点处色料表观的颜色变化、层次结构等表观特征。理化性质是指溶解性、光学特性、吸附能力和化学成分等[1-2]。检验方法包括:光学(电子)显微镜法、电子探针(EPMA)和能谱(EDAX)法[3]、显微分光光度法[4]、显微红外光学成像技术[5]、拉曼光谱阵列扫描成像技术[6-7]、三维光谱法[8-9]、荧光检测法[10]、剥离法、脱色法[11]等。
各类不同朱墨交叠中,“墨”和“朱”彼此之间存在着程度不同的交融、覆盖等相互作用,这些内在的作用体现在表观上就是颜色的差异性,这些极微弱的差异性肉眼难以进行辨识。通过数字化提取过程,将颜色由感官表象转为具体的数据。再采用科学的数据处理方法,直接得到研判结论。
本文采用的是数字化特征检验方法。将颜色特征数据化,采用多元参数表征,用数据挖掘原理和方法进行结果研判,保证结论的科学性,有效地避免检验者个体原因导致的偏差。
1 基本原理
1.1 Lab和RGB颜色模式
Lab和RGB颜色模式是色度学的理论体系。Lab颜色模式是国际照明委员会(CIE)制定的与设备无关的颜色模式。Lab颜色由亮度(或亮度分量L)和两个色度分量(a和b)构成。亮度分量L范围从0~100,a分量(从绿到红)和b分量(从蓝到黄)范围为-120~+120。L值决定了颜色的亮度。而色度分量决定了色彩,a值越大,越接近红色,b值越大,越接近黄色。
RGB是基于自然界红、绿、蓝3种基色光的混合原理,将红(R)、绿(G)、蓝(B)3种光线按照不同数值进行混合产生图像的颜色。RGB的取值范围分别都是0~225。当取值都是255时产生纯白色,取值都是0时产生纯黑色,按照RGB不同的取值组合就可以得到大约1670万种色彩。
这两种颜色模式都可以对颜色进行表征,二者之间的区别在于构成不同。Lab模式是由亮度和颜色分量构成;红、绿、蓝3种颜色构成RGB模式。由于这两种颜色模式可以表达非常丰富的颜色内容,日常所见的色彩,尤其是难以分辨的颜色可以应用上述两种颜色模式表征。由于这两种颜色模式使用数字形式进行表达,因此肉眼难以辨识的很接近的颜色,用Lab或RGB模式都能够有效地进行区分和辨识。
1.2 数据处理方法
由于数据复杂且量大,实验数据处理应用SPSS统计分析软件进行。SPSS软件是目前国际学术界重要的数据处理软件,SPSS能够通过数据挖掘,揭示出不同事物之间的联系,发现彼此间内在的规律[12-13][14-15]。
在进行“先朱后墨”,“先墨后朱”的研判中,采用的是统计学中的显著性检验原理。显著性差异(P值)是统计学上对数据差异性的评价,当数据之间有了显著性差异,就说明参与比对的数据不是来自同一总体,而是来自有差异性的两个不同总体。统计学上差异性技术标准(P值)是,P>0.05差异性不显著,0.01
由于分析样本的数据是非连续型的级数类,根据样本数据的分布特点,采用非参数检验法。根据检验样本差异的两组样本之间的关系,选择独立样本模式。
2 材料与方法
2.1 实验器材
EPSON office 510扫描仪(精工爱普生株式会社,菲律宾);HP P1106激光打印机(惠普中国有限公司,中国);欧标Mate-1印油印台(上海办公伙伴贸易发展有限公司,上海);工字681印泥(上海汽枪厂,上海);得力思达6600ES中性笔(得力集团有限公司,宁波);Photoshop软件(Adobe公司,美国);SPSS 19软件(SPSS公司,美国)。
2.2 实验方法
2.2.1 实验样本制作
用上述实验器材,分别制作印油、印泥和签字笔字迹,印油、印泥和激光打印字迹形成的不同朱墨时序的样本。本实验首先选择不同的“墨”与不同的“朱”之间分别形成的样本,其中,“墨”选择了12种签字笔,一种激光打印机,“朱”分别选择印泥和印油。文中所体现只是其中的一个样本数据。这12种签字笔如表1所示。
表1 签字笔品牌型号
2.2.2 样本扫描
将样本进行扫描,扫描分辨率1 200 dpi,图像类型设置为24位全彩。扫描中要进行覆盖遮蔽,避免由于光照不均匀在数据采集中所带来的背景干扰。扫描文件存储为JPEG格式。
2.2.3 数据采集方法
将扫描图片在Photoshop的“导航器”中设置为60%,图像调整为16位/通道,颜色模式分别设置为Lab,RGB模式。采用“吸管工具”进行采样,取样大小为3×3像素平均。选取朱墨交叠区域,用上述方法选取任意50~80个位置分别采集Lab,RGB不同的颜色模式条件下的数据。
3 结果与讨论
3.1 Lab颜色模式数据的采集和处理分析
在朱墨交叠区域随机对50个位置进行Lab数据的采集,在朱墨不同的时序两个样本分别采集50组数据,其中1标号的是“先墨后朱”,2标号的是“先朱后墨”(下面实验标号相同)。应用SPSS19对数据进行Mann-Whitney检验。
3.1.1 黑色书写字迹与印油印文的朱墨时序的检验
Mann-Whitney检验结果包括秩表2和检验统计量表3。表2中L,a,b的秩均值一组大一组小,说明朱墨时序不同的两组样本总体可能不同。进一步的检验统计量中L、a、b的渐进显著性分别是0.374,0 和0 。其中a和b的渐进显著性均小于0.05,说明检验的两组不同时序的数据中,a和b的这两个色度分量存在着显著性差异,可以通过Lab色彩模式中a和b的色度分量数据,判定朱墨时序。而L的P>0.05,没有统计学意义,朱墨交叠区域的明度没有显著差异。
表2 秩
表3 Mann-Whitney检验统计量
3.1.2 黑色书写字迹与印泥印文的朱墨时序的检验
Mann-Whitney检验结果包括秩表4和检验统计量表5,秩均值有差异,说明朱墨时序不同的两种样本总体可能不同。进一步的检验统计量中L,a这两项数据组的渐进显著性P<0.05,不同的朱墨时序中L和a两项参数具有显著性差异,而b参数没有统计学意义。
表4 秩
表5 Mann-Whitney检验统计量
朱墨时序所呈现的颜色,是红色的印文和黑色的字迹彼此叠加交融的效果,影响其外观颜色的因素有:先后时序,印文材料和书写材料的融合性能,文件形成的时间等。不同时序条件下所形成的颜色差异性非常小,用肉眼难以对颜色的微弱差异进行分辨。因此,采用数字化的颜色分析方法,将颜色分解为不同的数据,通过统计学的计算结果,可以直接进行朱墨时序研判。突破了肉眼对于颜色辨识的局限性,以及人为因素对检验结论的影响。
黑色书写字迹和印油印文形成的朱墨文件的Lab颜色模式中,L亮度分量数据没有差异性,而a和b这两个色度分量的数据具有明显差异,应用统计学的计算结论,可以作为黑色书写字迹与印油印文朱墨时序的研判数据。而黑色书写字迹和印泥印文形成的朱墨文件的Lab颜色模式中,作为朱墨时序判断的数据是L和a。这说明黑色书写字迹和印油、印泥形成的朱墨颜色特征不同。印油形成的不同时序的朱墨区域,亮度相同,而色度不同,可以根据色度数据进行时序的研判。印泥形成的不同时序的朱墨区域亮度和从绿色到红色区域的色度都不同,只是从蓝色到黄色部分没有差异,可以根据朱墨交叠部分的亮度L和a(从绿色到蓝色的色度)进行朱墨时序的研判。利用Lab颜色模式,将颜色进行数据量化,通过统计处理方法,直接得朱墨时序的科学研判结论。
3.1.3 激光打印字迹与不同印文的朱墨时序检验
激光打印字迹采样是在朱墨交叠区域随机对80个位置进行Lab数据的采集,在朱墨不同的时序两个样本分别采集80组数据。表6是打印字迹分别与印泥和印油形成的朱墨时序的Mann-Whitney检验结果中渐进显著性数据。
表6 Mann-Whitney检验P值
表6中Lab各组参数的P值,均小于0.05,这表明激光打印字迹无论与印泥还是印油形成的朱墨,不同的时序间具有极显著的差异性。
3.2 RGB数据的采集和处理分析
在朱墨交叠区域随机对80个位置进行RGB参
数的采集,在两种不同的时序分别采集80组数据,其中1标号的是“先墨后朱”,2标号的是“先朱后墨”。应用SPSS19对数据进行Mann-Whitney检验。
3.2.1 黑色书写字迹与印油印文的朱墨时序的检验
Mann-Whitney检验结果包括秩表7和检验统计量表8。秩均值存在差异说明二者样本总体可能不同。进一步检验R,G ,R+G+B,R/R+G+B,G/R+G+B,B/R+G+B的P<0.05,通过上述各组数据的比较,不同的朱墨时序具有显著性差异。黑色书写字迹与印油印文的朱墨时序,可以通过R,G,R+B+G,R/R+G+B,G/R+G+B,B/R+G+B这些数据进行研判。
表7 秩
表8 Mann-Whitney检验统计量
3.2.2 黑色书写字迹与印泥印文的朱墨时序的检验
检验结果包括秩表9和检验统计量表10。秩均值存在差异,说明二者样本总体可能不同。进一步检验结果表明所有参数的P都小于0.05,RGB检验参数对印泥印文与书写字迹的朱墨时序检验是一种很有效的方法。
表9 秩
3.2.3 激光打印字迹与印泥、印油印文的检验
在激光打印和不同印文朱墨交叠区域随机对80个位置进行RGB数据的采集,在朱墨不同的时序两个样本分别采集80组数据,用SPSS 19进行处理。表11是激光打印字迹分别与印泥、印油交叠区域的RGB参数P值。
R,G和G/R+B+G,B/R+G+B数据的P值均小于0.05,激光打印和印泥印油形成的朱墨时序,可以采用上述几类参数进行时序的判断。
4 结语
通过大量的实验数据表明,这种“先朱后墨”或“先墨后朱”的颜色数据统计特征具有稳定性。基于不同朱墨时序交叠区域颜色的Lab和RGB数据,采用Mann-Whitney检验方法,依据显著性差异P值,直接利用统计学结果对印油、印泥与书写字迹、激光打印字迹形成的朱墨时序进行科学研判。
激光打印字迹形成的朱墨时序中,相对RGB颜色模式,其Lab模式的3个参数都具有明显差异性,可以根据L,a,b的具体数据,通过Mann-Whitney检验结论,直接进行朱墨时序的判断。
黑色字迹与印泥、印油印文形成的朱墨时序中,采用RGB颜色模式数据的分析,针对不同分析对象,有的数据需要进行加和处理,有的则需要比值处理。所有的数据都可以通过统计结论直接对分析对象进行研判,也可以根据印文的材料分别采用Lab颜色模式的L和a数据(印泥),a和b数据(印油)进行研判。
表10 Mann-Whitney检验统计量
表11 检验统计量(P值)
文件检验的量化、数字化以及文件检验方法的科学研判是一个不断探索的过程。本文针对朱墨时序进行检验的依据是定量分析,研判结论更为客观,避免了检验者个体主观因素对结论的影响,为文件检验数字化进程提供了借鉴。
[1] 李彪,冯明帅.朱墨时序检验方法综述[J].广东公安科技,2012(1):10-17.
[2] 谢鹏,李彪,罗琼.朱墨时序的表现特征及其判定[J].中国人民公安大学学报(自然科学版),2012(2):16-21.
[3] 杨晓红,马子宁,吉晓瑞等.扫描电镜在打印、复印文字与印油印文交叠时序综合研究[J].电子显微镜学报,2013(10):447-451.
[4] 李彪.显微分光光度计法判定朱墨时序的初步研究[J].法庭科学,2012(1):103-105.
[5] 黄红娟,郑一平,楼寿松.傅里叶显微红外成像在朱墨时序鉴定中的应用研究[J].刑事技术,2010(4):29-32.
[6] 连园园,李伟,梁鲁宁等.拉曼光谱面扫描成像判断黑色圆珠笔交叉笔画书写先后顺序[J].刑事技术,2009(6):14-17.
[7] 相树珍.共焦显微拉曼光谱技术分析判断朱墨时序[J].中国人民公安大学学报(自然科学版),2014(3):5-7.
[8] 暴仁,张淙溪.光谱成像检验法在朱墨时序鉴定中的应用[J].中国司法鉴定,2008(5):36-38.
[9] 王连昭.超景深三维微系统在印章印文检验中的应用[J].江西警察学院学报,2012(2):121-123.
[10] 程向伟,张仕龙,褚建新.荧光法判断激光打印文件朱墨时序的研究[J].中国司法鉴定,2012,65(6):43-45.
[11] 何祖康,李坚.激光打印文件朱墨时序适用检验方法[J].广西警官高等专科学校学报,2013,26(6):18-20.
[12] 胡桔州,侯木舟,欧阳资生.数据挖掘的统计方法及其软件实现[J].知识丛林,2007,233(3):134-135.
[13] 王光宏,蒋平.数据挖掘综述[J].同济大学学报,2004,32(2):246-252.
[14] 邢莉.统计分析的新模式- 数据挖掘技术[J].统计与咨询,2006(4):17-18.
[15] 朱凌云,吴宝明,曹长修.医学数据挖掘技术、方法及应用[J].生物医学工程学杂志,2004,20(3):559-562.
(责任编辑 于瑞华)
辽宁省教育厅科学研究一般项目“基于数据挖掘的朱墨时序研判方法研究”(L2015247)。
衡 磊(1967—),女,辽宁大连人,硕士,教授。研究方向为刑事技术。
D918.92