近红外光谱法鉴定签字笔字迹形成时间的化学计量学模型的建立
2017-06-24张振宇吴志生
张 平,张振宇,吴志生
(1.中国刑事警察学院 法化学系,辽宁 沈阳110035;2.北京中医药大学,北京100102)
鉴定科学Research Paper
近红外光谱法鉴定签字笔字迹形成时间的化学计量学模型的建立
张 平1,张振宇1,吴志生2
(1.中国刑事警察学院 法化学系,辽宁 沈阳110035;2.北京中医药大学,北京100102)
目的 随着伪造文件犯罪的日益增多,常用的字迹形成时间鉴定方法难以做到快速、无损。采用近红外光谱分析技术,结合化学计量学,以达到对签字笔字迹形成时间进行准确、快速、无损分析的目的。方法 对40个黑色真彩签字笔字迹样本进行近红外光谱数据采集,并运用相关模型进行预处理。建立字迹形成时间与近红外光谱数据之间的多元分析模型,并用相对分析误差 (RPD)来评价模型的预测能力。结果 应用多元散射校正(MSC)预处理方法所建模型最佳,其各项校正标准偏差与RPD均符合行业认定范围,所建模型具有可行性。结论 近红外光谱技术可对不同形成时间的黑色真彩签字笔字迹进行准确定量分析,为字迹的形成时间的鉴定提供了一种综合性参考方法。
近红外光谱;字迹形成时间;偏最小二乘法
签字笔最早起源于1984年日本樱花株式会社研制开发的Ballsigll产品和1988年日本Pentel株式会社推出的Hybird新产品[1],20世纪90年代由中国广东引进技术并开始大量生产。签字笔墨水成分主要由溶剂、着色剂、表面活性剂和其他添加剂等组成。由于书写顺畅、色泽鲜艳、不易褪色等特点,签字笔已成为人们日常生活中最常用的书写工具。随着社会经济的不断发展,伪造文件、合同的犯罪日益增多,特别是民事案件中,文件的形成时间鉴定争议最为集中、矛盾最多[2]。因此,如何快速、准确、无损地鉴定文件中字迹的形成时间已成为司法鉴定工作者研究的一项重要课题。
近红外光谱技术(Near-Infrared Spectroscopy,NIR)是一种典型的快速无损分析技术,自20世纪80年代引入到我国用于农产品的质量分析,现已经广泛应用于石油化工、食品、烟草、药物和临床医学各个领域。将其与化学计量学方法相结合,可为诸多领域的生产质量控制提供一种高效的检测手段。
本文采用近红外光谱技术对用黑色真彩GEIE550签字笔书写的不同时间的字迹样本进行近红外光谱采集,对采集到的原始光谱数据进行Savitzky-Golay卷积平滑法(SG)、标准正则变换(SNV)、多元散射校正(MSC),以及Normalize等光谱预处理,建立了字迹形成时间与其近红外光谱数据之间的偏最小二乘(PLS)近红外定量校正模型,并运用RPD来评价模型的预测能力,以期达到测定签字笔字迹形成时间的目的。
1 原理
近红外光谱是指波长在780~2 500 nm(波数为4 000~12500 cm-1)之间的电磁波。近红外光谱属于分子振动光谱,产生于共价化学键非谐能级振动,是非谐振动的倍频和组合频。对于含氢基团,如含C-H,O-H,N-H的物质都会产生近红外吸收。有机物以及部分无机物分子中各种含氢基团在受到近红外线照射时,被激发产生共振,同时吸收一部分光的能量,通过测量其对光的吸收情况,可以得到极为复杂的近红外图谱,这种图谱表示被测物质的特征。不同物质在近红外区域有丰富的吸收光谱,每种成分都有特定的光谱特征。因此,近红外光谱能反映物质的组成和结构信息,从而可以作为获取化学信息的一种有效手段。
各种书写材料经书写工具写到纸上后,由于改变了书写材料存在的条件,使其直接暴露在空气中或光线下,随着时间的推移,书写材料本身就会发生某些物理、化学性质的变化,这种变化的程度与书写时间的长短相对应。测出这种变化并能掌握其变化规律,就可以利用这一特征判断文字的书写时间。
2 材料与方法
2.1 材料、仪器
由黑色真彩GEIE550签字笔书写的8组不同书写时间字迹样本,每组字迹样本的时间间隔为90 d,每组字迹样本中包含2个汉字样本和3个数字样本,实验共计40个样本。
XL410近红外光谱仪及其漫反射光纤(AXSUN公司,美国生产);Unscrambler数据分析软件(version9.6,挪威CAMO软件公司);MATLAB(version7.0,美国Math Works公司)。
2.2 方法
2.2.1 样本的制备
本实验中用黑色真彩签字笔在白色A4打印纸上书写文字和数字,正常避光条件下保存。8组不同形成时间的签字笔字迹形成时间分别为90、180、270、360、450、540、630、720 d。
2.2.2 NIR光谱的采集
采用漫反射模式采集签字笔字迹光谱,光谱扫描范围为1 350~1 800 nm,扫描间隔为0.5 nm,扫描频率为64次/s。对所选取的每个实验样本进行6个不同位置的光谱采集,位置选取的标准为起笔位置、收笔位置、墨迹轻重程度不同的位置及墨迹交叉的位置等,40个样品共计采集240条光谱,采集的原始近红外光谱谱图(图1)。
图1 签字笔字迹的原始近红外光谱
2.2.3 样本集的划分
采用 Kennard-Stone法(K-S)划分240个样本集,划分后的校正集和验证集分别为160个和80个。其中,校正集用于建立近红外光谱数据与形成时间关系数据模型,验证集用于模型的验证。
2.2.4 光谱的预处理
为消除近红外光谱的基线漂移、非线性以及光谱的低重复性[3]的影响,本文采用Savitzky-Golay卷积平滑法(SG)、标准正则变换(SNV)、多元散射校正(MSC),以及归一法(Normalize)四种方法对采集所得的光谱进行预处理。SG卷积是一种加权平均法,此处理方法可消除近红外光谱中含有的噪声;SNV主要用来消除固体颗粒大小、表面散射以及光程变化对NIR漫反射光谱的影响;MSC主要用来消除颗粒分布不均匀及颗粒大小产生的散射影响,在固体漫反射和浆状物透(反)射光谱中应用较为广泛;Normalize可以消除因微小光程差异带来的光谱变动,在NIR光谱分析中常用的归一化法为矢量分析法。
2.2.5 定量分析模型的建立
将经过预处理的近红外光谱数据与其形成时间建立全波段偏最小二乘(PLS)模型[4],采用交叉验证方法确定模型的主因子数。校正集的统计参数包括交叉验证校正标准偏差(RMSECV)、校正标准偏差(RMSEC)和校正集决定系数R2cal;验证集的统计参数包括预测标准偏差(RMSEP)和预测集决定系数R2pre。其中,RMSECV、RMSEC的值越小,表明所建模型的质量越高,RMSEP的值越小,表明模型的预测能力越强,R2越接近于1,表明准确性越高。此外,也可以采用相对分析误差[5-6](Residual Predictive Deviation,RPD)来评价模型的预测能力,RPD值越大,所对应的校正模型的预测性能越好,当RPD值大于2.5时,表明模型的定量分析具有可行性。
其中yi,actual为第 i个样品参考方法的测定值;yi,perdicted为用所建模型对校正集中第i个样品的近红外光谱方法预测值;n为校正集的样品数。
其中,yi,actual为第 i样品参考方法的测定值;yi,perdicted为校正集交互验证过程中第i个样品的近红外光谱方法预测值;n为校正集的样品数。
其中,yi,actual为第 i样品参考方法的测定值;yi,perdicted为验证集预测过程中第i样品的近红外光谱方法预测值;m为验正集的样品数。
其中,yi,actual为第 i样品参考方法的测定值;yi,perdicted为校正集或验证集所有样品参考方法测定的平均值;yactual为校正集或验证集预测过程中第i样品的近红外光谱方法预测值;n为校正集或验证集的样品数。
其中,Ci为验证集样本参考方法的平均值;n为验证集的样品数。
3 结果与讨论
本文采用了SG卷积平滑、标准正则变换、多元散射校正和归一化方法对采集的240个样本的近红外光谱进行光谱预处理,来探讨不同方法对模型性能的影响。表1给出各预处理方法所建立的模型的性能指标值,其中RMSECV值越小,R2越接近于1,RPD值越大表明模型性能越好。图2为不同预处理方法的预测残差平方和(PRESS)的值,通过考察主因子数对预测残差平方和(PRESS)的影响,当曲线中趋于稳定的主因子数越多,且模型建立选取的主因子数越少,证明模型的性能越高。综合以上标准,可优选出最佳的预处理方法。结果表明,表1中采用多元散射校正(MSC)预处理方法所得RMSECV值为78.484,R2cal为0.9207,R2pre为0.8843,RPD为2.958,主因子数为7。因此,采用MSC处理后的光谱建立PLS模型具有可行性,可得出签字笔字迹在形成时间上存在规律性,可由此测定签字笔字迹的形成时间。
表1 不同光谱预处理方法的定量模型的性能指标
图2 不同预处理方法的PRESS值
4 结论
本文采用近红外光谱技术对用黑色真彩GEIE550签字笔书写的不同形成时间的字迹样本进行了近红外光谱采集,并建立了其形成时间与近红外光谱数据的偏最小二乘定量模型,所得模型的R2pre为0.8843,表明字迹在不同时间的变化中存在规律性。同时,采用RPD来评价模型的预测能力,其RPD值达到2.958,说明其模型的定量分析具有可行性。近红外光谱法可对字迹样本进行快速、无损的检验,但在实际应用前,还应该对该方法进行进一步的改进,有必要扩充样本集的数量及范围,以提高模型的稳定性,对建模方法进行进一步的升级与完善,对模型在文检应用中的各项指标进行讨论并作出明确的规定,以提高模型的适应性,为今后的字迹检验提供一种综合的研究方法。
[1]李彪.签字笔墨水字迹形成时间研究综述[J].法庭科学,2012,(4):95-98.
[2]籍康,赵杰.共焦显微拉曼光谱对签字笔字迹形成时间的研究[J].南京师大学报,2010,33(4):68-71.
[3]Devos O,Ruckebusch C,Durand A,et al.Support V ector machine(SNV)in N ear I nfrared(NIR)S pectroscopy:Focus on P arameters O ptimization and M odel I nterpretation[J].Chemometrics and Intelligent Laboratory System,2009,96(1):27-33.
[4]白雁,李珊,王星,等.近红外光谱法快速测定金银花中绿原酸的含量[J].中国实验方剂学杂志,2011,(5):66-69.
[5]Chan C,Chu C,Mok D K,et al.Analysis of B erberine and T otal alkaoid C ontent in Cortex Phellodendri by N ear infrared S pectroscopy(NIRS)C ompared with H igh-P erformance L iquid C hromatography C oupled with U ltra-V isible S pectrometric D etection[J].Analytica Chimica Acta,2007,592(2):121-131.
[6]Joubert E,Manley M,Botha M.Use of NIRS for Quantification of Mangiferin and Hesperidin Contents of Dried Green Honeybush(Cyclopia genistoides)P lant M ateria[J].JAgric Food Chem,2006,54,(15):5279-5283.
(本文编辑:张清华)
Chem ometric M odel for Dating Gel Ink Entries by Near Infrared Spectroscopy
ZHANG Ping1,ZHANG Zhen-yu1,WU Zhi-sheng2
(1.NationalPolice University ofChina,Shengyang110035,China;2.Beijing University ofChineseMedicine,Beijing100102,China)
Objective With the increasing number of forged documents,the commonly used methods for dating ink entries is difficult to achieve fast and non-destructive analysis.In this study,a near-infrared spectroscopy method combined with chemometricswas established for the accurate,fast and non-destructive analysis of the age of gel ink entries.M ethod The near-infrared spectra of 40 black gel ink sampleswere collected and pre-treated with relevantmodels.Multivariate analysis models describing the relationship between ink ages and near-infrared spectra were established.The relative prediction error(RPD)was used to evaluate the prediction ability of the models.Result The model developed by the multiple scattering correction(MSC)method was the best,and the calibration standard deviation and RPD were acceptable.The model is feasible.Conclusion Near-infrared spectroscopy can analyze the black gel ink entries written at different time accurately and quantitatively,which provides a referencemethod for ink dating.
near-infrared spectroscopy;ink dating;partial least squares
DF794.2
A
10.3969/j.issn.1671-2072.2017.03.011
1671-2072-(2017)03-0061-04
2016-11-17
国家“十三五”重点研发计划课题(2016YFC0800705)
张平(1992—),女,硕士研究生,主要从事微量物证研究。E-mail:1449967207@qq.com。
张振宇(1960—),男,教授,主要从事微量物证研究。E-mail:ccpczzy@163.com。