APP下载

XRF结合多元统计学对热敏纸的分类研究

2021-01-08顾安舟

中国造纸 2020年12期
关键词:判别函数纸张分析法

姜 红 王 欣 顾安舟

(中国人民公安大学,北京,100038)

在犯罪现场中,常常能提取到超市的收银小票、银行的取款凭证等证物,因此,现场遗留纸张的分析检验是法庭科学研究的重要课题之一。刑事技术人员经过检验分析现场提取的纸张,如热敏纸等,可以从中获取违法犯罪分子的人群特征、行踪动向和经济状况等。充分利用这些信息可以刻画违法犯罪分子的特征,缩小侦查范围,为侦查破案和庭审服务提供便利。热敏纸是一种加工纸,指涂布了含有成色材料、经热信号激励可自身显色的信息记录纸。目前,纸张的检验方法主要有红外光谱法、扫描电子显微镜/能谱法和拉曼光谱法等[1-3]。本研究利用X射线荧光光谱仪(XRF)对收集到的31 种热敏纸样品进行检验,依据热敏纸样本所含元素种类及其含量的差异,对样品进行区分;选用SPSS 22.0 统计分析软件,结合主成分分析法和系统聚类分析法,对实验结果进行处理和验证,得到了较为满意的结果。

1 实 验

1.1 实验仪器及条件

X 射线荧光光谱仪(XRF,X-MET7500 型,英国),Rh靶,电压45 kV,电流50 μA,测试时间110 s。

1.2 实验样品

31 个不同来源的热敏纸样品,样品信息如表1所示。

表1 热敏纸样品表

1.3 实验方法

分别剪取31 种样品,按上述实验条件进行XRF检验,获取光谱数据;样品尺寸为10 mm×10 mm,每个样品进行3次平行实验。

2 结果与讨论

2.1 XRF分析法

根据XRF 检测31 种热敏纸样品的结果可知,其中含有的主要元素有Ca、Ti、Fe、Ni、Cu、Zn、Sn、Sb、Pb 等,其中元素Ca、Ti、Fe 的含量最多,其主要原因是纸张常用填料为碳酸钙,因此所含Ca 元素含量较多[4-5];此外,为增强纸张机械强度、白度和光泽度,造纸过程中常使用的复盐、漂白剂等会引入Ti、Fe元素[6-7];另外,在纸张的杀菌抑菌、防腐剂和阻燃剂的添加及印刷过程中,往往会引入Ni、Zn 和Pb 等元素[8]。不同品牌、系列及批次的热敏纸样品由于原料和加工工艺不同,所含元素种类和含量会有所区别,因此,可以将各样本中所含元素种类和含量作为鉴定样品的依据。

2.2 主成分分析法

通过比较分析热敏纸样品中所含元素种类、含量以及元素含量比可以对样本进行初步分类,但仅凭以上方法无法对样本进行较为精确的分类;同时,当样本数量较大时,人工进行比较和分类耗时耗力,因此,寻求一种更为精确、便捷的分类方法是十分必要的。主成分分析法是一种常用的分析方法,旨在利用降维的思想,把多指标转化为少数几个综合指标[9-10]。表2所示为利用主成分分析法得到的31种热敏纸的特征方差贡献率。

表2 主成分分析特征方差贡献率

主成分分析法中,通常选择特征根大于1 且累积方差贡献率大于85%的主成分作为代表性特征。由表1 可知,本实验仅提取了1 个主成分。但是由于成分之间的相关性较大,1 个主成分无法准确映射出各样品在三维矢量空间的具体分布情况,分类结果并不理想。因此,需要借助其他分析方法进行进一步探究。

2.3 聚类分析法与判别分析法

近年来,聚类分析法被广泛应用于理化检验领域。系统聚类又称为凝聚性层次聚类,主要是根据数据之间的距离,合并相近程度最高的两簇成一个新簇,不断重复此过程,直到所有个体都归为一个簇[11-12]。判别分析法是用一种根据已有的数据集去分析新的数据类别的方法,可以通过此方法建立预测模型[13-15]。本研究尝试将两种分析方法相结合,以期实现对热敏纸的准确检验。

本研究采用组间平均连接法度量类间距离,选择平方欧氏距离度量区间表征样品之间的差异,再进行系统聚类,谱系图如图1所示。当并类距离最小(为0)时,样本可分为6类;当并类距离为2时,样品可分为4类;当阈值达到25时,停止凝聚,所有样品并为一类。随机选择1#、12#、31#样品的3 次重复实验结果进行分析,在排除实验误差的情况下,以同一样本重复实验结果为一类来确定并类距离。根据谱系图分析可知,当并类距离最小(为0)时,将样品分为6类是最科学合理的。

图1 31种热敏纸聚类分析结果

选用SPSS22.0统计分析软件中的判别分析模块,采用 Fisher’s 函数系数,选择 Box’s M 描述统计量,将检测数据作为自变量,用F检验的概率决定变量是否加入函数或被剔除,得到了判别函数特征值(见表3)和6 类样品在所建立的两个判别函数上的联合分布图(见图2)。

表3 判别式函数摘要

图2 31种热敏纸的联合分布图

本研究在分类过程中建立了4 个判别函数,其特征值如表3 所示。其中,判别函数1 和判别函数2 特征值的方差贡献率分别为93.7%和5.1%,累积方差贡献率分别为93.7%和98.7%,所携带的信息量远大于后面的判别函数。判别函数1 和判别函数2 的规范相关性系数分别为0.996和0.935,表明被分类的组别在判别函数1 和判别函数2 上差异显著。因此,选择判别函数1和判别函数2作为判别轴建立联合分布图。

由图2 可以看出,6 类样品重心区别明显,与判别函数2 的判别轴相比,判别函数1 的判别轴区分情况更加显著。通过判别分析建立预测模型,可以预测新纪录,即可以区分新数据的所属类别。用样品初始数据进行检验,正确率可达95.7%。

3 结 论

本研究基于X射线荧光光谱分析法,将无监督的系统聚类法与有监督的判别分析法相结合,对31 种热敏纸样品进行了多角度的分析,当并类距离最小(为0)时,可将样品分为6类;验证的同时进行了判别分析,总体预测正确率为95.7%。该方法快速、准确且无损,适用于法庭科学领域。但该方法在定量分析上仍有不足,后期将引入新的数据处理方法或验证算法,以提高模式识别的广度与深度。

猜你喜欢

判别函数纸张分析法
异步机传统分析法之困难及其克服
近期国内市场纸张价格(2020年3月)
近期国内市场纸张价格(2020年1月)
层次分析法在起重机械腐蚀评估中的应用
Fisher判别法在个人信用风险评估中的应用
游乐设施事故与危险量化判别函数的构建
纸张黑白变
探究上市公司财务预警的数学模型
撕纸张
层次分析法在生态系统健康评价指标体系中的应用