APP下载

判别分析结合系统聚类对易拉罐环的XRF检验

2020-08-17枭,王丹,姜红*,满

山东化工 2020年14期
关键词:判别函数易拉罐正确率

马 枭,王 丹,姜 红* ,满 吉

(1.中国人民公安大学,北京 100038;2.北京华仪宏盛技术有限公司,北京 100123)

易拉罐产品已在日常生活中十分常见,易拉罐环作为易拉罐的组成成分之一,也广泛分布于日常生活中。在案件现场常常能提取到犯罪嫌疑人丢弃的易拉罐环,通过对易拉罐环样本的检验分类,可为侦查破案提供线索,指明方向。但目前关于易拉罐的研究主要是在易拉罐的生产、工艺、原料方面,如陈强正等[1]从工艺条件方面分析了易拉罐环生产过程中划模缺陷的产生原因并提出了预防措施。叶凯[2]在易拉罐的三道成形工艺上做出一定的优化,使得生产所用铝板的厚度降低了0.02 mm。但目前缺少对易拉罐环理化检验方面的研究。

因此,本实验对易拉罐环样本进行XRF分析,借助主成分分析和判别分析等方法,构建了易拉罐环样本的判别模型,可将未知类别的易拉罐环样本分类至已知的类别中,为侦查破案提供帮助。

1 实验

本实验所用仪器为英国牛津仪器集团X-MET8000手持式XRF光谱仪,设置检测电压为40kV、电流为60mA。

本实验收集了不同品种的易拉罐环样本共28个(样品表略),利用无水乙醇对收集到的易拉罐环样本进行擦拭,自然风干后进行检测。将易拉罐环样本放置于检验仓内,关闭舱门后设置扫描时间为80 s开始测量,重复此操作直至完成对所有样本的测试。

2 讨论

2.1 元素含量分析

根据实验所得元素结果进行分析,易拉罐环样本中Fe、Mn、Cu、Zn、Ni这5种元素含量较多,添加Fe、Mn和Cu可提高合金强度[3],Zn和Ni的加入可使得其延展性和冲击性能得到提高[4]。因此本实验可根据5种元素含量的差异对不同品种的易拉罐环样本进行分类分析。

2.2 系统聚类

系统聚类作为一种广泛使用的分类分析方法,可根据样本数据之间的差异,提取出样本之间的相似性和差异性,并根据不同的聚类方法和测量区间将样本在不同层次上归为一类[5]。由于本实验所得样本数据信息较为复杂,若直接进行分析分类,可能出现由于主观因素引起的偏差。本着严谨的分析原则,选用系统聚类的方法对28个样本数据进行处理,绘制谱系图直观描述样本亲疏分类情况见图1。

由图1可知,28个易拉罐环样本被分为了5类,但第五类仅有24#一个样本,复核测量所得元素数据后发现24#样本Fe和Mn元素含量远远高于其余样本,因此被单独分为了一类。为了验证系统聚类是否准确有效,对经过系统聚类被分为第三类即6#、9#、12#、14#、19#、26#样本元素数据进行分析,6个样本具体元素含量情况见表1。

图1 28个易拉罐环样本系统聚类谱系图

由表1可知,第三类6个样本Fe、Mn和Cu元素含量较多并且元素含量跨度较为接近,6个样本Fe元素含量均在9500~12500区间内且分布较为均匀。通过观察发现第三类样本中Zn元素和Ni元素的含量较低,均未超过1000,部分样本该两种元素的含量为0。因此可分析得出该类样本Fe、Mn和Cu元素含量较多且Zn和Ni元素的含量较低,因此被归为了同一类。通过该方法可证实系统聚类分类效果较为良好,可在此基础上对样本数据进行进一步的分析。

表1 第三类样本元素含量

2.3 判别分析

根据前期系统聚类,已将28个样本分为5类。本实验的目的是为了通过已有的样本数据构建能够对未知类别样本进行已知类别分类识别的模型[1],而判别分析可在已知分类情况下,通过计算提取特征值对样本进行归属统计。因此进行判别分析模型的构建,将前期分类结果作为判别分析类别进行计算,判别函数摘要见表2。

表2 判别函数摘要

由判别函数摘要可知,根据样本类别信息与数据特征计算出3个判别函数。观察数据可知,前两个判别函数累积百分比已经达到了85%,表明其对样本特征有较强的解释能力[1],此外一般情况下提取特征值大于1的判别函数,但第三个判别函数特征值仅为0.413且贡献方差百分比仅为1.4%,因此只提取前两个判别函数,绘制判别分布图见图2。

图2 判别分布图

由图2可知,5类样本在判别函数构成的平面空间内分布均匀,可直观观察到各类样本之间的区别。并且经过交叉验证后分类正确率达到了82.1%、原始分类正确率为96.4%,证明利用28个易拉罐环样本所构建的判别分析模型不仅对已知类别样本分类效果良好,并且对经过交叉验证的可视为未知类别的样本也能很好地分类[8],实现了对易拉罐环样本分类的目的。

3 结论

本实验利用XRF将系统聚类与判别分析相结合,实现了对易拉罐环的成分检验与分类识别,最终交叉验证正确率为82.1%,原始分类正确率为96.4%,表明这一系列方法所构建的判别模型能对易拉罐环进行有效的分类识别。

猜你喜欢

判别函数易拉罐正确率
互相吸引的易拉罐
门诊分诊服务态度与正确率对护患关系的影响
游乐设施事故与危险量化判别函数的构建
探究上市公司财务预警的数学模型
生意
品管圈活动在提高介入手术安全核查正确率中的应用
生意
互相吸引的易拉罐
基于Fisher判别函数的酒店员工离职预警研究
易拉罐制做的帆船