基于Power K-Means对橡胶轮胎的X射线荧光光谱分析
2020-07-27田师思齐恒慧王一端
田师思,姜 红*,齐恒慧,王一端,满 吉
(1.中国人民公安大学 侦查与刑事科学技术学院,北京 100038;2.中国人民大学 统计学院,北京 100044; 3.北京华仪宏盛技术有限公司,北京 100123)
橡胶物证的检验是理化物证的一项重要工作。在交通肇事案件中,橡胶颗粒与轮胎的同一认定往往能成为公安机关侦查破案的关键线索,因而探索橡胶轮胎与品牌的关联对于案件的侦破有着重要意义。根据对汽车轮胎成分的分析,其主要组成大致为生胶、硫化剂、填充补强剂、防护剂和其他一些添加剂。
目前,在司法鉴定领域,国内外常见的橡胶轮胎检验方法主要有红外光谱法[1]、热重分析法[2]、裂解气相色谱法[3]、拉曼光谱法[4]等。其中红外光谱法具有检验速度快、用量小的优势,应用最为广泛;热重分析法定量准确但操作复杂;裂解气相色谱法分析灵敏度高,但属于有损分析。X射线荧光光谱法目前应用于测定土壤[5]、塑料、橡胶[6]等,是一种快速便捷,操作简单且对样品无损的检验方法。
1 实验
1.1 实验仪器与样本
英国牛津公司生产的X-MET8000新型手持式X射线荧光光谱仪,滤光片为6位滤光转换器,IP54防护等级(NEMA3),电压45 kV,电流40 μA,测试时间80s。
实验样本:不同品牌的轮胎样本30个(见表1)。
表1 轮胎样本表
1.2 实验步骤
切下汽车橡胶轮胎样本,脱脂棉签蘸取乙醇后擦拭轮胎样本待其完全晾干后置于探测器和X射线管下,检测样本。如是重复,最终得到30个轮胎样本的各元素含量数据。
1.3 预实验最优时间
从30个样本中随机抽取1#样本进行预实验,以30 s为起始时间,120 s为最终时间,10 s为间隔,梯度时间依次对1#样本可测定元素含量进行记录。综合元素检出种类和检出元素含量两个数值的稳定程度,最终确定实验时间在80 s时为优。依此方法将各个实验样本在最优实验时间条件下依此测定元素含量,平行测定3次取平均值。
2 结果与分析
2.1 数据分析
面对30个轮胎样本,数十种不同品牌,结合五种主要元素含量,这样庞大的数据量单纯凭借某两种元素的比例或者某一种元素的有无进行朴素的分类难免有失科学性。故此本文希望借助数学工具以构建一种解决庞大样本量问题的模型。
2.1.1 Power K-Means聚类分析[7]
目前,K-Means算法被广泛应用于解决各种聚类分析的问题,但其过于依赖于初始值的正确确立与高维度下较差的表现力导致人们开始寻找更为有效的算法。本文选择了Jason Wu在2019年提出的Power K-Means聚类分析来寻求突破K-Means算法的限制。
首先根据SSE值的变化用手肘法[6]确定K的值,如图1可知,当SSE的值在K=2时出现拐点,即判定簇的数量应当为1。
图1 SSE与簇的数量关系图
2.1.2 聚类结果与分析
聚类结果如表2所示。
表2 30个橡胶轮胎样本的分组结果
2.1.3 验证Pearson系数[8]
Pearson系数用以评估两个变量之间的相关程度,为验证同一组内的变量相关程度,测定类别2中样本的组内Pearson系数。由表3可见,类别2的组内Pearson系数均在0.001水平上呈现显著相关。故而,本聚类分组效果较为理想。
表3 样本矩积相关系数结果
2.2 结果分析
利用R语言计算DBI和DI,借助这两个指标通过衡量组间相似度与组内相似度,达到对聚类效果进行评价的目的。DBI指标为1.029831,说明每个簇样本之间的平均值较小,即簇内样本距离都比较近;DI指数为0.115539,说明任意两个簇之间最近的距离的最小值较大,即簇间样本距离相互都比较远。故,此聚类算法的结果类内聚集程度高,类间离散程度大。
图2中,同样品牌的橡胶轮胎样本具有同样的阴影背景。由此可见在30个样本中,只有3#轮胎样本是CONTINENTAL轮胎,同样也只有8#和28#轮胎样本源自PIRELLI品牌。由3#样本独立一组,8#和29#样本被归为一组的分组结果可知,CONTINENTAL轮胎和PIRELLI轮胎分别具有较强的品牌关联性,即依据五种主要元素作为衡量维度可以有效的将该两种品牌的轮胎从众多品牌轮胎中区分出来。在第二组中,包含了所有DUNLOP和GOOD YEAR品牌的轮胎,表明这两种轮胎原材料的元素含量有很高的相似性,但该组中除这两种品牌的轮胎外仍有其他品牌的轮胎。第三组中,包含了大部分的HANKOOK品牌和其余品牌的轮胎。综上,在本实验中,CONTINENTAL和PIRELLI轮胎可以被独立区分,DUNLOP和GOOD YEAR这两种品牌可与其他品牌区分开来。同样,该结果也从侧面验证了分组结果的可靠性。
图2 11种品牌分布图
3 结论
本实验采用Power K-Means聚类分析结合X射线荧光光谱法对不同品牌的橡胶轮胎进行研究,将轮胎样本依据五种元素的含量不同进行分类,使用矩积相关系数和DBI、DB指数共同验证聚类效果。最终的分类结果中,只有1个样本与异品牌样本分为一类,分类效果理想。由此可知,通过X射线荧光光法测定橡胶轮胎中主要元素含量,再进行聚类分析可以作为部分品牌橡胶轮胎进行识别的依据。该方法避免了主观判断的干扰,更加客观、合理,是一种可行的分类模型,具有一定借鉴意义。日后若能扩大样本量,有望构建一种快速、高效鉴别橡胶轮胎的方法,为公安实际工作中解决汽车橡胶轮胎有关案件提供新思路。