APP下载

基于多元建模的皮鞋鞋底的 X 射线荧光光谱分类识别研究

2022-05-13田陆川张馨艺姜红王丹满吉

皮革科学与工程 2022年3期
关键词:鞋底皮鞋聚类

田陆川 ,张馨艺 ,姜红 *,王丹 ,满吉

(1.中国人民公安大学 侦查学院,北京 100038;2.南宁师范大学,应用化学系,广西 南宁 530100;3.北京华仪宏盛技术有限公司,北京 100123)

引言

皮鞋是全世界最畅销的鞋类之一,在宴会、工作需着正装的场合下都要求着皮鞋,由于其具有独特的社交属性,故在人群 中的普及率极高,在各 类案件现场中都可以提取到皮鞋鞋底物证[1]。皮鞋按照制作原料可以分为天然皮鞋或人造革皮鞋[2],随着高分子材料 的 不 断 革 新 ,聚 氨酯 (PU)、顺丁 橡 胶(BR)、热塑性橡胶(TPR)、EVA、聚氯乙烯(PVC)等[3]逐步成为皮鞋鞋底的主要材料,其中 PU 底因弹性好,舒适轻便等原因价格最高,TPR 底较沉重,耐磨性差等原因价格相对较低。厂家还会在鞋底中加入补强剂、填充剂、发泡剂等填料改善皮鞋性能,以改善皮鞋鞋底的强度、弹性、耐磨度等因素。不同来源的皮鞋鞋底材料及填料的成分不尽相同,其各组分的配比及含量也会有所差异,这些差异为区分检验皮鞋鞋底样品提供了依据。

检验皮鞋鞋底的方法有气相色谱 - 质谱法[4]、扫描电镜能谱法、傅里叶变换拉曼光谱法[5-7]、差分拉曼光谱法[8-9]等。相较上述方法,X 射线荧光光谱法操作简单,检出结果快,可以直接得出样品所含元素种类及含量,是微量物证及痕迹检验的常用工具之一。

以往的鞋底研究都是对所收集的 样 本 进 行了分类,无法实现对实际办案中提取到的新样本的分类归属进行预测。为探讨哪种分类预测模型最适合皮鞋样本,本文采用 Fisher 判别分析、RBF 神经网络、MLP 神经网络建立了基于系统聚类结果的分类预测模 型,最终 Fisher 判别分析的分 类 准 确 率为74.5%,径向基函数神经网络的准确率为 80%,多层感知器的准确率为 94.4%,比较认为多层感知器神经网络的分类预测效果最好,可以对样品归 属的倾向性认定做出贡献。

1 实验部分

1.1 实验仪器及条件

X-MET8000 Expert 型 X 射线荧光光谱仪(英国牛津公司),检测元素范围:12 Mg~92 U,铑(Rh)阳极靶,测试电压:50 kV,电流设置:200 μA,测试时间:60 s,工作温度:-25 ~50 ℃,工作模式:plastic。其仪器实验工作原理如图 1 所示。

图1 X-MET8000 Expert 型 X 射线荧光光谱仪的工作原理Fig.1 Working principle of X-MET8000 Expert X-ray fluorescence spectrometer

1.2 实验样品

主要成分为聚氨酯(PU)、顺丁橡胶(BR)、热 塑性橡 胶 (TPR)、EVA、聚 氯 乙 烯 (PVC) 的 不 同 品 牌 ,不 同来源的皮鞋鞋底样品 55 个,样品表略。

1.3 测试时间的选择

为选取最佳测试时间,随机选择 3# 样品,在其他实验条件相同的情况下,对准同一位置测量 7次,测试时间为 60、70、80、90、100、110、120 s,每个测量时间进行 3 次平行测试。随机选择 3# 样品在不同测试时间的条件下测量 3 次。

本实验中的峰值是测试数据累加得出的[10],测试时间越长,取样点越多,实验效果越好。当取样点足够多时,实验结果趋于稳定。在 60 ~120 s 范围内,时间长短对样品测试的测试结果影响较小[11-12],说明 60 s 的测试时间有足够的取样点,已经可以较好的得出样品元素含量。综合实验效率与结果准确度,本实验测试时间选择 60 s。

2 分析与讨论

2.1 样品的 X 射线荧光光谱分析

将样品用酒精擦拭后用 X 射线荧光光谱仪进行检测,共检测出 14 种元素,选择其中检出率较高的七种元素进行分析。其中 Cl 元素来自于聚氯乙烯(PVC);Ca 来自于 CaCO3,其多用于改善鞋底的力学性能,抗热耐腐蚀等;Ti、Fe、Zn、Sr、Sn等可能来自各种塑料助剂,样品间的元素种类、含量等都不尽相同,这些差异为区分样品提供了依据[13]。

2.2 多元统计学分析

2.2.1 系统聚类

系统聚类是一种常用的无监督式分类方法[14],其广泛应用于医学社科等领域。系统聚类也称作凝聚性层次聚类[15],其主要思想是将每个个案视为独立的一类,根据类与类间的相似程度不断合并,直到所有个案被归为一类。类与类间的距离定义不同,也就有不同的聚类方法。本文测量方式采用ward 法,欧氏距离作为测量区间进行系统聚类,其结果如图 2 所示。当并类距离为 1 时,样品被分为 55 类;并类距离为 2 时,样品被 分 为 8 类;并类距离为 5 时,样品被分为 4 类;并类距离为 25时,凝聚停止,所有样品被归为一类。为验证系统聚类分类结果 的 准 确 性,采用集 中 计 划 碎石图(见图 3)进行分析,由图 3 可以发现,当聚类阶段在 47 时,曲线骤升,故可以确定合理的分类数目为 55-47=8。

图2 系统聚类结果谱系图Fig.2 Pedigree of systematic clustering results

图3 集中计划碎石图Fig.3 The gravel map drawn by the centralized plan

2.2.2 判别分析

判别分析是基于已知分类个体的观测指标建立一个或多个判别准则以判别未知个体分类归属的统计分析方法[16]。判别分析的主要方法是先建立起一个或多个判别函数,然后通过已知分类归属的个体的某些指标确定该函数的待定系数。对于未知分类的个体只需将其带入到判别函数中便可进行分类。

常用的判别分析方法有距离判别法、费切尔判别法[17]、贝叶斯判别法[18]等。其中费切尔判别法是利用投影将高维问题简化到一维进行处理,计算样本与类中心的距离作为分类依据。本文采用费希尔判别法,以系统聚类结果作 为分组变量,元素作为变量分析,分析结果如图 4 所示。

图4 样品的联合分布图Fig.4 Joint distribution diagram of samples

由样品联合分布图可以发现,第 1、3、4、5 组的组质心重叠严重,经交叉验证,分类模型准确率只有 74.5%,对样品分类归属预测能力较差,故尝试使用人工神经网络进一步分析。

2.2.3 径向基函数神经网络(RBF)

径向基函数神经网络是一 种 单 隐 层的前反馈神经网络,其主要思想是将低维数据变换到高维空间中,使原本不可分的数据在高维空间中可分[19-20]。目前常用的径向基函数是高斯核函数,其对应的公式如下:

其 中 ,xc 为 中心 点 坐 标 ,x 为 待 分 类 的 坐 标 ,||x-xc||为欧几里得距离,σ 为可调平滑程度参数。相较于其他神经网络,RBF 神经网络的收敛速度更快,结构简单,线性拟合能力极强[21],将样本数据按照 8∶2 的比例随机分配训练集与测试集,将标准化处理后的元素含量作为输入层的 7 个单元,分类结果作为输出层的 8 个单元,自动设置隐藏层建立径向基函数神经网络,其对应的结构图如图 5,得到的分析结果如表 1。

图5 神经网络结构示意图Fig.5 Structure diagram of RBF

由表 1 可知,径向基函数神经网络的分类准确率为 80%,相较判别分析的准确率有所提高,该模型对第 1、2、3、4 组的区分能力不足,故尝试多层感知器神经网络继续分析。

表1 RBF 模型训练结果Tab.1 RBF model training results

2.2.4 多层感知器神经网络(MLP)

多层感知器又叫深度前馈网络,相较于 RBF 神经 网 络,多 层感 知 器 可 以 有 多 个 隐 层 ,对 于 输 出 层的神经元也没有数量限制,其通过数个特征值的链接进行线性或非线性的组合,最终实现样本数据的判别分类等目的[22]。本次实验选择双曲正切函数作为函数隐藏层的激活函数,设置最大隐藏层单元数50,初始 Lambda 值为 5×10-7,初始 Sigma 值为 5×10-4,区间偏移量为±0.5,其对应的结构图如图 6,分析结果见表 2。

图6 神经网络结构示意图Fig.6 Structure diagram of MLP

由表 2 可知,多层感知器神经网络的分类准确率为 94.4%,相较 Fisher 判别分析和径向基函数神经网络可以更好的对样品分类进行预测。其自变量重要性结果见图 7。

图7 自变量重要性图Fig.7 Importanceofindependentvariables

表2 MLP 模型训练结果Tab2 MLP model training results

3 结论

利用 X 射线荧光光谱法对 55 个皮鞋鞋底进行了检验研究,提取了 6 个常量元素,并以此为变量进行了系统聚类,最终 55 个样品被分为 8 类。本实验分析发现,MLP 神经网络相较于 Fisher 判别分析和 RBF 神经网络的分类结果更加准确可靠,预测准确率为 94.4%,实验效果最好,同时依据自变量正态化重要性得出了 Zn、Ca、Cl 3 种元素对模型影响较大的特征元素。未来可以通过搜集大量皮鞋鞋底建立数据库反复训练该模型,从而使模型的准确率和适用性进一步提高,为分类做出更加科学合理的判断,以缩小侦查范围,提高侦查效率。

猜你喜欢

鞋底皮鞋聚类
基于数据降维与聚类的车联网数据分析应用
画与理
基于模糊聚类和支持向量回归的成绩预测
“鞋底垫厚点,也能走得快”——贫困户崔普选和他的“梦中梦”
两只皮鞋
基于密度的自适应搜索增量聚类法
鞋底防滑
擦皮鞋的意外收获
擦谁的皮鞋