近红外透射光谱结合判别分析方法在汽车制动液品牌与新旧鉴别中的应用研究
2016-07-12谈黎虹
张 瑜,谈黎虹,何 勇
1. 浙江经济职业技术学院,浙江 杭州 310018
2. 浙江大学生物系统工程与食品科学学院,浙江 杭州 310058
近红外透射光谱结合判别分析方法在汽车制动液品牌与新旧鉴别中的应用研究
张 瑜1, 2,谈黎虹1,何 勇2*
1. 浙江经济职业技术学院,浙江 杭州 310018
2. 浙江大学生物系统工程与食品科学学院,浙江 杭州 310058
采用近红外透射光谱研究了汽车制动液品牌及新旧的鉴别。采集宝马(BMW),丰田(Toyota),沃尔沃(Volvo)以及嘉实多(Castrol)四种品牌的汽车制动液全新样本以及用过的样本的透射光谱。分别对每一种品牌下全新与用过汽车制动液样本的光谱数据进行主成分分析(PCA),主成分得分图表明不同品牌制动液以及该品牌下全新样本以及用过的样本能够被较好的区分,其光谱特性存在差异。基于主成分载荷(Loadings)进行特征波数选择,偏最小二乘判别分析(PLS-DA),线性判别分析(LDA),簇类独立软模式法(SIMCA),k最邻近分类算法(KNN),随机森林(RF),误差反向传播人工神经网络(BPNN),径向基神经网络(RBFNN),极限学习机(ELM),支持向量机(SVM),最小二乘支持向量机(LS-SVM)等判别分析方法用于建立基于特征波数的判别分析模型,判别模型的建模集和预测集判别正确率均略低于或达到了100%。与其他三种品牌汽车制动液相比,嘉实多全新样本与用过样本的差异较小,KNN与LS-SVM模型的建模集正确率均低于100%。结果表明,近红外透射光谱结合特征波长选择以及判别分析模型对不同品牌制动液以及同一品牌下全新样本以及用过的样本进行识别是可行的,为开发在线或便携式仪器提供理论支持。
近红外透射光谱;制动液;新旧;品牌;判别分析
引 言
汽车制动液是汽车中不可缺少的部分,用于汽车液压制动系统中传递制动能量。汽车制动液的品质性能直接关系到汽车的行驶安全[1]。市场上存在不同厂商生产的不同品牌的制动液,质量参差不齐,部分制动液为与汽车厂商配套的制动液,可能存在不适用于其他品牌或型号车辆的问题。同时,由于长时间使用制动液,会吸水并氧化,从而对制动系统造成腐蚀,严重危害行车安全[2-3]。而不法商人则会以旧充新,以次充好,因此对汽车制动液品牌以及新旧的快速准确识别,具有重要的意义。
近红外光谱是一种快速无损的检测方法,样本准备简单,检测成本低,在很多领域具有广泛的使用[4-6],近红外光谱在汽车用油以及石油的各领域也具有广泛应用[7-8]。判别分析模型是近红外光谱研究中的重要组成部分。随着机器学习的发展,提出了很多的新的判别分析方法。有监督判别分析方法是近红外光谱分析中最常用判别分析方法,判别分析模型有线性判别分析模型和非线性判别分析模型。PLS-DA[9]以及LDA[10]就是最常用的线性判别分析模型,而BPNN[11],RBFNN[11],RF[12],SVM[13]与LS-SVM[14]也能解决线性与非线性判别分析问题,在部分文献中显示出了一定的优越性。近红外光谱结合判别分析方法,有助于实现定性的判别,但是由于方法原理与实现的不同,选择合适的判别分析方法有助于获得稳定的判别分析模型及其在硬件中的实现,为在线或便携式仪器开发提供理论支持。本研究的主要目的是采用近红外光谱结合特征波数选择与判别分析方法对不同品牌汽车制动液以及每一品牌下全新与用过的汽车制动液的识别。
1 实验部分
1.1 样本
实验所用汽车制动液分别来自市场上常用的四种汽车制动液品牌,即宝马(BMW),丰田(Toyota),沃尔沃(Volvo)以及嘉实多(Castrol)。分别对每个品牌的汽车制动液获取未使用过以及使用时间2年(行驶里程20 000 km)的样本各33个。从每一个样本中随机选取一定量的样本放入专用的样本瓶中,以用于光谱采集。
1.2 光谱数据采集
采用布鲁克多功能傅里叶变换近红外光谱仪(Bruker optics,Germany)(光谱范围12 000~4 000 cm-1)实现对汽车制动液光谱数据的采集,将样本瓶放入样本槽中测量其透射光谱。光谱采集由OPUS 6.5(Bruker optics,Germany)软件实现,光谱分辨率设定为8 cm-1,样本的光谱扫描次数设定为32次,以32次扫描结果的平均值为该样本的透射光谱。
1.3 数据处理
1.3.1 特征波数选择
光谱数据的数据量一般较大(光谱范围为10 522.28~4 443.225 cm-1),同时光谱数据中存在共线性问题和冗余性问题。为使建立的校正模型稳定,准确,选择通过选择包含有主要信息的少数波长进行建模,从而减少模型输入变量,降低模型的复杂度,减少共线性以及冗余性数据的影响。主成分分析(principal component analysis,PCA)用来进行特征波数选择。主成分分析的载荷表明了对应波长包含的有用信息的多少,一般以解释最多变量的前几个主成分下的载荷进行特征波长选择,根据载荷图选择峰与谷的地方为特征波长[15]。
1.3.2 判别分析方法
采用不同的判别分析方法分别建立判别分析模型。不同的判别分析方法原理不同,对数据的利用角度不同,从中选取判别效果最好的模型,为实现制动液品牌以及全新与用过的制动液的在线自动识别打下基础。
偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA)是有监督判别分析方法,基于偏最小回归算法过程,通过回归分析得到的预测值,设定阈值以确定样本的类别,一般判别阈值设定为0.5[9]。
线性判别分析(linear discriminant analysis,LDA)通过寻找不同类别特征变量之间的线性关系实现对样本的分类。LDA是一种有监督的判别分析算法[10]。
簇类独立软模式法(soft independent modeling of class analogy,SIMCA)是一种基于PCA的有监督分类方法。SIMCA首先通过对每一类样本进行主成分分析,确定每一类的主成分数,然后基于主成分光谱残差进行判别分析[16]。
k最邻近分类算法(k-nearest neighbor algorithm,KNN)是一种有监督的判别分析方法,通过计算样本与其他样本之间的距离,确定与该样本最邻近的k个样本的类别来判别该样本所属的类别[16]。
随机森林(random forest,RF)是一种利用多个决策树对数据进行判别分类与回归的算法。通过生成不同的决策树,然后对所有决策树结果进行分析,得到最终的判别分类与回归预测的结果[12]。
误差反向传播人工神经网络(back propagation neural network,BPNN)是应用非常广泛的人工神经网络之一,其通过误差反向传播修正网络权值,得到误差最小的输出[11]。径向基神经网络(radial basis function neural network,RBFNN)也是一种常用的人工神经网络,以RBF函数为激励函数。RBF神经网络以非线性变换将数据映射到隐含层空间,而隐含层与输出层之间的映射是线性的[11]。极限学习机(extreme learning machine,ELM)是神经网络的一种,是一种包含单隐含层的前馈神经网络(single-hidden layer feedforward neural network,SLFNN),ELM通过设定激励函数与隐含层节点数目就能实现对网络的训练,得到唯一最优解[17]。
支持向量机(support vector machine,SVM)是一种有监督的判别分析方法。SVM通过将样本数据映射到高维空间,在高维空间找到最大间隔超平面,使其与两类样本中最近数据点的距离均最大,从而实现线性分类[13]。作为SVM的扩展形式,最小二乘支持向量机(least-squares support vector machine,LS-SVM)通过求解线性方程代替SVM的求解二次规划问题,提高计算效率,降低计算复杂度[14]。
1.3.3 数据处理软件
PCA,PLS-DA,LDA均在Unscrambler软件(CAMO AS, Oslo, Norway)上操作实现,SIMCA,KNN,RF,BPNN,RBFNN,ELM,SVM以及LS-SVM等算法均在软件Matlab 2014b(The Math Works, Natick, USA)上操作实现。
2 结果与讨论
2.1 汽车制动液透射光谱特征
光谱仪以8 cm-1的光谱分辨率采集了样本在12 000~4 000 cm-1范围的透射光谱,考虑到仪器以及操作存在的噪声,首先将光谱曲线中首尾噪声明显的部分去除,以10 522.28~4 443.225 cm-1范围的光谱数据进行分析。采用7点移动平均平滑(moving average smoothing,MAS)对光谱数据进行预处理。由于BMW的一个样本在采集光谱时出现错误,因此BMW全新样本只有32个。图1所示为四种不同品牌汽车制动液平均光谱以及每个品牌下全新与用过的制动液的平均光谱。由图1(a)可知,4种不同品牌的制动液透射光谱存在一定的差异,其中BMW,Volvo与其他两种品牌制动液之间透射光谱差距较大,Toyota以及Castrol之间透射光谱差异较小。(b),(c),(d),(e)分别是BWM,Toyota,Volvo,Castrol品牌全新与用过样本的平均光谱曲线,可知全新的样本与用过的样本的透射光谱之间存在一定的差异。不同品牌全新样本与用过样本之间差异的趋势相似。
图1 不同品牌汽车制动液平均光谱(a)以及每一个品牌下全新样本与用过 样本的平均光谱:(b)BMW,(c)Toyota,(d)Volvo,(e)Castrol
2.2 主成分定性分析
对预处理后的建模集光谱数据,分别进行PCA计算,PCA采用全交互验证模式。一般情况下,少数前几个主成分就能解释绝大多数的变量。一般以前两个主成分(PC1与PC2)作出样本得分散点图,进行分析。图2(a)所示为四种不同品牌制动液的PCA得分分布图,可知PC1与PC2累计得分贡献率超过99%,PC1与PC2包含了研究对象的绝大部分有用信息。由图2(a)可知,BMW,Toyota以及Volvo的样本能很好的聚类在一起,而Castrol样本则较为分散,但是所有品牌的样本均能明显的区分出来。图2(b),(c),(d),(e)分别是BWM,Toyota,Castrol,Volvo品牌全新与用过样本的主成分得分散点图,发现PC1与PC2的累积贡献率均超过99%,且BMW,Toyota以及Volvo的全新的样本与使用过的样本,能够非常明显的被区分,Castrol的全新样本与使用过的样本能准确的区分,但是二者之间的差别没有其他品牌大。由PCA得分分布图可知,四种不同品牌的制动液以及其全新样本与用过样本之间的差异较明显。可以进行区分。
图2 不同品牌汽车制动液PCA得分散点图(a)以及每一个品牌下全新样本与用过样本的PCA得分散点图:(b)BMW,(c)Toyota,(d)Volvo,(e)Castrol
Fig.2 Scores scatter plot by PCA for different brands of brake fluids (a) and the new and used samples of each brand: (b)BMW,(c)Toyota,(d)Volvo,(e)Castrol
2.3 特征波数选择
采用PCA载荷进行特征波数选择,发现由于BMW,Toyota,以及Volvo全新样本与用过样本的主成分分析,PC1高于或接近99%,因此以PC1下的载荷(Loadings)进行特征波长选择。四种制动液品牌的PCA分析以及Castrol全新样本与用过样本则以PC1与PC2下的载荷进行特征波数选择,发现选择的特征波数有些较为相似,可能是因为本身制动液的成分有一定的相似性。
图3 不同品牌汽车制动液特征波数选择(a)以及每一个品牌下全新样本与用过 样本的特征波数选择:(b)BMW,(c)Toyota,(d)Volvo,(e)Castrol
2.4 判别分析模型的建立
PCA主成分分析结果可知,四种不同品牌的汽车制动液以及各品牌全新与用过样本之间具有较高的区分度,可以进一步建立判别分析模型,实现汽车制动液品牌以及各品牌全新与用过样本的快速无损识别。以PCA选出的特征波数为输入,分别建立了汽车制动液品牌以及各品牌全新与用过样本的PLS-DA,LDA,SIMCA,KNN,RF,BPNN,RBFNN,ELM,SVM以及LS-SVM等判别分析模型。对汽车制动液品牌BMW,Toyota,Castrol以及Volvo的类别分别赋值为1,2,3,4,而对于每一个品牌下全新与用过的样本分别赋值为1,2。判别分析模型的判别结果分别如表1与表2所示。
由表1可知,所有判别分析模型的效果均接近或达到100%,其中PLS-DA模型建模集判别正确率低于100%(96.6%)。基于不同原理的判别分析模型的判别效果均较好,表明尽管都是制动液,各制动液之间的光谱透射差异明显,即不同品牌的制动液的特性不同。表1结果表明,判别分析模型能有效的定性判别不同品牌的制动液。而所有模型均是基于特征波数建立的,表明特征波数的选择有助于减少数据输入,实现对汽车制动液品牌的识别,为在线的或便携式快速无损检测仪器开发提供理论支撑。在实际的应用中,应结合判别分析模型的效果和实现的难度,选择合适的判别分析模型。本研究中,经过特征波数选择,输入变量减少98%以上,所有模型的计算速度均较快,需要进一步研究探究最优的判别分析模型。
表1 基于特征波数的汽车制动液品牌判别分析模型结果
由表2可以发现,除了Castrol之外,其他三种品牌的汽车制动液不同判别分析模型下的判别正确率均为100,图2中PCA得分散点图中Castrol的差异也是最不明显。KNN模型和LS-SVM模型的建模集判别正确率均低于100%,且低于其他判别分析模型,表明其他模型更适用于Castrol全新与用过样本的判别分析。表2结果表明,基于特征波数的判别分析模型能用于不同品牌全新与用过汽车制动液的判别分析。
综合表1与表2结果可知,近红外光谱结合特征波数与判别分析方法能有效的实现对汽车制动液品牌的识别以及不同品牌全新与用过汽车制动液的识别,为汽车制动液的规范使用,保护消费者利益提供支持。同时为开发在线或便携式的汽车制动液品质检测仪器提供理论基础。
表2 基于特征波数的全新与用过的汽车制动液判别分析模型结果
3 结 论
采用布鲁克多功能傅里叶变换近红外光谱仪对BMW,Toyota,Volvo以及Castrol四种品牌的汽车制动液以及该品牌全新与用过的汽车制动液进行识别研究。针对获取的样本的透射光谱,经过PCA分析得到的得分分布散点图表明不同品牌的汽车制动液以及该品牌全新与用过的汽车制动液能够被较好的区分,而基于PCA载荷选择的特征波数建立的PLS-DA,LDA,SIMCA,KNN,RF,BPNN,RBFNN,ELM,SVM以及LS-SVM等模型均获得了较高的判别正确率,所有模型的建模集和预测集判别正确率均接近或达到100%。对汽车制动液品牌进行判别分析的PLS-DA模型,以及对Castrol全新与用过的制动液进行判别分析的KNN以及LS-SVM模型的判别效果略差,表明需要针对研究对象选择合适的判别分析模型。结果表明,采用近红外透射光谱结合特征波数选择以及判别分析模型可用于不同品牌汽车制动液以及该品牌全新与用过的汽车制动液的识别研究。在实际的应用中,应进一步研究以获取更稳定的特征波数以及更稳定的判别分析模型,以满足硬件和软件的实际需要,为在线或便携式仪器提供理论和实践支持。
[1] YE Shao-lin, LENG Guan-jun(叶少林, 冷观俊). Petroleum Products Application Research(石油商技), 2001, 19(3): 5.
[2] HOU Chang-chun(侯长春). China Science & Technology Panorama Magazine(中国科技纵横), 2014,(22): 237.
[3] WANG Xian-wen(王宪文). Auto Maintenance Magazine(汽车维修技师), 2011,(11): 111.
[4] Fagan C C, Everard C D, McDonnell K. Bioresource Technology, 2011, 102(8): 5200.
[5] Kong W, Zhao Y, Liu F, et al. Sensors, 2012, 12(8): 10871.
[6] Murkin J M, Arango M. British Journal of Anaesthesia, 2009, 103(suppl 1): i3.
[7] Jiang L, Liu F, He Y. Sensors, 2012, 12(3): 3498.
[8] Balabin R M, Safieva R Z, Lomakina E I. Analytica Chimica Acta, 2010, 671(1): 27.
[9] Canaza-Cayo A W, Cozzolino D, Alomar D, et al. Computers and Electronics in Agriculture, 2012, 88: 141.
[10] Gori A, Maggio R M, Cerretani L, et al. International Dairy Journal, 2012, 23(2): 115.
[11] Ni Y, Song R, Kokot S. Spectrochimica Acta Part A: Molecular and Biomolecular Spectroscopy, 2012, 96: 252.
[12] Pal M. International Journal of Remote Sensing, 2005, 26(1): 217.
[13] Devos O, Ruckebusch C, Durand A, et al. Chemometrics and Intelligent Laboratory Systems, 2009, 96(1): 27.
[14] Suykens J A K, Vandewalle J. Neural Processing Letters, 1999, 9(3): 293.
[15] Liu D, Ma J, Sun D W, et al. Food and Bioprocess Technology, 2014, 7(11): 3100.
[16] Balabin R M, Safieva R Z, Lomakina E I. Microchemical Journal, 2011, 98(1): 121.
[17] Huang G B, Zhu Q Y, Siew C K. Neurocomputing, 2006, 70(1): 489.
(Received Jun. 22, 2015; accepted Oct. 28, 2015)
*Corresponding author
Identification of Brake Fluid Brands, New and Used Brake Fluid with Discriminant Analysis Based on Near-Infrared Transmittance Spectroscopy
ZHANG Yu1, 2, TAN Li-hong1, HE Yong2*
1. Zhejiang Technical Institute of Economics, Hangzhou 310018, China
2. College of Biosystems Engineering and Food Science, Zhejiang University, Hangzhou 310058, China
Near-infrared transmittance spectroscopy was used to identify brake fluid brands, new and used brake fluid of each brand. The transmittance spectra of the new and used samples of 4 different brands of brake fluid, including BMW, Toyota, Volvo and Castrol were collected. PCA was conducted to the spectral data of the new samples of the four brake fluid and the spectral data of the new and used samples of each brand. The PCA scores scatter plot indicated that there were differences among the four brands of brake fluid, and there were also differences between new and used samples of each brand. Optimal wavelengths were selected for identifying different brands and new and used samples of each brand by loadings of PCA. Classification models were built using the optimal wavelength, including Partial least squares-discriminant analysis (PLS-DA), Linear discriminant analysis (LDA), Soft independent modeling of class analogy (SIMCA), k-nearest neighbor algorithm (KNN), Random forest (RF), Back propagation neural network (BPNN), Radial basis function neural network (RBFNN), Extreme learning machine (ELM), Support vector machine (SVM), Least-squares support vector machine (LS-SVM). All classification models obtained good performances, the classification accuracy of the calibration set and the prediction set are 100% for most models. Compared with other three brands, new and used samples of Castrol showed slighter difference, and KNN and LS-SVM models performed worse with classification accuracy under 100% in the calibration set. The overall results indicated that near-infrared transmittance combined with optimal wavenumber selection and classification methods could be used to identify brake fluid brands, new and used brake fluids, the results of this study could provide theoretical support for developing online and portable devices.
Near-infrared transmittance spectroscopy; Brake fluid; New and used; Brands; Discriminant analysis
2015-06-22,
2015-10-28
国家重大科学仪器设备开发专项项目(2014YQ470377)资助
张 瑜,女,1977年生,浙江经济职业技术学院副教授 e-mail: zy7739@126.com *通讯联系人 e-mail: yhe@zju.edu.cn
O657.3
A
10.3964/j.issn.1000-0593(2016)10-3179-06
猜你喜欢
杂志排行
光谱学与光谱分析的其它文章
- Gd靶激光等离子体光源离带辐射及其等离子体演化的研究
- Probing the Binding of Torasemide to Pepsin and Trypsin by Spectroscopic and Molecular Docking Methods
- Mn(Ⅱ)-5-Br-PADAP共沉淀-火焰原子吸收光谱法测定虾、贝样中的镉
- Near Infrared Spectroscopy Study on Nitrogen in Shortcut Nitrification and Denitrification Using Principal Component Analysis Combined with BP Neural Networks
- 内蒙古草原植被最大光能利用率取值优化研究
- 健康和糖尿病大鼠红细胞荧光光谱非线性程度差异