三维荧光光谱结合Tchebichef矩快速鉴别掺伪芝麻油
2018-04-19崔耀耀吴希军刘婷婷苑媛媛
潘 钊, 崔耀耀,2, 吴希军* , 刘婷婷, 苑媛媛
(1. 燕山大学 测试计量技术及仪器河北省重点实验室, 河北 秦皇岛 066004;2. 燕山大学 信息科学与工程学院, 河北 秦皇岛 066004)
1 引 言
“民以食为天,食以安为先”,食品安全始终是人们关注的热点问题。植物油掺杂掺假现象普遍存在,严重损害了消费者的健康,然而由于植物油所含成分类似且比例相近,因此不易鉴别其真伪。
荧光光谱分析技术由于其灵敏度和准确度日益提高,是一种重要而有效的检测分析手段。三维荧光光谱具有灵敏度高、选择性好、信息含量丰富、不破坏物质结构等优点,是诸多专家学者在植物油检测研究中的热点选择[1-2]。荧光光谱的解析和特征信息的有效提取始终是荧光分析中的难点与关键问题。近期有研究者将数字图像处理技术中几何图像矩算法与光谱方法结合,用于对荧光物质的直接定量分析[3-6],这些方法无需预处理,直接提取目标分析物的重要特征,用于进一步的定性和定量分析,通过图像矩的多分辨能力解决诸如重叠峰、噪声和散射等干扰问题。
形状是最直观的图像信息的表现方式,几何矩中的Tchebichef矩对形状信息的描述没有冗余,并且没有传统几何矩中的坐标空间转化以及连续积分近似所带来的误差[7-8]。本文在没有任何数据预处理的前提下,直接应用Tchebichef矩提取荧光光谱数据的特征,结合聚类分析算法实现了掺伪芝麻油的鉴别并通过逐步回归建立了定量模型。实验结果表明Tchebichef矩能够有效地提取光谱的特征信息,验证了该方法用于定性和定量分析的可行性。
2 实 验
2.1 材料与仪器
从市场购得不同品牌、同品牌不同批次的芝麻油、玉米油、大豆油、菜籽油和芝麻香精,其中包括芝麻油样本14个(Z1~Z14),大豆油样本4个(D1~D4),玉米油样本7个(Y1~Y7),菜籽油样本1个(C1),芝麻香精样本2个(J1,J2);在实验室配置芝麻油掺伪样本:菜籽油和芝麻香精按不同体积比配置混合样本9个(JC1~JC9),样本分布见表1。
采用FS920荧光光谱仪(英国Edinburgh Instruments公司)测量各植物油样本的荧光光谱,激发波长范围设置为250∶10∶550 nm,发射波长范围设置为260∶2∶750 nm;激发和发射端狭缝宽度为1.11 mm,对应光谱分辨率为2 nm。
表1 植物油样本
2.2 荧光光谱数据采集
对表1中各样本进行荧光光谱扫描,得到相应的荧光光谱数据,样本JC5的三维荧光光谱图和等高线图如图1所示。荧光光谱中荧光强度记为n×m维的矩阵(n对应发射波长,m对应激发波长),将矩阵中的荧光强度值映射到[0, 255]灰度范围内,则荧光强度矩阵可以被视为“灰度图像”。如图2所示,该图像可以完全地表示三维荧光光谱中的强度。
图1 JC5的三维荧光光谱图(a)和等高线图(b)
图2 JC5的灰度图
2.3 数据处理
2.3.1 Tchebichef矩
对于大小N×N像素的图像,用f(x,y)表示图像坐标(x,y)处的灰度值,则该图像的p+q阶Tchebichef矩定义为:
p,q=0,1,…,N-1,
(1)
其中,tp,N(x)为n阶Tchebichef多项式,定义为:
tp,N(x)=
而ρ(n,N)是归一化系数,定义为:
(3)
Tchebichef矩是一种以离散的正交多项式为基函数的正交矩,因而在图像信息的表征上没有信息冗余[7-8]。考虑到矩的计算复杂度以及对图像描述能力的完整性,本文初步选择前11+11阶(p+q阶)Tchebichef矩(共121个矩特征)提取样本特征,用于对样本的定性和定量分析。
2.3.2 聚类分析
为最大化类间对象的异质性和类内对象的同质性,聚类分析把对象集合进行分组,使同一类中的个体之间相似性强于该个体与其他类对象的相似性[9-10],样品间的距离采用欧氏距离,利用类平均法计算聚类树形图。
设样品X1,X2,…,Xn为总体样本,记第i个样品Xi=(xi1,xi2,…,xip)(i=1,2,…,n),其中第i个样品Xi和第j个样品Xj之间的欧式距离定义为:
(4)
类与类之间的平均距离定义为样品对之间的平方距离的平均值。XK和XL之间的平方距离定义为:
(5)
2.3.3 逐步回归
从低阶到高阶的图像矩描述了图像的整体形状,其中包括目标化合物、噪声和不相关分量的完整信息[2]。建立线性模型时,如果把所有特征全部考虑进去,会引入噪声和不相关分量等无意义的矩特征,从而影响定量的精度。因此,为了建立一个最优的回归方程,本文选用逐步回归作为对矩特征的优选方法。逐步回归根据自变量(Tchebichef矩)对因变量(相对体积)的影响大小,将对因变量影响显著的自变量引入方程,并剔除影响不显著的自变量,最终得到最优回归方程。
3 结果与讨论
离散正交矩可以有效地提取不同层次上灰度图像的信息,不同阶的矩或其组合可以描述图像中不同的信息[6](如目标化合物、噪声、不相关分量等信息),因此选择特定阶的矩或其组合就可以实现对样本的定性和定量分析,并且可以去除重叠峰、噪声和散射等干扰问题。
3.1 Tchebichef矩结合聚类分析鉴别掺伪样本及其成分
鉴别样本是否为掺伪芝麻油,首先应观察样本是否和纯芝麻油属于一类。利用类平均法对纯芝麻油样本(Z1~Z15)、芝麻香精样本(J1、J2)与掺伪样本(JC1~JC9)进行聚类,得到如图3的聚类树形图,其中横坐标表示样本间的欧式距离,纵坐标表示样本。当选取前1+2阶Tchebichef矩作为样本的特征信息组合时,即可完全区分掺伪样本。由图3可知,在欧式距离L=1.68以上水平被分为2类,纯芝麻油样本(Z1~Z14)被分为一类,芝麻香精样本(J1、J2)与掺伪样本(JC1~JC9)被分为一类。通过以上分类结果可知,部分Tchebichef矩特征即可有效区分掺伪样本,且能确定掺伪样本中含有芝麻香精成分。
掺伪样本被正确区分之后,仍需对其所含的成分进行鉴别,以便对其进行定量分析。由大豆油样本(D1~D4)、玉米油样本(Y1~Y7)、菜籽油样本(C1)构造样本库。并把掺伪样本(JC1~JC9)与样本库进行聚类,选择1+2阶Tchebichef矩可得如图4所示的聚类树形图。由图4可知,在欧式距离L=2.13以上即可将菜籽油样本(C1)与掺伪样本(JC1~JC9)分为一类,而大豆油样本(D1~D4)和玉米油样本(Y1~Y7)在L=1.49以上也被完全区分,从而可知掺伪样本含有菜籽油。因此少数Tchebichef矩特征即可鉴别掺伪样本的成分。
图3 掺伪芝麻油样本聚类树形图
图4 掺伪芝麻油成分聚类树形图
Fig.4 Dendrogram of doping sesame oil’s ingredients
3.2 逐步回归线性模型
应用掺伪样本(JC1~JC9)、菜籽油样本(C1)、芝麻香精样本(J1)建立定量线性模型。对样本的121个Tchebichef矩特征向量{T1,1,T1,2,…,T11,11} 进行逐步回归,相关系数最高的项T9,9首先进入方程,其次T11,6和T5,10进入方程,当回归方程中有3个变量时,逐步回归方程线性相关度最高(R=0.999),剔除剩余变量,相应的回归方程如下,其中A是掺伪样本中一种目标化合物的相对体积,T的下标表示阶数(p,q):
(1)芝麻香精模型:
AJ=4.1159-18.681T5,10-58.76T9,9-113.24T11,6, RMSE:0.125,R: 0.999,R-Adj=0.999,F-Ktest value=2.34e+03,p-Kvalue=7.21e-11。
(2)菜籽油模型:
AC=5.8841+18.681T5,10+58.76T9,9+113.24T11,6, RMSE: 0.125,R: 0.999,R-Adj= 0.999,F-Ktest value=2.34e+03,p-Kvalue=7.21e-11。
其中对回归曲线检验的P值(p-Kvalue=7.21e-11)均小于0.05,说明相对体积A和Tchebichef矩的线性关系是显著的,模型拟合图如图5所示。
图5 逐步回归结果
4 结 论
本文利用图像处理技术中Tchebichef矩结合聚类分析和逐步回归建立了对掺伪芝麻油快速、准确的定量和定性分析方法。未作数据预处理,直接用Tchebichef矩提取三维光谱数据的特征,在此基础上通过聚类分析和逐步回归实现对掺伪芝麻油的鉴别,并准确解析其组成成分及含量。实验结果表明该方法能够有效提取光谱的特征,并能够得到良好的定性和定量结果,为质监部门及生产企业提供了新的油品鉴别手段。在此基础上,未来的研究会朝着增加样本数量以进一步完善光谱数据库的方向进行,并分析讨论该算法对不同油种之间的适用性,以进一步提高检测的效率和实用性。
参考文献:
[1] 吴希军, 潘钊, 赵彦鹏, 等. 荧光光谱及平行因子分析法在植物油鉴别中的应用 [J]. 光谱学与光谱分析, 2014, 34(8):2137-2142.
WU X J, PAN Z, ZHAO Y P,etal.. Application of fluorescence spectroscopy and parallel factor analysis in the identification of vegetable oils [J].Spectrosc.Spect.Anal., 2014, 34(8):2137-2142. (in Chinese)
[2] 吴希军, 田瑞玲, 孙梦菲, 等. 基于荧光光谱及矩阵分析的植物油鉴别技术 [J]. 光谱学与光谱分析, 2016, 36(7):2155-2161.
WU X J, TIAN R L, SUI M F,etal.. Identification technology of vegetable oil based on fluorescence spectroscopy and matrix analysis [J].Spectrosc.Spect.Anal., 2016, 36(7):2155-2161. (in Chinese)
[3] ZHAI H L, ZHAI Y Y, LI P Z,etal.. A simple approach to quantitative analysis using three-dimensional spectra based on selected Zernike moments [J].Analyst, 2012, 138(2):683-687.
[4] JING C, BAO Q L, HONG L Z,etal.. A practical application of wavelet moment method on the quantitative analysis of Shuanghuanglian, oral liquid based on three-dimensional fingerprint spectra [J].J.Chromat. A, 2014, 1352:55-61.
[5] CHEN J, LI B Q, XU M L,etal.. Krawtchouk image moment method for the simultaneous determination of three drugs in human plasma based on fluorescence three-dimensional spectra [J].Talanta, 2016, 161:99-104.
[6] LI B Q, CHEN J, XU M L,etal.. The determination of multi-components utilizing 1 H NMR three-dimensional spectra combined Tchebichef moments [J].Chemomet.Intell.Lab.Syst., 2016, 156:128-136.
[7] MUKUNDAN R, ONG S H, LEE P A. Image analysis by Tchebichef moments [J].IEEETrans.ImageProc., 2001, 10(9):1357-1364.
[8] 张辉, 周健, TOUMOULIN C, 等. Tchebichef矩的快速算法 [J]. 东南大学学报(自然科学版), 2006, 36(5):857-862.
ZHANG H, ZHOU J, TOUMOULIN C,etal.. Fast algorithm for Tchebichef moments [J].J.SoutheastUniv.(Nat.Sci.Ed.), 2006, 36(5):857-862. (in Chinese)
[9] 梁曼, 黄富荣, 何学佳, 等. 荧光光谱成像技术结合聚类分析及主成分分析的藻类鉴别研究 [J]. 光谱学与光谱分析, 2014, 34(8):2132-2136.
LIANG M, HUANG F R, HE X J,etal.. Identification of algae by fluorescence spectroscopy combined with cluster analysis and principal component analysis [J].Spectrosc.Spect.Anal., 2014, 34(8):2132-2136. (in Chinese)
[10] 刘丙新, 李颖, 韩亮, 等. 基于光谱反射率数据的水面油种鉴别研究 [J]. 光谱学与光谱分析, 2016, 36(4):1100-1103.
LIU BI X, LI Y, HAN L,etal.. Identification of surface oil based on spectral reflectance data [J].Spectrosc.Spect.Anal., 2016, 36(4):1100-1103. (in Chinese)
潘钊(1982-),男,河北石家庄人,博士,副教授,2012年于燕山大学获得博士学位,主要从事荧光检测技术、光电检测技术和光谱分析方面的研究。
E-mail: panzh_zach@hotmail.com吴希军(1979-),男,河北邯郸人,博士,副教授,2010年于燕山大学获得博士学位,主要从事光纤传感与光谱测试系统设计等方面的研究。
E-mail: wuxijun@ysu.edu.cn