近红外光谱技术结合变量选择方法定性检测食用植物油中的腐霉利
2016-06-05莫欣欣李晓珍吴宜青刘木华
孙 通、莫欣欣、李晓珍、吴宜青、刘木华
江西农业大学、生物光电技术及应用重点实验室、江西 南昌 330045
近红外光谱技术结合变量选择方法定性检测食用植物油中的腐霉利
孙 通、莫欣欣、李晓珍、吴宜青、刘木华*
江西农业大学、生物光电技术及应用重点实验室、江西 南昌 330045
利用近红外光谱技术对食用植物油中的腐霉利进行定性检测研究。以国家标准规定的腐霉利最大残留限量为界线、将不同腐霉利含量的食用植物油样本分为合格组和不合格组。采用QualitySpec台式近红外光谱仪采集两类样本的光谱、利用无信息变量消除 (UVE)和子窗口重排分析(SPA)方法进行波长变量筛选、并应用线性判别分析(LDA)、偏最小二乘-线性判别分析(PLS-LDA)及判别偏最小二乘(DPLS)方法建立两类样本的分类模型。结果表明、近红外光谱技术可以对两类样本进行分类。UVE方法可以有效筛选有用波长变量、提高分类模型的性能。UVE-DPLS所建立的分类模型性能最优、其预测集样本的分类正确率、灵敏度及特异性分别为98.7%、95.0%和100.0%。
近红外; 腐霉利; 定性检测; 变量选择; 食用植物油
引 言
腐霉利、又称速克灵、为新型低毒杀菌剂、主要用于蔬菜及果树的灰霉病防治。因此、蔬菜、水果及相关加工产物中会含有腐霉利农药残留。对于腐霉利、国家标准GB 2763—2014规定其在食用植物油中的最大残留限量为0.5 mg·kg-1。食用植物油是人们生活的必需品、消费量正在逐年增加、若食用植物油中的腐霉利农药残留超标将危害人们的身体健康、且危害影响范围广。因此、有必要对食用植物油中的腐霉利农药残留进行检测。
近红外光谱技术具有非破坏性、快速、绿色及操作简单等特点、已应用于茶叶品种[1]、酒真伪[2]、牛奶掺假[3]、水果糖度[4]、谷物淀粉[5]及肉类蛋白质[6]等定性及定量检测。对于农药残留检测、国内外研究人员应用近红外光谱技术已进行了一些研究工作。熊艳梅等[7]对农药制剂中的氰戊菊酯和马拉硫磷含量进行检测、模型的相关系数为0.998、外部验证集标准差为0.082%。陈蕊等利用可见/近红外光谱技术对蔬菜表面的四种农药种类进行识别、四种农药(氯氰菊酯、敌敌畏、辛硫磷、氧化乐果)的识别正确率分别为90.0%、87.5%、82.5%及92.5%。Zhang等[8]对近红外光谱鉴别果汁中的咪鲜胺残留的可行性进行探讨。Salguero-Chaparro等[9]对橄榄中的敌草隆残留进行定性检测、其分类正确率为85.9%。Jamshidia等[10]对黄瓜中的二嗪农残留进行定性检测、预测集样本的分类正确率为92.3%。此外、还有其他研究人员也对农药残留检测进行研究[11-17]。但食用植物油中腐霉利的近红外检测尚未有相关报道。
本研究根据食用植物油中的腐霉利浓度将样本分为合格组和不合格组、并利用近红外光谱技术进行定性检测研究、采用无信息变量消除(UVE)和子窗口重排分析(SPA)方法对波长变量进行筛选、并应用多种判别分析方法建立两类样本的分类模型。
1 实验部分
1.1 材料及仪器
试验所用的食用植物油样本共有12个、分别为4个大豆油、4个菜籽油及4个花生油、且同一品种的样本均由不同品牌的厂家生产。试验样本由南昌天虹、百盛等正规大型超市购买。原始食用植物油样本均由国家标准方法检测其腐霉利含量、结果为未检出。腐霉利标准品纯度高于99.9%、丙酮为分析纯。
试验光谱仪器为QualitySpec台式近红外光谱仪 (ASD、美国)、配备相应的光谱采集软件、光纤及光源 (型号为High Intensity Contact Probe)。石英比色皿光程为4 mm、电子天平精度为0.000 1 g。
1.2 方法
1.2.1 样本配制
采用电子天平称取一定质量的腐霉利标准品、溶解于丙酮、然后加入某一食用植物油样本中、以获取不同腐霉利浓度的食用植物油样本。样本的腐霉利浓度分别为0.1、0.2、0.3、0.4、1、2、4、7、10、20、30、50、100、200、300、500及1 000 mg·kg-1。对于12个食用植物油样本、均配制上述浓度、共获得216个不同腐霉利浓度的样本。
将12个原始样本及216个配制样本按照国家标准规定的腐霉利最大残留限量(0.5 mg·kg-1)为界线分成两组。低于最大残留限量的样本为合格组样本、共有60个、定义类别值为1; 高于最大残留限量的样本为不合格组样本、共有168个、定义类别值为-1。将合格组及不合格组样本按照2∶1比例随机分配到校正集和预测集、校正集样本共有152个 (40个合格组样本、112个不合格组样本)、用于建立分类模型; 预测集样本76个 (20个合格组样本、56个不合格组样本)、用于验证分类模型性能。
1.2.2 光谱采集
将样本置于4 mm光程的比色皿中、并采用QualitySpec光谱仪以全透射方式获取样本的光谱。光谱采集时间和扫描次数分别为68 ms和50次、光谱参比为空比色皿。
1.2.3 数据处理与分析
采用主成分分析(PCA)方法提取样本光谱的前10个主成分、并初步判断两类样本的可分性。
利用UVE和SPA两种方法对样本光谱数据进行波长变量筛选、获取对分类模型有用的信息变量。然后、应用线性判别分析 (LDA)、偏最小二乘-线性判别分析(PLS-LDA)及判别偏最小二乘(DPLS)方法建立两类样本的分类模型、并利用预测集样本对分类模型性能进行验证、并与未经波长变量筛选的分类模型进行比较。UVE和SPA方法的具体原理详见文献[18-20]。
对于UVE分析、蒙特卡罗(MC)抽样次数及抽样比率分别为1 000和0.8、提取的最大主成分数设为20。对于SPA分析、MC抽样次数及抽样比率与UVE方法相同、变量抽取数为20。UVE、SPA及PLS-LDA方法在Matlab R2014a软件(The Math Works、美国)中运行完成、LDA及DPLS方法在Unscrambler X 10.1软件(CAMO、挪威) 中运行完成。
所建立的分类模型性能由分类正确率、灵敏度及特异性三个指标进行评价。灵敏度定义为合格组样本被正确分类的比率、特异性定义为不合格组样本被正确分类的比率。
2 结果与讨论
2.1 主成分分析
图1为所有合格组及不合格组样本的可见/近红外光谱。由图1可知、样本光谱在750~1 800 nm波段范围内基本重合、肉眼难以分辨差别; 而在350~750 nm波段范围内存在较大差异、该差异主要是由样本之间的颜色深浅引起。在350~550 nm波段范围、部分样本的吸光度值远大于其他样本、此类样本为颜色较深的菜籽油及其配制样本。因此、为排除样本颜色对分类模型的干扰、将可见光波段去除。此外、光谱仪器末端噪声大、去除1 781~1 800 nm波段范围。最后、后续的数据分析将在780~1 780 nm波段范围内进行、该波段范围内共含有1 001个波长变量。
图1 所有样本的可见/近红外光谱
应用PCA方法在780~1 780 nm波段范围内提取样本的前10个主成分。10个主成分的累积贡献率为99.934%、前三个主成分的贡献率分别为66.718%、26.043%及5.503%。图2为样本光谱的前三个主成分的得分图。由图2可知、部分合格组与不合格组样本发生重叠、不能被有效分开。因此、需要更加有效的方法对两类样本进行分类。
图2 样本光谱前3个主成分得分分布
2.2 变量选择分析
2.2.1 UVE
利用UVE方法对样本光谱的波长变量进行筛选。按照变量的稳定性结果对波长变量的重要性进行排序、稳定性值越大则表明波长变量越重要。然后、将波长变量按其稳定性值从大到小依次加入分类模型并进行交互验证建模、最后根据交互验证正确率最大原则确定最优的波长变量组合。
图3为UVE分析的波长变量稳定性结果。由图3可知、变量稳定性值大于5的波长变量有8个、处于4~5、3~4及2~3之间的波长变量分别有27个、94个和192个、而小于2的波长变量有680个。根据交互验证正确率最大原则、最终确定共有129个波长变量被选择。图4为129个被选择的波长变量的分布情况。由图4可知、对于129个被选择的波长变量、其在780~1 000、1 001~1 500及1 501~1 780 nm波段范围内的分布数量分别为39个、64个及26个。
图3 UVE分析的波长变量稳定性结果
图4 经UVE方法选择的波长变量分布
2.2.2 SPA
利用SPA方法对样本光谱的波长变量进行筛选。根据波长变量的条件协同得分 (COSS)结果对波长变量重要性进行排序、COSS值越大则波长变量越重要。然后、将波长变量按其COSS值递减顺序依次加入分类模型并进行交互验证建模、最后根据交互验证正确率最大原则确定最优的波长变量组合。
图5为SPA分析的波长变量COSS结果。由图5可知、COSS值大于9的波长变量有15个、处于8~9、7~8及6~7之间的波长变量分别有42个、91个和156个、而小于6的波长变量有697个。根据交互验证正确率最大原则、最终共有56个波长变量被选择。图6为SPA方法选择的波长变量的分布情况。由图6可知、对于56个被选择的波长变量、其在780~1 000、1 001~1 500及1 501~1 780 nm波段范围内的分布数量分别为9个、30个及17个。
图5 SPA分析中波长变量的COSS值结果
图6 经SPA方法选择的波长变量分布
2.3 分类模型建立及预测
根据UVE和SPA方法的波长变量筛选结果、采用LDA、PLS-LDA及DPLS方法建立分类模型、然后对预测集样本进行预测、并与未经变量筛选的分类模型进行比较。
表1为不同方法的分类模型的预测结果。由表1可知、经UVE变量筛选后、LDA、PLS-LDA及DPLS方法所建立的分类模型性能均优于相应的未经变量筛选的分类模型、且建模所用的波长变量数减少了87.1%。经SPA变量筛选后、LDA方法所建立的分类模型性能优于未经变量筛选的分类模型、而PLS-LDA及DPLS方法所建立的分类模型性能则比相应的未经变量筛选的分类模型略差、但建模所用的波长变量数减少了94.4%。由此可见、UVE及SPA方法均为有效的变量选择方法、且UVE方法优于SPA方法。此外、对比LDA、PLS-LDA及DPLS方法、发现DPLS、UVE-DPLS及SPA-DPLS所建立的分类模型性能均优于相应的其他方法所建立的分类模型。上述分类模型中、UVE-DPLS所建立的分类模型性能最优、其预测集的分类正确率、灵敏度及特异性分别为98.7%、95.0%和100.0%。图7为UVE-DPLS所建立的分类模型对预测集样本的预测结果。由图7可知、仅有1个不合格组样本被误判为合格组样本。
表1 不同方法建立的分类模型的预测结果
Notes: A: LDA; B: PLS-LDA; C: DPLS
图7 UVE-DPLS分类模型对预测样本的预测结果
3 结 论
利用近红外光谱技术结合变量选择方法对食用植物油中的腐霉利进行定性检测研究。结果表明、近红外光谱技术可以对两类样本 (不同腐霉利浓度的食用植物油)进行分类。UVE方法可以有效筛选有用波长变量、提高分类模型的性能。UVE-DPLS所建立的分类模型性能最优、其预测集样本的分类正确率、灵敏度及特异性分别为98.7%、95.0%和100.0%。
[1] Cai J X,Wang Y F,Xi X G,et al. International Journal of Biological Macromolecules,2015,78: 439.
[2] Chen H,Tan C,Wu T,et al. Spectrochimica Acta Part A-Molecular and Biomolecular Spectroscopy,2014,130(17): 245.
[3] Zhang L,Zhang X,Ni L,et al. Food Chemistry,2014,145(4): 342.
[4] Sun T,Lin H,Xu H,et al. Postharvest Biology and Technology,2009,51(1): 86.
[5] Li J H,Danao M G C,Chen S F,et al. Journal of Near Infrared Spectroscopy,2015,23(2): 85.
[6] Huang L,Zhao J W,Zhang Y H,et al. Analytical Methods,2012,4(11): 3816.
[7] XIONG Yan-mei,TANG Guo,DUAN Jia,et al(熊艳梅,唐 果,段 佳,等). Chinese Journal of Analytical Chemistry(分析化学),2012,40(9): 1434.
[8] Zhang Y,Xiang B,Dong Y,et al. Analytical Letters,2013,46(17): 2739.
[9] Salguero-Chaparro L,Gaitán-Jurado A J,Ortiz-Somovilla V,et al. Food Control,2013,30(2): 504.
[10] Jamshidia B,Mohajerani E,Jamshidi J,et al. Food Additives & Contaminants: Part A,2015,32(6): 857.
[11] CHEN Jing-jing,LI Yong-yu,WANG Wei,et al(陈菁菁,李永玉,王 伟,等). Transactions of the Chinese Society for Agricultural Machinery(农业机械学报),2010,41(10): 134.
[12] Nerea A,Silvia A,Carmen J. Pest Management Science,2013,69(4): 471.
[13] Sánchez M T,Flores-Rojas K,Guerrero J E,et al. Pest Management Science,2010,66(6): 580.
[14] DAI Fen,ZHANG Kun,HONG Tian-sheng,et al(代 芬,张 昆,洪添胜,等). Journal of Agricultural Mechanization Research(农机化研究),2010,10: 111.
[15] Zhou Y,Xiang B,Wang Z,et al. Analytical Letters,2009,42(10): 1518.
[16] SUO Shao-zeng,LIU Cui-ling,WU Jing-zhu,et al(索少增,刘翠玲,吴静珠,等). Transducer and Microsystem Technologies(传感器与微系统),2012,31(10): 136.
[17] YUAN Wen-bo,XIANG Bing-ren,ZHAO Lu-hua,et al(袁文博,相秉仁,赵陆华,等). Journal of China Pharmaceutical University(中国药科大学学报),2012,43(2): 164.
[18] Centner V,Massart D L,Denoord O E,et al. Analytical Chemistry,1996,68(21): 3851.
[19] Li H D,Zeng M M,Tan B B,et al. Metabolomics,2010,6(3): 353.
[20] Li H D,Liang Y Z,Xu Q S,et al. Journal of Chemometrics,2010,24(7-8): 418.
*Corresponding author
Qualitative Detection of Procymidone in Edible Vegetable Oils by Near Infrared Spectroscopy and Variable Selection Methods
SUN Tong,MO Xin-xin,LI Xiao-zhen,WU Yi-qing,LIU Mu-hua*
Optics-Electronics Application of Biomaterials Lab、Jiangxi Agricultural University、Nanchang 330045、China
In this research,near infrared (NIR) spectroscopy was used to detect procymidone in edible vegetable oils qualitatively. Edible vegetable oil samples with different procymidone contents were classified to two groups according to boundary line of maximum residue limit of procymidone in national standard. QualitySpec spectrometer was used to acquire spectra of two group samples,then uninformative variable elimination (UVE) and subwindow permutation analysis (SPA) were used to select informative wavelength variables. At last,several methods such as linear discriminant analysis (LDA),partial least squares-linear discriminant analysis (PLS-LDA) and discriminant partial least squares (DPLS) were used to develop classification models. The results indicate that NIR spectroscopy is feasible to classify the two group samples. UVE method can select informative wavelength variables effectively,and improve the performance of classification model. The best model is developed by UVE-DPLS method,the classification correct rate,sensitivity and specificity of prediction samples in this model are 98.7%,95.0% and 100.0%,respectively.
Near infrared; Procymidone; Qualitative detection; Variable selection; Edible vegetable oil
Oct. 23,2015; accepted Feb. 15,2016)
2015-10-23、
2016-02-15
国家自然科学基金项目(31271612)、江西省自然科学基金项目(20151BAB204025)、江苏省农产品物理加工重点实验室开放基金项目(JAPP2013-6)资助
孙 通、1983年生、江西农业大学讲师 e-mail:suntong980@163.com *通讯联系人 e-mail:suikelmh@sohu.com
TS207.3
A
10.3964/j.issn.1000-0593(2016)12-3915-05