APP下载

中红外光谱结合模式识别法快速检测稻米镉含量

2014-09-24朱向荣李高阳

湖南农业科学 2014年7期
关键词:稻米导数预处理

朱向荣,李高阳,单 杨

(1.湖南省食品测试分析中心,湖南 长沙410125;2.中南大学研究生院隆平分院,湖南 长沙410125)

水稻是我国最重要的粮食作物,稻米品质的优劣直接影响人们的健康水平。镉(cadm ium,Cd)是自然界中广泛存在的重金属元素,对人体具有较强的毒性。近年来,随着我国有色金属冶炼、采矿业与制造业的快速发展,化肥等农用化学品的大量使用,农田土壤重金属污染尤其是镉污染日趋严重[1]。水稻被认为是镉吸收最强的大宗谷类作物[2]。稻田镉污染不仅导致水稻产量下降,更严重的是镉元素在水稻植株内大量累积,通过土壤—植物—人体的食物链途径传递,严重威胁到人类健康,直接影响我国的粮食安全[3]。

世界各国或组织已经对稻米中的镉含量制定了严格的限量标准。世界卫生组织与联合国粮农组织联合下属的食品法典委员会标准、日本的厚生省规定稻米中镉的最高限量为0.4mg/kg,而欧盟委员会No.1881/2006指令与我国食品卫生标准[4]规定稻米中镉的最高限量为0.2 mg/kg。因此,采用快速、无损的方法检测稻米镉含量对控制稻米镉含量以及保障稻米食用安全显得尤为重要。

目前,火焰原子吸收光谱法(FAAS)、石墨炉原子吸收光谱法(GF-AAS),电感耦合等离子体原子发射光谱(ICP-AES)和电感耦合等离子体质谱(ICP-MS)等分析方法被广泛用于农产品(食品)中重金属元素含量的测定。这些方法虽然灵敏度高、准确性好,但也存在着仪器需要专业人员操作、繁杂的样品前处理以及消耗大量的强酸试剂等缺点。中红外(Mid-infrared spectroscopy,MIR)作为一种分子光谱分析手段,具有快速、便捷、非破坏性等优点,已经广泛用于土壤中成分的测定。国外的MIR研究主要集中在C和N这两类营养元素的含量测定上[5-6],针对重金属污染元素研究较少,例如:Siebielec、Philippe、Kumagai、邬登巍等[7-10]采用中红外漫反射光谱预测土壤重金属元素含量。而采用MIR光谱测定植株中的重金属含量特别是测定稻米中的镉含量还未见相关报道。研究采用MIR光谱结合模式识别技术用于稻米镉含量的定性预测,并对不同的光谱预处理手段进行优化,以期为稻米镉的初筛和检测提供了快速、无损的检测手段。

1 材料与方法

1.1 试验材料

1.1.1 样品采集 在湖南省长沙县北山镇收集了120个稻米样本,经烘干、去壳、粉碎、过筛,用于光谱测定以及重金属镉含量的标准测定。

1.1.2 仪器与试剂 试验仪器主要有石墨炉原子吸收光谱仪(AA-6800,日本岛津公司)、MIR光谱仪器(AVATAR 360FT-IR,美国热电尼高利公司);试验用镉标准贮备液(1 000mg/L)、大米粉中镉成分分析标准物质(GBW08511)(0.504mg/L)均由国家标准物质中心提供。

1.2 试验方法

1.2.1 镉含量的测定标准方法 采用GB/T 5009/15-2003标准[11]进行测定。准确称量0.5g样品,置于250m L的锥形瓶中,加入20m L的硝酸,采用沙浴加热进行消化,加热至锥形瓶中的溶液变澄清停止加热,冷却后,用去离子水溶解并定容至25m L的容量瓶中,待上机。每批均采用含镉稻米标准物质进行质控,并以空白样品(仅试剂)消除背景。

1.2.2 MIR光谱测试 取一定量试样在玛瑙研钵中磨细后,加适量已干燥磨细的溴化钾粉末,试样与溴化钾质量比约为1︰100,充分混合并研磨;将研磨好的混合物均匀地放入模具的顶模与底模之间,然后把模具放入压力机中,在12Pa左右的压力下处理1~2min即可得到透明或均匀半透明的锭片;将锭片放入仪器支架中测量,保存数据。

1.2.3 统计分析与模型评价 采用偏最小二乘识别分析法(PLS-DA)进行模式识别,各计算程序均自行编写,采用MATLAB软件工具计算,采用预测集的分类正确率定性模型进行评价。

2 结果与分析

2.1 校正集的选择

对MIR光谱数据进行建模,选择有代表性的训练集,不但可以减少建模的工作量,而且直接影响所建模型的适用性和准确性。该研究共120个样本,通过Kennard-Stone法[12]依次挑选出84个样品作为校正集(calibration set),余下的36个样品作为预测集(prediction set)。

2.2 光谱分析

图1为代表性样本的光谱图,记录了4 000 cm-1~400 cm-1波数样品的MIR透反射光谱吸收情况。图中3 000 cm-1附近的吸收峰为O-H键的伸缩振动,1 600 cm-1为C=O的伸缩振动,1 520 cm-1为N-H的面内弯曲振动,1430 cm-1的吸收峰为CH3的面内弯曲振动,1 350 cm-1附近的吸收峰为C-N的伸缩振动吸收,1 150 cm-1附近为糖类的C-O与C-C的伸缩振动,945 cm-1与887 cm-1为糖环的环振动,825 cm-1的吸收峰为CH2变形振动,756 cm-1附近的吸收峰为C-C骨架。上述基团的吸收构成了稻米中淀粉与蛋白质在MIR光谱的主要吸收带。而重金属镉就是以与淀粉或蛋白质形成络合物的形式存在,从而在MIR谱带有吸收,这是采用MIR光谱检测镉元素的理论基础。

图1 样本的原始MIR光谱图Fig.1 The original MIR spectra of samples

2.3 PLS-DA识别分析

以《食品中污染物限量》(GB2762-2012)标准中的镉限量为0.2mg/kg为分类阈值。将数据集镉含量达标(W%≤0.2mg/kg)的稻米样本类标定为-1,镉含量超标(W%>0.2mg/kg)的稻米样本定为+1,以全谱作为输入变量,光谱数据采用平滑,二阶导数和自归一化处理。PLS-DA是一种有教师监督的模式识别方法,其判别能力比主成分分析(partial componentsanalysis,PCA)强。因此,该研究采用PLS-DA建立稻米中镉是否合格的定性分类模型。采用10折法(10-fold)交叉验证选择最佳主成分数。由表1可知,36个预测集样本中,30个样本的属性预测值与其真实属性相符,预测正确;4、14、28、32、35和36号6个样本的属性预测值与实际值不符,预测错误。准确率达到83.3%。而且从上述6个预测错误的样本信息可以看出,4、28和32号样本的镉含量分别为0.221、0.218和0.243mg/kg,含量均在0.2mg/kg左右,接近阈值。这表明PLS-DA模型易识别错误。

2.4 光谱预处理比较

采集的MIR光谱中,光程变化和光散射等因素将对建模的准确性产生重要影响。因此,在全谱范围内,该研究考察了平滑(Smoothing)、一阶导数(Firstderivative,1stDer)、二阶导数(Second derivative,2nd Der)、中心化(centering)、自归一化(autoscaling)及pareto归一化等9种数据预处理方法的分类效果。表2为9种光谱预处理方法分类建模结果比较,采用训练集交叉验证准确率与预测集的准确率进行评价。从表2中可以看出,通过导数处理,预测集鉴别准确率明显好于未进行导数处理的结果,导数运算可以去除斜坡背景以及基线偏移影响。

表1 验证集样本的预测结果Table1 The prediction resultsof validation setsamples

表2 不同的光谱预处理方法对准确率的影响Table 2 Effect of spectroscopy pretreatment methods on theaccuracy

从图2中可以看出,二阶导数处理后的结果比一阶导数处理的结果要好,主要是由于导数运算次数增加,将会提高光谱的信噪比。在三种归一化手段中,自归一化结果要比均值中心化与pareto归一化要好,主要是由于MIR数据经过自归一化算法处理后,变量权重相同,均值为0,方差为1。上述处理能够将每个变量对模型的影响平衡,赋予所有变量相同的权重,避免模型过拟和。因此,通过优化,确定最佳的光谱预处理方法组合为平滑后,采用二阶导数与自归一化处理。

图2 样本的二阶导数MIR光谱图Table 2 Effect of spectroscopy pretreatment methods on theaccuracy

2.5 建模方法比较

为了比较建模的效果,还采用了K-最近邻(k-nearestneighbor,KNN)法对稻米镉MIR光谱数据集进行定性分类。KNN算法中,K值的选择将对KNN的分类效果产生重要影响。K值选择过小或者过大,都将会导致放大噪声数据的干扰,从而降低分类精度。以交叉验证错误率为指标,最终确定了K=10作为KNN模型的最优值。采用KNN法,样本的预测集准确率为67.8%,预测集准确率为75%,总准确率为71.4%;而采用PLS-DA法,样本的预测集准确率为75%,预测集准确率为83.3%,总准确率为79.2%,其结果明显优于KNN法。原因可能是KNN属于无参数方法,而PLS-DA属于有参数调节方法;与KNN相比,PLS-DA法的收敛能力与全局寻优能力要更强。

3 结论

该研究采用PLS-DA方法结合中红外光谱技术,对稻米镉进行MIR光谱扫描,建立稻米镉MIR定性识别模型,通过建模以及预测未知样本,并优化光谱预处理方法,最优结果为:在全谱范围内,采用平滑、二阶求导和自归一化处理,得到PLS-DA模型校正集样本的识别率为75.0%,预测集样本的识别率为83.3%,总正确率为79.2%。该方法简单、快速、绿色环保,能够用于稻米镉含量是否超标的定性初筛和检测。后续研究将进一步增加样本数量,提高适用性,以确保模型的实际应用效果。

[1]Reeves P G,Chaney R L.Mineral nutrients status of female rats affectsthe absorption and organ distribution of cadmium from sunflower kernels(Helianthus annuus L.)[J].Environmental Research,2001,85(3):215-225.

[2]Chaney R L,Reeves P G,Ryan J A,et al.An improved understanding ofsoil Cd risk to humans and low cost methods to phytoextract Cd fromcontaminated soils to prevent soil Cd risks[J].Biometals,2004,17(5):549-553.

[3]徐加宽,杨连新,王余龙,等.水稻对重金属元素的吸收与分配机理的研究进展[J].植物学通报,2005,22(5):614-622.

[4]G B 2762-2012,食品中污染物限量[S].

[5]Jah n B R,Lin k e r R,U pa d hyaya S K,et a l.Mi d-in f r a r e d S pe c t ro s co p ic D ete rmin at iono f Soil N i t r ateC on te n t[J].Bio syste m s E n g in ee rin g,2006,94(4):505-515.

[6]Ma d a ri B E,Reeves J B,Ma c ha d o P,et a l.Mi d-a n d n ea r-in f r a r e d spe c t ro s co p ic assess m e n t o f s oil com p o s i t ion a l pa r a m ete r s a n d st r u c tu r a l in d ic es in t w o F e rr a l s ol s[J].Ge o d e rm a,2006,136(1-2):245-259.

[7]Si eb i e l e c G,Mc Ca r ty G W,S tu c z y n s k iT I,eta l.N ea r-a n d mi d-in f r a r e d d i ffuse r efle c ta nc e spe c t ro s co py f or m easu rin g s oil m eta l con te n t[J].J o u rn a lo f E n v ironm e n ta lMoni t orin g,2004,33(6):2056-2069.

[8]Jea n-P h ili ppe S R,L abbéN,F r a n k lin JA,et a l.D ete c t ion o f m e rc u r y a n d o the r m eta l s in m e rc u r y con ta min ate d s oil s us in g mi d-in f r a r e d spe c t ro s co py[J].Proc ee d in gs o f the I n te rn at ion a l A c a d e m y o f E colo gy a n d E n v ironm e n ta lSci e nc es,2012,2(3):139-149.

[9]邬登巍,吴昀昭,马宏瑞.基于中红外光谱漫反射光谱的土壤重金属元素含量预测研究[J].光谱学与光谱分析,2010,30(6):1498-1502.

[10]K u m aga iM,O h i sa N,A m a no T,et a l.Ca nonic a l d i s crimin a n t a n a l ys i s o f c a d mi u m con te n t l eve l s in u n p oli she d ric eus in ga p or tab l e n ea r-in f r a r e d spe c t rom ete r[J].A n a l yt ic a lSci e nc es,2003,19:1553-1555.

[11]G B/T 5009.15–2003,食品中镉的测定[S].

[12]K e nn a r d R W,S t on e L A.C om pute r A i d e d D es i g n o f Ex pe rim e n ts[J].T e c h nom et ric s,1969,11(1):137-148.

猜你喜欢

稻米导数预处理
隐藏于稻米花果中的酒香
稻米香喷喷
解导数题的几种构造妙招
发挥内外因作用 促进稻米业发展
基于预处理MUSIC算法的分布式阵列DOA估计
关于导数解法
导数在圆锥曲线中的应用
浅谈PLC在预处理生产线自动化改造中的应用
络合萃取法预处理H酸废水
基于自适应预处理的改进CPF-GMRES算法