矿物元素结合簇类独立软模式法对冬枣产地判别模型的优化
2016-11-07夏立娅李小亭李晓杨张晓瑜尹洁璇
夏立娅,李小亭,李晓杨,张晓瑜,尹洁璇
(河北大学 质量技术监督学院,河北 保定 071002)
矿物元素结合簇类独立软模式法对冬枣产地判别模型的优化
夏立娅,李小亭,李晓杨,张晓瑜,尹洁璇
(河北大学 质量技术监督学院,河北 保定071002)
为了提高冬枣产地鉴别方法的准确性,测定了69个冬枣样本中10种元素的含量,并对数据进行了差异性分析、主成分分析和簇类独立软模式分析(SIMCA).结果表明,冬枣中Mg、B、Mn、Fe、Zn等元素在不同产地间存在显著差异,利用主成分分析可以看出不同产地样本有较好的聚类趋势.在前4个主成分中,Fe、B、Mn、Zn和K元素的载荷值较高,是重要的产地识别元素.利用SIMCA建立的产地判别模型,置信水平为5%时对验证集样本判别结果最好,识别率为100%,拒绝率为78.95%.研究结果证实了农产品中多元素分析结合SICMA法可以有效用于原产地的鉴别.
冬枣;元素;主成分分析;簇类独立软模式
冬枣(Ziziphusjujuba),又名雁过红、果子枣、苹果枣等,是中国特有的一种晚熟鲜食枣品种.主要分布在河北、山东交接的渤海湾地区.在河北黄骅保存有千亩原始冬枣林,山东沾化也有数十珠百年枣树散布于农户家中.为保护具有原产地特色的产品,黄骅冬枣和沾化冬枣先后通过国家地理标志产品认证,纳入了原产地保护产品名单.2产地冬枣在品质和遗传特征上的差异一直是研究的热点.目前,普遍认为冬枣没有明显遗传差异,品质上的差异主要由产地土壤条件、气候条件以及栽培管理措施引起[1-2].为了有效地保护具有原产地特色的冬枣,有效管理市场上乱用地理标志标识的现象,迫切需要分析原产地冬枣的品质特征,建立原产地鉴别方法.
关于农产品的地域特色研究,主要集中在有机成分、矿物元素、同位素和重金属元素分布等方面[3-4],其中矿物元素指纹特征分析是主要的产地溯源方法.不同产地土壤、水源等资源中矿物元素的分布存在差异,而这种差异会反映到农产品中[5],成为稳定有效的产地标记物[6-9].虽然农产品中矿物元素的分布受到施肥、浇水、往年耕种作物等人为因素的影响,但有报道证实,产地环境对农产品中矿物元素分布的影响大于人为因素带来的影响[10].但是,单一的矿物元素很难准确标识农产品产地,多种元素结合模式识别方法是解决该问题的有效途径[11-12].
已报道的研究中,多利用聚类分析、Fisher判别分析等计量学方法分析矿物元素特征,并建立原产地鉴别模型[13-14].未见多元素结合簇类独立软模式(SIMCA)用于原产地鉴别的报道.SIMCA是一种基于主成分分析的有监督模式识别方法,分类思路是对训练集中的每个样本类别分别建立一个主成分分析模型,对其进行描述,并在此基础上,通过将未知样本依次拟合各分类的主成分模型,从而预测该未知样本的分类.本研究将多元素分析和SICMA相结合,建立了冬枣原产地的鉴别模型.
1 材料与方法
1.1原料
在河北黄骅市和山东沾化市的主要冬枣产区内采集了69个冬枣样本,具体的样本信息见表1.样本采集时间集中在9月中旬至10月中旬,每个采样点采集样本1 000 g,并于-3 ℃环境中暂时存放.
表1 冬枣样品地域信息
1.2仪器与试剂
Thermo X Series 2 电感耦合等离子体质谱仪,美国赛默飞世尔公司Scientifie;TAS-990原子吸收分光光度计,北京普析通用公司;XH-800J微波消解仪,北京祥鹄科技发展有限公司;Milli-Q 超纯水系统,美国Millipore公司.
1.3样品分析
K、Na、Ca、Mg、Fe、B、Mn、Cu、Zn和Ba标准溶液为国家有色金属及电子材料分析测试中心研制;硝酸、盐酸、高氯酸和过氧化氢为MOS级,天津科密欧化学试剂有限公司生产;氯化铯和氧化镧为高纯试剂,天津光复精细化工有限公司生产.
将冬枣洗净切片置于120 ℃干燥箱中直至恒重,然后将其研磨成细粉.准确称取0.500 g于微波消解罐中,加入5 mL硝酸、2 mL过氧化氢;200 ℃微波消解4 h后,赶酸,并用超纯水定容至50 mL.K,Na,Ca和Mg元素的测定用火焰原子吸收分光光度法.K和Na的检测中加入50 g/L的氯化铯水溶液,Mg和Ca的检测中加入30 g/L的氧化镧水溶液,以排除干扰离子的影响.K、Na、Ca和Mg的检测波长分为232、292、312、231 nm.B、Fe、Mn、Cu、Zn和Ba的测定采用电感耦合等离子体质谱法.样品的分析操作条件如下:射频功率1 200 W,等离子气体流速1.12 L/min,辅助气体流速0.5 L/min,喷雾室温度2 ℃,0.45%的氧化物指数,双电流指标为1.01%.用内标法保证仪器的稳定性,选用Li、Ge和Bi作为内标,当内标元素的RSD>5%,重新测定样品.
1.4数据处理
采用 Spectrum X与SPSS 22.0 软件对数据进行分析.主要通过主成分分析法(PCA)分析样本的数据矩阵,用以提取特征变量;在此基础上,分别选取25个黄骅冬枣,25个沾化冬枣组成训练集,剩余样本组成验证集.分别对2产地训练集样本进行主成分分析,然后利用SIMCA 对训练集谱图进行分类识别,建立分类鉴别模型.最后通过验证集样本对模型的可信度进行评定.
2 结果与讨论
2.1冬枣中矿物元素含量分析
对黄骅冬枣和沾化冬枣的多元素分析结果(表2)表明,2个产地冬枣的元素分布各具特征性.黄骅冬枣中K、Na、Mn和Ba的含量较高,其中K和Na的含量与产地土壤盐渍化程度较高有关.对2产地冬枣中10种元素含量进行了T检验,结果表明:Mg、B、Mn、Fe和Zn含量存在显著性差异(F),其中铁元素差异性最大,F值为37.53,其次为硼和镁元素.
表2黄骅冬枣和沾化冬枣的元素含量和差异性分析
Tab.2Analysis of the variance and elements contents of Huanghua Ziziphus jujuba and Zhanhua Ziziphus jujuba
样品w(K)/(mg·g-1)w(Na)/(mg·g-1)w(Mg)/(mg·g-1)w(Ca)/(mg·g-1)w(B)/(mg·g-1)黄骅冬枣5.68±1.071.09±0.321.68±0.110.89±0.1835.57±6.04沾化冬枣4.50±1.240.89±0.321.99±0.270.95±0.1036.33±3.46F0.6310.17812.9160.90215.190显著性0.4300.6750.0010.3460.000样品w(Mn)/(mg·kg-1)w(Fe)/(mg·kg-1)w(Cu)/(mg·kg-1)w(Zn)/(mg·kg-1)w(Ba)/(mg·kg-1)黄骅冬枣12.70±3.5021.18±8.845.81±0.9711.92±1.081.18±0.38沾化冬枣9.50±2.8923.33±4.026.63±0.8515.08±1.960.93±0.33F6.50837.5311.4747.9360.674显著性0.0130.0000.2290.0060.415
2.2主成分分析
主成分分析(principal component analysis,PCA)可以高效地浓缩测量矩阵中的信息,简化数据,揭示测量数据内部结构特征.在该部分分析中,首先将所有元素含量数据标准化,以消除不同量纲差异和数量级间的差异.然后通过相关矩阵,确定具有高度相关性的元素,利用这些元素含量的协方差确定第一主成分(PC-1),利用残留相关矩阵,计算第二主成分(PC-2).第二主成分对原始数据的贡献去除后,可以提取第三主成分(PC-3).此过程一直继续,直到原始数据的所有方差都被提取后结束.图1为对校正集样本的第一、二主成分的分图.从中可看出,沾化冬枣的样本分布在得分图的中间,特别是椭圆区域内;而黄骅冬枣的样本分布在四周,较为分散.2个产地的样本有明显的聚类趋势.
图1 冬枣矿物元素主成分得分Fig.1 Score cluster plot using top two principal components of Ziziphus jujuba
图2 为主成分的累积可信度.在校准分析中前4个主成分的累计方差贡献率为97.99%,验证分析中前4个主成分的累计方差贡献率为95.79%.当主成分数为7的时候,校准分析和验证分析都可以解释99%以上的方差.因此,主成分代表了原有数据中绝大部分信息,可以利用主成分得分进行后续分析.
图2 主成分累计可信度Fig.2 Accumulative reliabilities plot of the principal components
主成分的载荷表示和相应的原变量的相关系数,该值的绝对值越大,说明主成分对该变量的代表性越大.在冬枣元素的主成分载荷表(表3)中可看到,第一主成分中Fe、B元素的载荷值较大,第二主成分中B、Mn和Zn元素的载荷值较大,第三主成分中Mn、B、Zn和Fe元素的载荷值较大,第四主成分中Zn、K和Mn元素的载荷值较高.由于前4个主成分已经解释了大约98%的方差,前4个主成分载荷值高的变量在最终的分析中就更加重要,因此,Fe、B、Mn、Zn和K元素是更重要的识别元素.
表3 主成分载荷表
2.3SIMCA分析
SIMCA是一种基于主成分分析的有监督模式识别方法.该方法解决了主成分分析在建模时不包含分类信息,因而不能直接用于模式识别的问题.在该部分分析中,随机将50个样本作为训练集,其中25个黄骅冬枣样本,25个沾化冬枣样本,剩余的19个样本作为验证集样本.对训练集中的每类样本分别建立主成分分析模型,在此基础上,对验证集样本依次拟合各类别的主成分模型,根据距离对未知样本归类.根据归类的正确性来检验模型的可靠性.
表4为在不同置信水平下,利用SIMCA模型对验证集样本的判别结果.其中,识别率为落在该类模型区域内的样本比例,而拒绝率为该模型对不属于该类模型样本的拒绝程度.从分析结果可以看出,置信水平为5%时,平均识别率为100%,平均拒绝率为78.95%,模型具有较高的准确性.
表4 冬枣产地SIMCA判别模型的识别率和拒绝率
3 结论
黄骅冬枣和沾化冬枣中Mg、B、Mn、Fe和Zn元素含量存在较大差异,利用主成分分析法可以将2地样本较好地聚类.在前4个主成分中,Fe、B、Mn、Zn和K元素的载荷值较高,是重要的产地识别元素.为了准确的判定样本的类别,在主成分分析的基础上利用SIMCA建立了产地判别模型,并证实该模型具有较高准确度.
SIMCA通过分别建立PCA模型,克服了常见算法中存在的自变量共线性的问题,同时很好地排除了噪音、无关变量和离群样本等干扰因素,改善了模型的预测精度.本研究证实了农产品中多元素分布结合SICMA法可以有效用于原产地鉴别研究中.本研究的样本量较多,具有一定代表性,可以应用于冬枣产地鉴别的工作.同时,由于样本的年份范围较窄,样本地域分布有限,还应进一步增加样本数量和种类,不断修正鉴别模型,以扩大模型的应用范围.
[1]马庆华.不同产地冬枣遗传品质差异及其栽培技术研究[D].北京:北京林业大学,2007.
MA Q H.Studies on the genetic variation and the fruit quality ofZizyphusjujubaMill.cv.Dongzao from different provenances and the cultivating technology[D].Beijing:Beijing Forestry University,2007.
[2]马庆华,续九如,王贵禧,等.河北和山东冬枣果实品质评价及AFLP分子标记的研究[J].林业科学研究,2009,22(1):48-54.
MA Q H,XU J R,WANG G X,et al.Studies on the fruit quality and AFLP markers ofZiziphusjujubacv.Dongzao from Hebei and Shangdong provenances[J].Forest Research,2009,22(1):48-54.
[3]SUN S M,GUO B L,WEI Y M,et al.Multi-element analysis for determining the geographical origin of mutton from different regions of China[J].Food Chem,2011,124:1151-1156.DOI:10.1016/j.foodchem.2010.07.027.
[4]ARIYAMA K,SHINOZAKI M,KAWASAKI A.Determination of the geographic origin of rice by chemometrics with strontium and lead isotope ratios and multielement concentrations[J].J Agric Food Chem,2012,60:1628-1634.DX.DOI.org/10.1021/jf204296p.
[5]SCHW GELE F.Traceability from a European perspective[J].Meat Science,2005,71:164-173.
[6]MOREDA-PINEIRO A,FISHER A,HILL S J.The classification of tea according to region of origin using pattern recognition techniques and trace metal data[J].J Food Compos Anal,2003,16:195-211.
[7]LI G C,WU Z J,WANG Y H,et al.Identification of geographical origins of Schisandra fruits in China based on stable carbon isotope ratio analysis[J].Eur Food Res Technol,2011,232:797-802.
[8]COETZEE P P,STEFFENS F E,EISELEN R J,et al.Multi-element analysis of south African wines by ICP-MS and their classification according to geographical origin[J].J Agric Food Chem,2005,53:5060-5066.
[10]KAORU A,TANASHI N,TOMOAKI N.Effects of fertilization,crop year,variety,and provenance factors on mineral concentrations in onions[J].J Agric Food Chem,2006,54:3341-3350.
[11]ZHAO H Y,GUO B L,WEI Y M,et al.Effects of wheat origin,genotype,and their interaction on multielement fingerprints for geographical traceability journal of agricultural and food chemistry[J].J Agric Food Chem,2012,60:10957-10962.DX.DOI.org/10.1021/jf3021283.
[12]ZHAO H Y,GUO B L,WEI Y M,et al.Determining the geographic origin of wheat using multielement analysis and multivariate statistics[J].J Agric Food Chem,2011,59:4397-4402.DX.DOI.org/10.1021/jf200108d.
[13]MARIAVITTORIA Z,CHRISTOPHE R QUETEL,EDUARDO P,et al.Soil properties,strontium isotopic signatures and multielement profiles to authenticate the origin of vegetables from small scale regions:illustration with early potatoes from southern Italy[J].Rapid Commun Mass Spectrom,2011,25:2721-2731.DOI:10.1002/cm.5081.
[14]SHEN S G,XIA L Y,XIONG N A.Determination of the geographic origin of rice by element fingerprints and correlation analyses with the soil of origin[J].Analytical Methods,2013,21(5):6177-6185.DOI:10.1039/C3ay40700d.
(责任编辑:梁俊红)
Optimization of traceability model of Ziziphus jujuba geographic origin by multi-element analysis combined SIMCA
XIA Liya,LI Xiaoting,LI Xiaoyang,ZHANG Xiaoyu,YIN Jiexuan
(College of Quality and Technical Supervision,Hebei University,Baoding 071002,China)
In order to improve the accuracy of identification method of geographical origin,the contents of 10 elements in 69Ziziphusjujubaswere measured,and the data were analyzed by difference analysis,principal component analysis(PCA)and soft independent modeling of class analogies(SIMCA).The results showed that there were significant differences in the contents of Mg,B,Mn,Fe,Zn and other elements from different origin places.The result of PCA showed that the samples from different origins had clustering trend.In the first four principal components,the Fe,B,Mn,Zn and K elements had higher loading values,they were considered important origin elements.In the SICMA,with the 5% significance level,the identified result was best with 100% recognition rate and 78.95% rejection rate.This study confirmed that multi-element analysis with SICMA is on effective method to determine geographical origin of agricultural products.
Ziziphusjujuba;element;principal component analysis;soft independent modeling of class analogies
10.3969/j.issn.1000-1565.2016.04.008
2016-03-01
国家自然科学基金资助项目(31501447);河北省自然科学基金资助项目(B2013201235);河北大学自然科学研究项目(2014-02)
夏立娅(1978—),女,河北临西人,河北大学副教授,博士,主要从事食品品质评定及原产地鉴别研究.
E-mail:xialiya@126.com
李小亭(1958—),女,河北保定人,河北大学教授,博士生导师,主要从事光学分析及应用研究.
E-mail:lxt@hbu.com
O657.3
A
1000-1565(2016)04-0374-06