山西普通荞麦南北比较与判别分析
2016-12-26张强
张 强
(山西师范大学生命科学学院,临汾 041004)
山西普通荞麦南北比较与判别分析
张 强
(山西师范大学生命科学学院,临汾 041004)
为了探寻甜荞产地溯源、鉴别和质量控制的方法,以19个山西甜荞品种为材料,比较了山西南北甜荞中必需氨基酸、矿质元素和维生素含量的特点,采用逐步法筛选有效判别指标,构建判别模型,并对模型进行验证,同时通过ROC曲线分析评价模型中变量的重要性。结果表明:山西南北甜荞必需氨基酸中的色氨酸、苏氨酸、缬氨酸、异亮氨酸、亮氨酸、苯丙氨酸和赖氨酸等7种必需氨基酸含量均存在不同程度的差异,锌、锰、磷和硒4种矿质元素含量亦有极显著差异,维生素E和维生素PP含量差异不显著;采用3种必需氨基酸和2种矿质元素含量为变量,建立的判别模型,回判和交叉验证正确率均为100%;模型中的重要性依次为色氨酸、硒、苏氨酸、缬氨酸和铜。必需氨基酸和矿质元素含量指标与判别分析技术相结合,可作为山西甜荞鉴别和质量控制的一种有效、可行的方法。
甜荞 判别分析 比较
甜荞,即普通荞麦(FagopyrumesculentumMoench),为蓼科(Polygonaceae)荞麦属(FagopyrumGaerth) 1年生草本植物,也是重要的杂粮作物和蜜源植物。甜荞含有丰富的人体必需氨基酸、矿质元素和维生素等成分,具有较高的营养价值和多种保健功能[1-5]。山西是我国甜荞的主产区之一,栽培历史悠久,形成了很多地方品种,关于山西甜荞的研究主要集中在形态生态特点[6]、品种选育栽培[7]和营养成分[8]等方面,产地溯源方面的研究相对较少。
目前,中国作物种质资源信息网已收录了大量的作物种质信息,但信息的利用率还较低。随着农业科学数据的不断积累,从中提取潜在有用的知识变得越来越重要[9]。近年来,已在大豆[10]和苦荞[11]上有相关的数据挖掘研究,为了进一步了解山西南北甜荞的营养特性,充分发挥种质资源信息的作用,本研究对中国作物种质资源信息网中收录的山西甜荞氨基酸、矿质元素和维生素等信息进行了整理和挖掘,充分利用种质资源信息,探寻山西甜荞产地溯源、鉴别和质量控制的方法,提高荞麦种质资源信息的利用率,促进荞麦资源的开发利用。
1 数据来源与方法
1.1 数据来源
数据来自中国作物种质资源信息网(Chinese Crop Germplasm Resources Information System,http://icgr.caas.net.cn)。中国作物种质资源信息网属于国家科技基础条件平台科技资源开放共享目录,为开放共享数据。采用该网荞麦数据库中山西甜荞品种共19个,其中晋北甜荞11个品种(统一编号:334、335、337、339、340、341、342、344、345、346和349),晋南甜荞8个品种(统一编号:429、430、433、434、435、437、439和443)。
1.2 统计方法
数据用Microsoft Excel软件整理、制表,用SPSS17.0统计软件进行统计分析,采用独立样本t检验进行差异显著性检验,并在t检验之前进行方差齐性检验;使用逐步法进行变量筛选,建立Fisher判别模型。变量的重要性采用ROC(Receiver Operating Characteristic, ROC)曲线分析。模型的验证采用回判法和交叉验证法。正确率=正确分组的样本个数/总样本的个数。
2 结果与分析
2.1 必需氨基酸含量比较
从图1可知:晋南甜荞必需氨基酸中的色氨酸高于晋北,并有极显著统计学意义(P<0.01,**),苏氨酸、缬氨酸、异亮氨酸、亮氨酸、苯丙氨酸和赖氨酸含量亦均高于晋北,且有显著的统计学意义(P<0.05,*),而蛋氨酸含量差异无显著的统计学意义(P>0.05,ns)。
图1 山西甜荞必需氨基酸含量
2.2 矿质元素含量比较
表1分析结果表明:晋南甜荞的锌、锰、磷和硒含量均高于晋北,并有极显著的统计学意义(P<0.01),铜、铁和钙含量没有显著的统计学意义(P>0.05,ns)。无论是晋南还是晋北甜荞中铁与钙的变异系数均最大(C·V>40%)。
2.3 VE和VPP含量比较
表2分析结果显示:晋北甜荞的VE平均含量19.12 μg·g-1高于晋南甜荞,但晋北甜荞VE的变异系数较大,约为晋南甜荞的3倍;晋北和晋南甜荞VPP平均含量基本相同,晋北甜荞的VPP变异系数较大,约为晋南甜荞的1.5倍;晋南北甜荞中的VE与VPP含量差异没有显著的统计学意义(P>0.05)。
2.4 判别模型的构建与验证
以8种必需氨基酸、7种矿质元素和2种维生素为变量,采用逐步法进行判别分析,经筛选,选用3种氨基酸:色氨酸(Trp)、苏氨酸(Thr)和缬氨酸(Val),2种矿质元素:硒(Se)和铜(Cu),构建Fisher判别模型为:Y=-8.143+20.905Se-0.792Cu+73.589Trp-45.421Val+71.426Thr,该模型在组质心处的函数值分别为:晋北-4.471,晋南6.148,2组质心距离较大,临界值为0.838,函数值小于0.838为晋北,函数值大于0.838为晋南。分别对模型进行回判验证和交叉验证,结果见表3,正确率均为100%,说明模型有较好的区分效果。
表1 山西甜荞矿质元素含量
表3 山西甜荞19个品种的判别结果
注:1表示晋北,2表示晋南。
近年来, 基于ROC曲线的评估方法在模式识别、数据挖掘、机器学习、决策分析、医学图像诊断等领域得到较多应用[12],ROC曲线具有直观性,曲线以误检率为横轴(即1-特异性),以检出率为纵轴(即敏感度),ROC曲线下面积AUC(Area Under the Curve)反映了变量正确区分目标能力的大小,可以定量评价变量对于分类的效能,AUC越大说明变量的判别效果越好,模型所选变量AUC的大小为:色氨酸(0.994)>硒(0.943)>苏氨酸(0.761)>缬氨酸(0.750)>铜(0.352),表明色氨酸为判别模型中最重要的必需氨基酸变量,硒为判别模型中最重要的矿质元素变量,二者具有较高的区分效能(见图2)。
图2 ROC曲线
3 讨论
山西省地处内陆,南北间距较长,东西间距较短,南北气候等环境条件差异明显。晋南气候温和,土地肥沃;晋北气候寒冷,无霜期短,土地贫瘠,而甜荞对环境的依赖性又很强[13]。晋南甜荞必需氨基酸和矿质元素含量较晋北丰富,可能是环境因子和遗传因子等共同作用的结果。色氨酸是最具区分效能的氨基酸,苏氨酸和缬氨酸的区分效能相近,这与杨克理[14]对北方甜荞麦资源的氨基酸相关分析结果显示8种氨基酸间均存在着正相关关系,色氨酸与其他氨基酸间的相关系数偏低,有一定的一致性,苏氨酸和缬氨酸代表其他氨基酸发挥效能,色氨酸在模型中独立发挥最大效能。硒含量南北差异显著,是具有最大区分效能的矿质元素,有研究亦显示山西甜荞中的硒含量丰富,并且受土壤全硒影响较大,省内不同地域间差异显著[8]。另外,有对山西甜荞维生素 PP和维生素 E含量的分析研究显示,存在一定的省内地域间差异[15],但本研究显示差异未有显著的统计学意义,可能与其变异系数较大有关。
本研究是对中国作物种质资源信息网的公开共享信息,提取出山西甜荞信息完整的全部19个样本,进行数据挖掘,得出的初步研究结果。由于数据库中没有黄酮含量指标,本研究没有涉及黄酮含量,有待专题研究。今后随着样本量的增大,新变量、新方法的引入,构建的判别模型将会更精确、更实用。
4 结论
晋南甜荞除蛋氨酸外,必须氨基酸中的7种氨基酸含量均不同程度地高于晋北,矿质元素中的锌、锰、磷和硒的含量均极显著地高于晋北。Fisher判别模型为:Y=-8.143+20.905Se-0.792Cu+73.589Trp-45.421Val+71.426Thr,有较好的区分效果。色氨酸是最具区分效能的必需氨基酸,硒是具有最大区分效能的矿质元素。必需氨基酸和矿质元素含量指标与判别分析技术相结合,可作为山西南北甜荞产地溯源、鉴别和质量控制的一种有效、可行的方法。
[1]周小理,李宗杰,周一鸣.荞麦治疗糖尿病化学成分的研究进展[J].中国粮油学报,2011,26(5):119-121
[2]Choy A L, Morrison P D, Hughes J G, et al. Quality and antioxidant properties of instant noodles enhanced with common buckwheat flour[J]. Journal of Cereal Science, 2013, 57 (3): 281-287
[3]Sano M, Nakagawa M, Oishi A, et al. Diversification of 13S globulins, allergenic seed storage proteins, of common buckwheat[J]. Food Chemistry, 2014, 155: 192-198
[4]Lee S W , Seo J M, Lee M K, et al. Influence of different LED lamps on the production of phenolic compounds in common and Tartary buckwheat sprouts[J]. Industrial Crops and Products, 2014, 54: 320-326
[5]Biney K, Beta T. Phenolic profile and carbohydrate digestibility of durum spaghetti enriched with buckwheat flour and bran[J]. LWT-Food Science and Technology, 2014, 57 (2) : 569-579
[6]林汝法.山西省荞麦种质资源类型及形态生态特点[J].作物品种资源,1986(4):15-18
[7]张春明,李秀莲,张耀文.晋荞麦(甜)3号的选育及高产栽培[J].山西农业科学, 2011,39(4):316-318
[8]王子王,邢丽萍,曹家林,等.山西省荞麦种质资源含硒特性的初步分析[J].作物品种资源, 1993(4):11-13
[9]梁川,王文生,谢能付. 农业信息资源上数据挖掘的应用[J].中国农学通报, 2009, 25 (11): 243-247
[10]唐合文.基于国家作物种质资源数据库的知识发现研究[D].北京:中国农业科学院,2007
[11]张强,李艳琴.基于矿质元素的苦荞产地判别研究[J].中国农业科学,2011,44(22):4653-4659
[12]孙长亮,何峻,肖怀铁.基于ROC曲线的目标识别性能评估方法[J].雷达科学与技术,2007,5(1):17-21
[13]南成虎,师颖,曹丽萍.甜荞育种趋势与发展动态[J].山西农业科学, 2009,37(8):79-82
[14]杨克理.北方普通荞麦资源的氨基酸相关分析[J].内蒙古农业科技,1991(3):6-7
[15]赵建栋,李秀莲,崔林.山西省甜荞种质资源营养特性的研究[J].辽宁农业科学,2013(3):64-65.
Shanxi Common Buckwheat North-South Comparison and Discriminant Analysis
Zhang Qiang
(College of Life Sciences, Shanxi Normal University, Linfen 041004)
In order to explore a method of geographical origin traceability, identification and quality control for common buckwheat,with 19 Shanxi common buckweat varieties as materials, the characteristics of the essential amino acids, mineral elements and vitamin contents of Shanxi common buckweat in the north and south were compared. Using stepwise method to screen effective discriminant index, the discriminant model was constructed and validated. At the same time through the ROC curve the importance of variables in the model was analyzed and evaluated. The results showed that the contents of essential amino acid in tryptophan, threonine, valine, isoleucine, leucine, phenylalanine and lysine in Shanxi common buckweat from the north and south have significant differences. The mineral element contents of zinc, manganese, phosphorus, and selenium also have significant differences,but the contents of vitamin E and vitamin PP have no significant difference. By using three kinds of essential amino acids and two kinds of mineral elements content as variables to establish the discriminant model, the percentage of 100% of correct classification was achieved by resubstitution and cross-validation accuracy. The importance order in the model is tryptophan, selenium, threonine, valine and copper. The indexes of essential amino acids and mineral element contents combined with discriminant analysis technology can be used as an effective and feasible method for identification and quality control of the common buckweat of Shanxi.
common buckwheat, discriminant analysis, comparison
TS211.7
A
1003-0174(2016)02-0005-04
山西省科技攻关(20120311006-1),山西师范大学校基金(ZR1222),山西师范大学生命科学学院基金(SMYKZ-15)
2014-07-13
张强,男,1968年出生,讲师,植物资源开发利用