基于主成分分析和聚类分析对22份马铃薯种质的综合评价
2021-04-12张秀芬郭素云阳景阳李恒锐刘连军
何 文, 张秀芬, 郭素云, 阳景阳, 李恒锐, 刘连军
(广西南亚热带农业科学研究所, 广西 崇左 532415)
马铃薯俗称土豆、洋芋,是一种粮菜兼用型农作物,其所含淀粉是工业与食品加工业中重要的原料[1],具有丰富的营养,低脂肪、高碳水化合物、高维生素、高钾等都是它的特点,被誉为“地下苹果”[2]。马铃薯是世界四大主粮之一,仅次于玉米、水稻和小麦[3],我国作为世界马铃薯第一大生产和消费国[4],同时马铃薯较高的农业经济价值,对于我国助推脱贫攻坚具有重要意义[5]。农业部2016年发布的《关于推进马铃薯产业开发的指导意见》中指出,随着马铃薯的食用率越来越高,需要调整优化马铃薯产业结构,其中马铃薯新品种选育就变得尤为重要[6]。目前广西马铃薯种植品种主要是“费乌瑞它”,主栽品种较为单一,且由于农户自留种导致品种退化现象严重,无法完全满足当前马铃薯产业需求。因此优质马铃薯新品种的选育,已成为推动广西马铃薯产业多样性发展的重要力量。
马铃薯种质资源的引进和品种选育及评价是一项基础性的工作,通过单一指标分析无法准确地对马铃薯综合性状进行合理评价,而综合评价能对品种进行全面客观的评价[7],具有一定的客观性和准确性,避免了单一指标的片面性。主成分分析是在基本不损失原有信息的条件下,通过降维方法将多个存在相关关系的性状指标转化为几个能反映原来多个性状指标主要信息的综合指标,以简化数据结构,准确了解各性状的综合表现[8]。聚类分析是根据“物以类聚”的原理,将数据分到不同的类别,同一个类别中的对象有很大的相似性,而不同类别间的对象有很大的相异性[9]。范继征等[10]基于关联度、主成分和聚类分析对西南区玉米新组合进行评价;张志伟[11]基于主成分分析对5种棕榈科苗木抗寒性进行综合评价;苏群等[12]对49份睡莲资源通过主成分分析和聚类分析进行了综合评价,筛选出蓝紫色九品香睡莲为最佳品种;王鹏[13]、潘哲超[5]、柴莹[14]、何虎翼[15]、刘文林[16]、马恢[17]采用主成分和聚类分析对马铃薯遗传多样性进行综合评价,并筛选出适合当地推广种植的优质马铃薯品种。
马铃薯种质在不同地方受到当地小气候、土壤肥力、施肥水平及管理经验等条件的影响,导致马铃薯各方面性状在不同地区的表现差异变化。广西崇左地区属于南亚热带地区,对冬种马铃薯在光、热、水、气等方面具有潜在优势,适合马铃薯大规模生产,但是现在冬种马铃薯品种混乱,质量良莠不齐,因此本文通过对广西崇左引种的22份马铃薯种质资源主要农艺性状和营养成分进行主成分分析和聚类分析,以期筛选出综合性状优良的马铃薯品种,为崇左地区马铃薯产业的良种选育和推广提供参考依据。
1 材料与方法
1.1 试验材料
供试材料为22份马铃薯种质:D 3-24(7)、D 4-26(1)-1、D 3-25(39)-3、Z 3(17)、D 5-24(33)、D 15-5(4)-1.4、龙园宝贵资源、DNJ大红心、Z 5(6)-2、D 4-26(1)-5、 Z 4(1)-3.2、D 3-25(39)-1、D 18-15(3)-2、 D 4-26(1)-6、 DNJ小红心、 D 3-25(40)、 D 3-25(22)、D 3-25(14)、D 3-25(22)-4、桂彩薯1号、桂农薯1号、费乌瑞它。
1.2 试验方法
1.2.1试验设计
试验时间为2018年11月至2019年3月,试验地点在广西南亚热带农业科学研究所马铃薯试验基地新地块,当地属南亚热带季风气候区,年平均气温22.8 ℃,年降水量1 348 mm,年日照时数1 251 h,无霜期352 d。试验地为壤土,肥力中等,有利于马铃薯生长。本试验选择薯形均匀,无病虫害马铃薯作为种薯,采用常规种薯切块及消毒处理,每块种薯约25 g,保留2个完整芽眼。起垄双行“品”字形栽培,株行距25 cm×20 cm。试验按随机区组排列设计,设置3个重复小区,每个小区种植面积为6 m2,每个小区种植40株马铃薯。马铃薯种植常规施肥及田间管理参照当地水平。
1.2.2指标测定及方法
每个小区随机抽取10株,在马铃薯结薯期测定植株株高、主茎数,在收获时测产,并挑选大小一致的马铃薯样品测量其干物率、还原糖、淀粉、花色苷、蛋白质指标。
株高:从泥土的表层到主茎的第1个花序分支处的高度。
主茎数:由地下或者由种薯直接生长出来的茎的数目。
还原糖含量用3,5-二硝基水杨酸法测定[18]。
淀粉含量用国标GB 5009.9-2016食品中淀粉含量测定法[19]。
马铃薯花色苷用O.D.法测定[20]。
蛋白质含量用国标GB 5009.5-2016食品中蛋白质含量测定法[21]。
干物率含量用烘干法测定。
1.3 统计分析
用SPSS 22.0软件进行数据变异分析、相关性分析和主成分分析并计算主成分综合得分,确定排名秩序,再进一步根据各样品的综合得分进行多元线性回归,使用Cook距离标准化的逐步线性回归分析进行验证,最后根据综合得分进行聚类分析。
2 结果与分析
2.1 马铃薯种质性状变异比较分析
从表1可以看出,22份马铃薯种质资源在不同性状上变异各不相同,花青素含量变异幅度最大,变异系数为133.97%,其次是还原糖含量变异系数为121.15%,其次是株高、主茎数、单产、干物率、蛋白质,变异幅度最小的是淀粉含量,变异系数为3.41%。本研究结果与黄洪媛等[22]的研究结果存在一定的差异,原因是试验中马铃薯品种、大田管理及生态环境等因素存在一定差异。
表1 22份马铃薯种质资源性状差异分析Table 1 Difference analysis of charcteristics in 22 potato germplasms
2.2 马铃薯种质性状相关性分析
从表2可看出,株高和单产呈显著正相关,与还原糖呈正相关,与蛋白质呈负相关;单产与还原糖呈正相关,与蛋白质呈显著负相关;还原糖与蛋白质呈正相关;花青素与干物率呈显著正相关。本试验结果与李守强[23]等的研究结果存在一定差异,可能与马铃薯种质特性有一定关联。
表2 22份马铃薯种质资源性状相关性分析Table 2 Correlation analysis of charcteristics in 22 potato germplasms
2.3 主成分分析
2.3.1数据的标准化处理
对22份马铃薯种质资源性状值进行标准化无量纲化处理[8],公式如下:
(1)
表3 数据标准化处理后的结果Table 3 Data standardization
2.3.2主成分分析的适宜性检验
对无量纲标准化数据进行KMO检验和Bartlett球度检验,结果如表4所示。KMO值为0.644,Bartlett球度检验得出的相伴概率为0.031,小于显著性水平0.05,因此拒绝Bartlett球度检验的零假设,认为变量间存在较强的相关性,适合做主成分分析。
表4 KMO检验和Bartlett 球度检验Table 4 KMO test and Bartlett sphericity test
2.3.3主成分因子的选择
对22份马铃薯种质资源性状进行无量纲标准化处理后,再进行主成分分析,计算主成分特征值及方差贡献率和累计贡献率。从表5可看出,主成分1特征值为2.775,方差贡献率为34.683%;主成分2特征值为1.58,方差贡献率为19.755%;主成分3特征值为1.142,方差贡献率为14.276%;主成分4特征值为0.955,方差贡献率11.936%。主成分1~4的累计方差贡献率达80.65%,符合主成分分析要求,即这4个主成分代表22份马铃薯的8项性状信息,因此可以选取这4个主成分作为马铃薯性状的综合评价指标。
表5 马铃薯性状主成分分析的方差贡献率Table 5 Variance contribution rate of PCA of charcteristics in potatos
主成分载荷矩阵反映了各个性状对主成分负荷的相对大小和作用方向,即该性状对主成分影响的程度[8]。如表6结果所示,第1主成分主要反映株高、单产、还原糖、蛋白质性状;第2主成分主要反映花青素和干物率性状;第3主成分主要反映淀粉性状;第4主成分主要反映主茎数性状。
表6 马铃薯性状的主成分载荷矩阵Table 6 Load matrix of PCA of potato charcteristics
主成分表达式中各因子系数的大小可以反映因子对该主成分的贡献大小,在主成分分析中,一般认为大于0.3的载荷就是显著的[23]。根据表7马铃薯性状相关矩阵的特征向量,可以写出4个主成分表达式:
表7 马铃薯性状相关矩阵的特征向量Table 7 Eigenvectors of charcteristics-related matrix of potatos
F1=0.282X1+0.004X2+0.307X3+0.255X4-0.164X5-0.016X6-0.179X7-0.25X8
F2=0.212X1-0.189X2+0.112X3-0.02X4+0.46X5+0.278X6+0.421X7-0.27X8
F3=0.228X1+0.478X2-0.217X3+0.348X4-0.138X5+0.619X6+0.05X7-0.148X8
F4=0.073X1+0.8X2+0.162X3-0.082X4+0.238X5-0.481X6+0.264X7-0.105X8
(2)
2.3.4马铃薯性状的综合评价
各主成分方差贡献率如表5所示,选取4个主成分累计方差贡献率80.65%>80%,建立模型Z综合得分=34.683Z1+19.755Z2+14.276Z3+11.936Z4。通过公式(2)计算出4个主成分得分,最后计算出Z综合得分,并进行排序(表8)。
表8 马铃薯性状的主成分因子综合得分Table 8 Comprehensive scores of PCA of potato charcteristics
以各个马铃薯材料F综合得分为因变量,4个主成分包含的各性状指标为自变量,采用逐步回归分析,得到5个有效预测模型(R2>0.9),依据指标简便易用的原则,选择模型F综合得分=0.251X4+0.373X1+0.271X2-0.521X8,计算F综合得分。再经过相关性分析可以得出Z综合得分与F综合得分极显著相关(R2=0.959**),说明Z综合得分模型具有较高的预测准确性,可以用Z综合得分模型对马铃薯综合性状进行评价。
通过欧式距离进行聚类分析(采用类间平均距离连接得到22份马铃薯品种(系)的系统聚类图(图1),由图1可以看出,在阈值为16左右时可将供试材料分为三大类,第一类为综合性状较优的材料,共有7份,分别为DNJ大红心、DNJ小红心、D 15-5(4)-1.4、桂农薯1号、桂彩薯1号、D 18-15(3)-2、D 3-25(39)-1,具有产量高,还原糖含量高,主株高的特点,第二类为综合性状居中的材料,共有14份,分别是D 3-24(7)、D 4-26(1)-1、D 3-25(39)-3、Z 3(17)、D 5-24(33)、龙园宝贵资源、费乌瑞它、Z 5(6)-2、D 4-26(1)-5、Z 4(1)-3.2、D 4-26(1)-6、D 3-25(22)、D 3-25(14),具有产量和还原糖含量居中,蛋白质含量高的特点;第三类是综合性状较差的材料,有1份,是D 3-25(22)-4。
3 讨论与结论
植物的生长发育、生理特性不仅受到自身遗传物质的控制,而且还受到温度、光照、水分等环境因素的影响[24-25]。广西冬种马铃薯种植期间光照相对较少、温度较低、多阴雨,北方品种引种试种后发现其产量和品质受广西气候条件影响显著[26]。因此,对引进或选育的优质马铃薯品种在广西崇左地区的种植性状进行综合评价,筛选出符合当地生产应用的品种具有重要意义。
本试验通过对所选取的22份马铃薯种质资源的株高、主茎数、单产、干物率、还原糖含量、淀粉含量、花色苷含量、蛋白质含量8个性状指标进行描述性统计,发现不同种质资源在不同的性状上表现出不同的差异,其中还原糖和花青素含量的变异幅度最大,变异系数在120%以上,说明不同种质间还原糖和花青素这两个性状具有丰富的遗传信息和选择潜力,在育种改良上还有很大空间,可通过品种(系)间杂交等相关育种技术选育出综合品质更加优良的种质,为今后马铃薯农产品加工多样性打下基础;而淀粉和干物率两个指标变异范围较小,变异系数均在9%以下,表明这22份马铃薯种质的这两个性状遗传较为稳定。其中部分马铃薯某些性状在其他地方表现与本地相差较大,可能是与本地今年连续低温阴雨及田间管理有关。
对农作物进行科学合理的评价,需要对各项指标进行综合分析。目前运用多元统计学方法对作物多项农艺性状或者营养品质指标进行综合评价应用广泛,主成分分析法通过无量纲化处理,再把变量降维成几个相互独立的综合变量,使得综合评价更加科学准确[27-28]。王鹏伟[13]、何虎翼等[29]通过主成分和聚类分析对马铃薯种质资源进行综合评价,对研究材料进行等级划分和适应性评价。闫海锋等[26]通过主成分和隶属函数分析,从25份马铃薯种质资源中筛选出6份综合性状较好的品种。本研究选取马铃薯8项性状作为评价22份马铃薯品种(系)综合性状优劣的指标,采用主成分分析将8个指标转换成4个主成分指标,并对综合得分进行排序,同时采用逐步多元回归分析建模验证,然后应用欧式距离对供试材料进行系统聚类分析,初步筛选出DNJ大红心、DNJ小红心、D 15-5(4)-1.4、桂农薯1号、桂彩薯1号、D 18-15(3)-2、D 3-25(39)-1共7份马铃薯优良种质。
综上所述,本试验通过对22份马铃薯种质的株高、主茎数、单产、干物率、还原糖、淀粉、花色苷、蛋白质等性状指标进行系统比较分析,并适用主成分分析和系统聚类分析对马铃薯种质在广西崇左地区的适应性进行综合评价,初步筛选出7份马铃薯优良种质,为筛选适宜广西崇左地区的优良马铃薯品种及推广应用提供科学依据。