主成分与聚类分析在NC297烟叶品质区域划分中的应用
2019-09-19张忠武陈拾华杨景华王建新段宗颜邹炳礼周绍松董石飞
周 敏, 张忠武, 陈拾华, 杨景华, 王建新,段宗颜,鲁 耀, 邹炳礼, 周绍松*, 董石飞, 李 伟, 张 静
(1.云南省农业科学院 农业环境资源研究所, 云南 昆明 650205; 2.红云红河烟草(集团)有限责任公司, 云南 昆明 650231)
品种单一与退化现象已经成为目前国内烤烟生产面临的主要问题[1],解决这些问题的有效途径是引进优良品种,同时也是卷烟企业对品牌导向型原料需求的重要举措[2-3]。烤烟种植区域的气候特点是形成不同烤烟特色的主要因子,在烤烟生长发育的各个时期,光照、温度、水分和土壤等因子都直接影响烤烟的品质[4-6]。一直以来,烟草主要是依靠烟叶的外观质量和感官质量对其进行品质评价,受主观因素的影响较大。在烤烟品种区域适应性综合评价时通常采用因子分析法分析烤烟的主要化学成分,或在此基础上与烤烟的感官质量评价得分进行对比验证[7-9],但这些评价方法并不能完全客观地评价烤烟品种的区域适应性,仍然存在一定的主观性。1998年美国金叶种子公司育成的杂交F1代烤烟品种NC297,2000年成为美国北卡州官方品种试验的推广品种。该品种具有抗黑胫病、青枯病、TMV和南方根结线虫,以及易烘烤和香气质好等特点。云南中烟工业公司2006年从美国引进NC297品种,其生产的烟叶符合云烟高端卷烟品牌的原料需求。但在引种试验中发现其区域适应性不广,在不同区域种植时烟叶经济性状差异较大,在部分区域种植经济性状偏低。为此,采用主成分分析法,对云南昆明、红河和文山种植的NC297烟叶主要化学成分和感官质量指标进行综合评价,利用系统聚类法对NC297的适宜种植区域进行划分,以期为NC297在云南烟区的合理布局提供理论依据。
1 材料与方法
1.1 材料
烟叶样品:烤烟品种为NC297,B2F和C3F烟叶样品各154个,2016年采自云南省昆明、红河和文山3个(市、州)的12个县31个乡镇。
1.2 方法
1.2.1 指标测定 烟叶的化学成分指标有总氮、烟碱、还原糖、钾、淀粉、糖碱比、氮碱比和钾氯比;烟叶感官质量评价指标有香气量、香气质、口感和杂气。按文献[10]的方法进行化学成分测定。按文献[11]的方法进行感官质量评价。
1.2.2 原始数据标准化处理 由于化学成分和感官质量各项指标的量纲不一致,有较大的数量级差异。所以,通过对各项指标进行标准化处理消除量纲和数量级对综合评价带来的不良影响。数据标准化转化的公式如下:
1.2.3 主成分分析 选择12个成分均值化后的数据进行主成分分析,得出解释的总方差。
1.2.4 聚类分析 将31个种植区域的B2F和C3F烟叶样品主成分综合得分经标准化法处理后,以卡方距离为衡量各种植区域烟叶样品间综合品质差异大小的指标,采用离差平方和法对B2F和C3F烟叶样品综合得分进行系统聚类分析。
1.2.5 最适种植区域的确定 因为主成分一般不只1个,采用1个主成分对NC297最适种植区域进行综合评价不易作出准确的判定。选取B2F的x个主成分和C3F的y个主成分的方差贡献率作为权重系数,利用其主成分分值(Fx和Fy)构建NC297最适种植区域的综合评价数学模型,得到B2F烟叶的x个主成分和C3F的y个主成分与原12项化学指标和感官质量指标的标准化数据的线性组合以及综合得分公式,求得31个种植区域的B2F和C3F烟叶样品主成分综合得分,综合得分越高,该种植区域烟叶样本的综合品质越好。
1.3 数据处理
采用 Excel 2007处理数据,采用DPS 15.0进行主成分分析、相关分析和系统聚类[12]。
2 结果与分析
2.1 NC297各个指标的标准化相关系数
从表1可知,NC297的B2F烟叶烟碱与钾、糖碱比、氮碱比、钾氯比、香气量、香气质、口感和杂气呈极显著正相关,与还原糖呈显著正相关;总氮与还原糖、糖碱比、香气质和杂气呈极显著正相关;还原糖与糖碱比、香气量、香气质、口感和杂气呈极显著正相关;钾与钾氯比、香气量、香气质、口感和杂气呈极显著正相关;糖碱比与香气量、香气质、口感和杂气呈极显著正相关;氮碱比与香气量呈显著正相关;钾氯比与香气量和口感呈极显著正相关,与香气质呈显著正相关;香气量与香气质、口感和杂气呈极显著正相关;香气质与口感和杂气呈极显著正相关,口感与杂气呈极显著正相关。
从表2看出,NC297的C3F烟叶烟碱与钾、糖碱比、氮碱比、香气质、口感和杂气呈极显著正相关,与香气量呈显著正相关;钾与钾氯比、香气量、香气质和口感呈极显著正相关,与氮碱比和杂气呈显著正相关;糖碱比与氮碱比呈显著正相关;钾氯比与香气量、香气质、口感和杂气呈显著正相关;香气量与香气质、口感和杂气呈极显著正相关;香气质与口感和杂气呈极显著正相关,口感与杂气呈极显著正相关。由于存在相关性,在进行综合评价时如果直接采用这些指标分布状况,信息重叠将会不可避免,最终致使评价结果失真。
表1 B2F烟叶化学成分及感官质量评价指标间的相关系数
注:*和**分别表示相关性显著(P<0.05)和极显著(P<0.01),下同。
Note: *and ** indicate significant correlation(P<0.05) and extremely significant correlation(P<0.01). The same below.
表2 C3F烟叶化学成分及感官质量评价指标间的相关系数
2.2 主成分分析
从表3和表4可知,B2F烟叶特征根>1的成分有3个,即成分1、成分2和成分3,其特征根分别为6.190、1.797和1.236,3个成分(因子)可解释76.860%的累计方差贡献率。因此,B2F烟叶的主成分为成分1~3,即第1主成分(Y1)、第2主成分(Y2)和第3主成分(Y3)。Y1的贡献率为51.580%,香气量、香气质、口感、杂气、烟碱和糖碱比有较大的正系数,所以第1主成分反映的是感官质量和化学品质的正相关关系,可称为B2F烟叶感官品质指数;Y2的贡献率为14.977%,氮碱比和钾氯比有较大的正系数,可称为B2F烟叶化学品质指数;Y3的贡献率为10.303%,淀粉有较大的正系数,可称为B2F烟叶淀粉指数。B2F烟叶第1主成分的特征向量分别乘以12个原始变量标准化之后的变量即为B2F烟叶第1主成分的函数表达式,同理可以得出B2F烟叶第2~3主成分的函数表达式:Y1=0.323X烟碱+0.201X总氮+0.265X还原糖+0.262X钾+0.042X淀粉+0.328X糖碱比+0.134X氮碱比+0.293X钾氯比+0.093X香气量+0.208X香气质+0.231X口感+0.046X杂气;Y2=0.265X烟碱-0.532X总氮-0.321X还原糖+0.217X钾+0.060X淀粉-0.176X糖碱比+0.537X氮碱比+0.355X钾氯比+0.128X香气量-0.071X香气质-0.009X口感-0.162X杂气;Y3=-0.125X烟碱+0.057X总氮-0.361X还原糖-0.055X钾+0.705X淀粉-0.288X糖碱比-0.368X氮碱比+0.235X钾氯比+0.120X香气量+0.159X香气质+0.143X口感+0.131X杂气。
C3F烟叶特征根>1的成分有4个,即成分1、成分2、成分3和成分4,其特征根分别为5.125、1.863、1.277和1.172,4个成分(因子)可解释78.648%的累计方差贡献率。因此,C3F烟叶的主成分为成分1~4,即第1主成分(Y1)、第2主成分(Y2)、第3主成分(Y3)和第4主成分(Y4)。Y1的贡献率为42.711%,香气量、香气质、口感、杂气、烟碱和钾有较大的正系数,所以第1主成分反映的是感官质量和化学品质的正相关关系,可称为C3F烟叶的感官品质指数;Y2的贡献率为15.523%,烟碱、还原糖、糖碱比和氮碱比有较大的正系数,可称为C3F烟叶的化学品质指数;Y3的贡献率为10.645%,淀粉有较大的正系数,可称为C3F烟叶淀粉指数;Y4的贡献率为9.768%,总氮有较大的正系数,可称为C3F烟叶总氮指数。C3F烟叶第1主成分的特征向量分别乘以12个原始变量标准化之后的变量即为C3F烟叶第1主成分的函数表达式,同理可以得出C3F烟叶第2~4主成分的函数表达式:Y1=0.320X烟碱-0.111X总氮-0.061X还原糖+0.310X钾-0.040X淀粉+0.209X糖碱比+0.248X氮碱比+0.255X钾氯比+0.369X香气量+0.406X香气质+0.402X口感+0.389X杂气;Y2=0.424X烟碱+0.059X总氮+0.356X还原糖+0.030X钾-0.329X淀粉+0.506X糖碱比+0.384X氮碱比-0.024X钾氯比-0.243X香气量-0.189X香气质-0.178X口感-0.224X杂气;Y3=0.158X烟碱-0.594X总氮+0.362X还原糖+0.038X钾+0.524X淀粉+0.265X糖碱比-0.352X氮碱比-0.118X钾氯比+0.022X香气量-0.084X香气质-0.004X口感+0.224X杂气;Y4=0.020X烟碱+0.362X总氮+0.158X还原糖-0.446X钾+0.099X淀粉+0.210X糖碱比+0.010X氮碱比-0.659X钾氯比+0.226X香气量+0.199X香气质+0.176X口感+0.187X杂气。
表3 B2F及C3F烟叶化学成分及感官质量评价指标解释的总方差
表4 B2F及C3F烟叶化学成分及感官质量评价指标主成分的特征向量
2.3 NC297最适种植区域的筛选
试验结果表明,NC297最适种植区域的综合评价数学模型为YB2F=0.671F1+0.195F2+0.134F3,YC3F=0.543F1+0.197F2+0.135F3+0.124F4。在31个种植区域中,砚山干河、广南珠琳和广南莲城的B2F烟叶综合品质最好(表5),麻栗坡大坪的C3F烟叶综合品质最好(表6)。
表5NC297不同种植区域B2F烟叶的主成分分值
Table 5 Principal component score of B2F from different planting areas of NC297
表6NC297不同种植区域的C3F烟叶主成分分值
Table 6 Principal component score of C3F from different planting areas in NC297
2.4 聚类分析
从图1和表7看出,当距离系数为2.30时,在31个种植区域的B2F烟叶综合品质可分为5类。第1类种植区域包括砚山干河、广南珠琳、广南莲城、西畴西洒、马关仁和、砚山阿猛和西畴兴街,该类区域的烟叶综合品质得分≥1.272分,综合品质平均得分为1.941分,该类种植区域的烟叶综合品质好。第2类种植区域包括砚山盘龙、砚山者腊、马关大栗树、马关马白、马关八寨、广南杨柳井和麻栗坡大坪,该类区域的烟叶综合品质≥1.045分,综合品质平均得分为1.538分,该类种植区域的烟叶综合品质较好。第3类种植区域包括泸西午街铺、砚山平远、安宁县街、嵩明杨桥、泸西白水、蒙自鸣鹫、砚山江那、嵩明嵩阳、泸西中枢、宜良马街和泸西向阳,该类区域的烟叶综合品质得分≥-1.768分,综合品质平均得分为-1.104分,该类种植区域的烟叶综合品质中等。第4类种植区域包括嵩明杨林、石林鹿阜和泸西金马,该类区域的烟叶综合品质得分≥-1.881分,综合品质平均得分为-1.799分,该类种植区域的烟叶综合品质稍差。第5类种植区域包括泸西永宁、蒙自老寨和蒙自西北勒,该类区域的烟叶综合品质得分≥-2.554分,综合品质平均得分为-2.272分,该类种植区域的烟叶综合品质差。
当距离系数为2.25时,在31个种植区域的C3F烟叶综合品质同样可分为5类。第1类种植区域包括砚山盘龙、砚山者腊、砚山干河、砚山阿猛、广南莲城、广南杨柳井、西畴西洒、西畴兴街、麻栗坡大坪、马关马白、马关大栗树、马关八寨和马关仁和,该类区域的烟叶综合品质得分≥0.634分,综合品质平均得分为1.134分,该类种植区域的烟叶综合品质好。第2类种植区域包括石林鹿阜、蒙自老寨和广南珠琳,该类区域的烟叶综合品质得分≥-1.171分,综合品质平均得分为0.064分,该类种植区域的烟叶综合品质较好。第3类种植区域包括宜良马街、嵩明嵩阳、泸西中枢、泸西午街铺和砚山平远,该类区域的烟叶综合品质得分≥-0.515分,综合品质平均得分为0.028分,该类种植区域的烟叶综合品质中等。第4类种植区域包括嵩明杨桥、泸西向阳、泸西金马、泸西白水、泸西永宁和蒙自鸣鹫,该类区域的烟叶综合品质得分≥-1.873分,综合品质平均得分为-1.251分,其烟叶综合品质为“稍差”。第5类种植区域包括嵩明杨林、安宁县街、蒙自西北勒和砚山江那,该类区域的烟叶综合品质得分≥-2.878分,综合品质平均得分为-1.892分,其烟叶综合品质为“差”。
图1 NC297不同种植区域B2F 及 C3F烟叶综合得分的系统聚类
表7 NC297的B2F 及 C3F烟叶综合品质不同类别的样本分布
3 结论与讨论
应用主成分分析法研究烤烟品质区域划分,通常先对烟叶化学成分进行相关性分析及主成分分析,然后再把化学成分的主成分得分与感官质量得分进行符合性评价[7,9,13],或把外观质量评价、感官质量、经济性状和致香成分进行相关性分析及主成分分析[14],或仅对烟叶化学成分[8]、化学成分与物理性状[15]、外观质量与化学成分[16]或致香成分[17-18]、物理性状[19]进行相关性分析及主成分分析,最终得出烤烟品种品质区域划分结论。有采用雷达图[20-21]、AMMI(加性主效应和乘积交互作用模型)[22]、主成分分析结合聚类分析应用外观质量[23]对烤烟品种品质区域进行划分,采用灰色多层次综合评判与系统聚类法对烤烟品质进行区划[24]、也有采用光照因子和热量因子,利用系统聚类方法对烤烟生态区域进行划分[25]。
由于卷烟工业企业更为关注烤烟化学成分和感官质量的协调性,因此,寻求更加全面、准确地对烤烟品种进行品质区域划分具有重要意义。将NC297的B2F和C3F烟叶的主要化学成分指标和感官质量评价指标进行相关性分析及主成分分析,然后通过系统聚类对其进行品质区域划分表明,NC297在云南省的昆明、红河和文山3个市(州)31个种植区域可分为5类。第1类种植区域包括砚山干河(B2F、C3F)、广南莲城(B2F、C3F)、西畴西洒(B2F、C3F)、马关仁和(B2F、C3F)、砚山阿猛(B2F、C3F)、西畴兴街(B2F、C3F)、砚山盘龙(C3F)、砚山者腊(C3F)、广南杨柳井(C3F)、麻栗坡大坪(C3F)、马关马白(C3F)、马关大栗树(C3F)和马关八寨(C3F),烟叶综合品质好。第2类种植区域包括砚山盘龙(B2F)、砚山者腊(B2F)、马关大栗树(B2F)、马关马白(B2F)、马关八寨(B2F)、广南杨柳井(B2F)、麻栗坡大坪(B2F)、石林鹿阜(C3F)、蒙自老寨(C3F)和广南珠琳(C3F),烟叶综合品质较好。第3类种植区域包括宜良马街(B2F、C3F)、嵩明嵩阳(B2F、C3F)、泸西中枢(B2F、C3F)、泸西午街铺(B2F、C3F)、砚山平远(B2F、C3F)、安宁县街(B2F)、嵩明杨桥(B2F)、泸西白水(B2F)、蒙自鸣鹫(B2F)、砚山江那(B2F)和泸西向阳(B2F),烟叶综合品质中等。第4类种植区域包括泸西金马(B2F、C3F)、嵩明杨林(B2F)、石林鹿阜(B2F)、嵩明杨桥(C3F)、泸西向阳(C3F)、泸西白水(C3F)、泸西永宁(C3F)和蒙自鸣鹫(C3F),烟叶综合品质稍差。第5类种植区域包括蒙自西北勒(B2F、C3F)、泸西永宁(B2F)、蒙自老寨(B2F)、嵩明杨林(C3F)、安宁县街(C3F)和砚山江那(C3F),烟叶综合品质差。
云南作为中国最大的烟叶产区,其生态区域特性差异较大,不同的品种在不同的生态区域的表现不同[26-30],该研究结果也印证了这一点。为了更好地丰富中国烟草品种的种质资源,为烟叶生产提供更多适应性强、表现好的优质烟叶品种,引进更多的国外品种资源,在不同的生态区域进行区试和示范性试验,是加速中国优质烟叶品种本土化和品种更新换代、促进烟叶生产可持续发展的重要措施之一。