APP下载

基于K-means聚类分析的不同种植区烤烟外观质量区域分类

2012-01-17杨明峰魏春阳王信民

中国烟草科学 2012年2期
关键词:油分种植区色度

杨明峰,詹 良,魏春阳,李 锋,王信民

(1.山东中烟工业有限责任公司技术中心,青岛 266101;2.中国烟叶公司,北京 100055;3.中国烟草总公司郑州烟草研究院,郑州 450001)

由于我国各烟草主产区气候、土壤等自然条件不同,以及品种、栽培、调制技术等因素的影响,各主产区生产的烟叶外观质量各具特点,科学、准确地评价不同主产烟区典型生态点的烟叶外观质量,是全国烟叶品质分析评价的重要内容之一。依据烤烟外观质量评价结果,一方面指导烟叶生产技术措施的改进,另一方面为卷烟工业企业的烟叶使用提供参考依据。邓小华等[1]研究表明,湖南产区不同生态区域烟叶外观质量分值是湘南烟区<湘中烟区<湘西北烟区,不同等级、不同生态区域烟叶外观质量类型差异明显。厉福强等[2]分析了贵州湄潭烟叶的外观质量因素特征及相关性和年度稳定性。马莹等[3]对黔西南州烟叶外观质量进行了分析。张国等[4]运用因子分析法对湖南代表烟区烟叶外观质量指标进行了分析,胡建军等[5]应用两阶段聚类法对云南省大理州的部分中部烟叶外观质量进行聚类分析,并应用多元方差分析对聚类效果进行了检验。然而,不同烟草种植区烟叶的外观质量区域分类未见报道。本研究运用K-Means Cluster(快速聚类法)聚类方法分析各烟草种植区烤烟外观质量区域特征及区域分布,为卷烟工业企业合理利用不同产区烟叶原料提供数据参考。

1 材料与方法

1.1 材料

根据全国烤烟主产区生态特点,采集了云南、贵州、四川、福建等18个省112个典型生态点的2009年初烤C3F等级烟叶样品,共112个。每个样品取样量不少于3 kg,品种为该典型生态点种植面积最大的主栽品种。文中对各烟草种植区不同生态点分别用代号表示。

1.2 方法

1.2.1 烤烟外观质量评价指标体系构建及烟草种植区的划分 烤烟外观质量评价指标体系的指标筛选、指标量化方法、鉴定方法、指标权重确定以及烟草种植区的划分参照中国烟草种植区划研究成果[6]。

1.2.2 聚类分析 采用了 K-Means Cluster[7-8]聚类方法,先给定划分的数目 k,划分时首先创建一个初始划分,然后采用一种迭代的重定位技术,尝试通过对象在划分间的移动来改进划分,逐步调整,得到最终分类。划分结果必须同时满足以下2个要求:(1)每个组至少包括1个对象;(2)每个对象必须属于且只属于1个组。

依据生态相似优先的原则,将我国烟草种植区分为北方烟草种植区、黄淮烟草种植区、长江中上游烟草种植区、东南烟草种植区和西南烟草种植区,然后再依据烤烟外观质量特征(颜色、成熟度、叶片结构、身份、油分和色度等6个指标)的相似性,运用K-Means Cluster聚类方法分析各烟草种植区烤烟外观质量区域特征及区域分布。

1.2.3 数据处理方法 数据处理及分析在 Excel 2003、SPSS 11.0等[9]软件的支持下进行。

2 结 果

2.1 5大种植区中部烤烟外观质量分类及区域分布

2.1.1 北方烟草种植区 从烤烟外观质量各类对应颜色、成熟度、叶片结构、身份、油分和色度指标的分值来看(表1、2,图 1),北方烟草种植区中部烤烟外观质量可分为3类。总的来看,第3类各指标是最优的,第1类次之,第2类一般。第3类烤烟外观颜色纯正,成熟度好,叶片结构疏松、富有弹性,身份适中、内含物质充实,富油分,色度强;占样品总数的20.00%。第1类烤烟外观颜色较纯正,成熟度一般,叶片结构较疏松,身份适中,油分有,色度为“强”、“中”界限,各指标相对均衡;占样品总数的60.00%。第2类烤烟外观颜色纯正度一般,成熟度一般,叶片结构较疏松,身份适中偏厚,油分略欠,色度中;占样品总数的20.00%。

表1 最终的类中心Table 1 Final cluster centers

表2 样品类属及其与类中心的距离Table 2 Custer membership

图1 烤烟外观质量分类及比例Fig.1 Classification and proportion of appearance quality of flue-cured tobacco

由表3看出,聚类分析的6个指标在所分的3类中除身份和成熟度指标外都出现了明显的差异。F统计量的相伴概率远小于显著性水平0.05。因此,可以认为将样本分成3类的聚类分析基本上是成功的,聚类效果比较理想。“油分”和“色度”指标在北方烟草种植区烤烟间的差异达极显著水平。

2.1.2 黄淮烟草种植区 由表1、2,图1看出,黄淮烟草种植区中部烤烟外观质量可分为3类。综合来看,烤烟外观质量第3类各指标较优,第2类次之,第1类稍差。第3类烤烟外观颜色纯正,成熟度好,叶片结构疏松、富有弹性,身份适中、内含物质充实,富油分,色度较强;占样品总数11.11%。第2类烤烟外观颜色较纯正,成熟度一般,叶片结构较疏松,身份适中,油分有,色度为“强”、“中”界限,各指标相对均衡;占样品总数的66.67%。第1类烤烟外观颜色纯正度一般,成熟度一般,叶片结构较疏松,身份适中偏厚,油分略欠,色度中;占样品总数的22.22%。

对聚类后形成的各类样本之间作单因素方差分析(表3)表明,6个指标在所分的3类中除身份指标外都出现了明显的差异,所以有5个指标在聚类分析中发挥了明显作用。从方差分析结果看,F统计量的相伴概率远小于显著性水平0.05,因此,可以认为将样本分成3类的聚类分析基本上是成功的,聚类效果比较理想。“叶片结构”指标在黄淮烟草种植区烤烟样品间的差异达极显著水平。

表3 各类样本方差分析检验结果Table 3 ANOVA of various types of samples

2.1.3 长江中上游烟草种植区 由表1、2,图1看出,长江中上游烟草种植区中部烤烟外观质量可分为3类,综合来看,烤烟外观质量第2类各指标较优,第3类次之,第1类一般。第2类烤烟外观颜色纯正,成熟度好,叶片结构疏松、富有弹性,身份适中略欠,富油分,色度强;占样品总数的10.53%。第3类烤烟外观颜色较纯正,成熟度较好,叶片结构较疏松,身份适中,油分有,色度为“强”、“中”界限,各指标相对均衡,占样品总数的63.16%。第1类烤烟外观颜色纯正度稍好,成熟度一般,叶片结构较疏松,身份偏薄,油分略欠,色度中;占样品总数的26.32%。

由表3看出,聚类分析的6个指标在所分的3类中身份、油分和色度出现了明显的差异,所以有3个指标在聚类分析中发挥了明显作用。从方差分析结果看,F统计量的相伴概率远小于显著性水平0.05,因此,可以认为将样本分成3类的聚类分析基本上是成功的,聚类效果比较理想。“身份”和“色度”指标在长江中上游烟草种植区烤烟样品间的差异达极显著水平。

2.1.4 东南烟草种植区 由表1、2,图1看出,东南烟草种植区中部烤烟外观质量可分为3类,综合来看,烤烟外观质量第3类各指标较优,第2类次之,第1类一般。第3类烤烟外观颜色较纯正,成熟度较好,叶片结构疏松、富有弹性,身份适中,富油分,色度强;占样品总数的36.36%。第2类烤烟外观颜色较纯正,成熟度一般,叶片结构较疏松,身份适中,油分有,色度为“强”、“中”界限,各指标相对均衡;占样品总数的45.45%。第1类烤烟外观颜色纯正度稍好,成熟度一般,叶片结构较疏松,身份偏薄,油分略欠,色度为“强”、“中”界限;占样品总数的18.18%。

由表3看出,聚类分析的6个指标在所分的3类中均出现了明显的差异,所以6个指标在聚类分析中都发挥了明显作用。从方差分析结果看,F统计量的相伴概率远小于显著性水平0.05,因此,可以认为将样本分成3类的聚类分析是成功的,聚类效果比较理想。“身份”和“油分”指标在东南烟草种植区烤烟样品间的差异达极显著水平。

2.1.5 西南烟草种植区 由表1、2,图1看出,西南烟草种植区中部烤烟外观质量可分为3类。综合来看,烤烟外观质量第3类各指标是最优的,第1类次之,第2类一般。第3类烤烟外观颜色纯正,成熟度好,叶片结构疏松、富有弹性,身份适中、内含物质充实,富油分,色度强;占样品总数的17.31%。第1类烤烟外观颜色较纯正,成熟度较好,叶片结构较疏松,身份适中,油分有,色度为“强”、“中”界限,各指标相对均衡;占样品总数的67.31%。第2类烤烟外观颜色纯正度一般,成熟度一般,叶片结构较疏松,身份适中偏薄,油分略欠,色度中;占样品总数的15.38%。

从方差分析结果看(表3),F统计量的相伴概率远小于显著性水平0.01,因此,可以认为将样本分成3类的聚类分析是成功的,聚类效果比较理想。烤烟外观各项指标在西南烟草种植区烤烟样品间差异均达极显著水平。

为了检验聚类分析结果,对聚类分析后形成的各类样本之间作单因素方差分析(表3)。聚类分析的6个指标在所分的3类中均出现了明显的差异,所以6个指标在聚类分析中都发挥了明显作用。

3 小 结

5大烟草种植区中部烟叶烤烟样品间均存在明显差异,不同种植区指标差异不同。

北方烟草种植区烤烟样品“油分”和“色度”指标存在极显著差异,烟叶颜色、成熟度和身份一致性较好,但油分不足。

黄淮烟草种植区烤烟样品“叶片结构”指标存在极显著差异,多数烤烟成熟度一般,叶片结构趋紧,应引起重视。

长江中上游烟草种植区烤烟样品“身份”和“色度”指标存在极显著差异,多数烤烟内含物略欠充实,身份偏薄。

东南烟草种植区烤烟样品“身份”和“油分”指标存在极显著差异,多数烤烟内含物略欠充实,身份偏薄,油分略欠。

西南烟草种植区烤烟样品烤烟外观各指标均存在极显著差异,可能与西南烟区立体气候差异有关,多数烤烟颜色、成熟度、叶片结构较好,但油分和色度差异较大。

[1]邓小华,周冀衡,杨虹琦,等.湖南烤烟外观质量量化评价体系的构建与实证分析[J].中国农业科学,2007,40(9):2036-2044.

[2]厉福强,张长云,张长华.贵州湄潭烤烟外观质量因素分析[J].贵州农业科学,2009,37(1):54-57.

[3]马莹,朱云燕,田野,等.黔西南州烟叶外观质量分析[J].中国农学通报,2009,25(4):78-81.

[4]张国,王奎武,朱列书,等.湖南烤烟外观质量指标因子分析[J].中国农学通报,2007,23(2):114-116.

[5]胡建军,周冀衡,张建平,等.两阶段聚类分析在烤烟外观质量评价中的应用[J].农业机械学报,2009,40(6):143-146.

[6]王彦亭,谢剑平,李志宏,等.中国烟草种植区划图册[M].西安:西安地图出版社,2008:1-5.

[7]Tang Q Y, Feng M G.DPS Data processing system:Experimental design, statistical analysis, and data mining[M].Beijing: Science Press, 2007.

[8]高惠璇.应用多元统计分析[M].北京:北京大学出版社,2005.

[9]郝黎仁.SPSS实用统计分析[M].北京:中国水利水电出版社,2002.

猜你喜欢

油分种植区色度
基于Landsat-8遥感数据的冬小麦种植区地表蒸散量时空分布研究
分光光度法测量磷酸的色度
C市主要草莓种植区土壤重金属镉、铅现状调查
不同种植区陇东苜蓿营养价值的比较研究
保质期内莲藕色度值统计分析
大豆关联重组自交系群体蛋白质、油分含量的QTL分析
烤烟油分判定标准的修订与应用探讨
空分气体中油分的定量方法
山楂酒色度测定及其影响因素
玉米—大刍草杂种F1籽粒品质杂种优势分析