基于GECA的成品烟叶内在化学成分聚类分析
2018-01-15张志成侯开虎陈兴侯刘雅琴姚洪发张慧
张志成++侯开虎++陈兴侯++刘雅琴++姚洪发++张慧
摘要:为解决多因素内在化学成分对不同品种烟叶的影响分析,为实现生产过程质量均匀化奠定基础,通过ANTARIS II近红外光谱仪采集不同等级的成品烟叶烟碱、总糖、还原糖、总氮、K和CL六种化学成分含量。采用灰熵关联分析方法,分析分为七个步骤:通过对原始数据进行规格化处理;计算出不同等级烟叶的各评价指标相对于最优参考序列、最差参考序列的关联系数;计算不同等级烟叶不同指标关联系数密度分布值;根据每种指标所占的权重计算权重密度分布值;计算灰色关联熵;计算灰色熵关联度;形成不同等级成品烟叶样品的相对关联度,根据灰色熵关联度进行不同等級烟叶的聚类分析。以麒麟复烤厂的23个等级成品烟的六个化学成分为分析对象,最后聚为五个类别,每个类别在六个指标含量上总是最接近的。通过把灰色熵关联方法建立的烟叶聚类模型与传统感官品吸结论进行比较,证实通过灰色熵关联方法建立的烟叶聚类模型与传统品吸结论比较吻合,可以用此方法对选后烟叶进行分析,建立复烤加工配方的参考模型,有利于提高配方的科学性,在均质化生产模型建立上迈进重要的一步。
Abstract: In order to solve the influence of multi-factor intrinsic chemical composition on different varieties of tobacco leaves, and lay the foundation for achieving the homogenization of the production process the nicotine, different levels of finished tobacco tobacco nicotine, total sugar, reducing sugar, total nitrogen, K and CL six chemical composition content were obtained by ANTARIS II near infrared spectroscopy. Using the gray entropy correlation analysis method, the analysis is divided into seven steps: normalizing the raw data; calculating the correlation coefficient of the evaluation index of different grades of tobacco leaves relative to the optimal reference sequence and the worst reference sequence; calculating different grades and the relative entropy degree of the samples with different grades of finished tobacco leaves, according to the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, Clustering analysis of different grades of tobacco leaves. The six chemical constituents of the 23 grade grades of the Kirin re-drying factory were analyzed for the five categories, each of which was always the closest to the six indicators. he tobacco leaf clustering model established by the gray entropy correlation method was compared with the traditional sensory absorption theory. It was confirmed that the tobacco leaf clustering model established by the gray entropy correlation method was consistent with the traditional method. This method can be used to analyze post-election tobacco leaves, the establishment of re-roasting processing formula reference model is conducive to improving the scientific formula, and in the homogenization of the establishment of an important step in the production model.
关键词:烟叶内在化学成分;加权;灰熵关联分析;聚类分析
Key words: tobacco leaf internal chemical composition;weighting;gray entropy correlation analysis;cluster analysisendprint
中图分类号:S572 文献标识码:A 文章编号:1006-4311(2018)02-0186-05
0 引言
经过近几十年的发展,我国烟叶的总体质量正在稳步的提高,但相对于国外而言,中国的烟叶质量的总体水平并不高。成品烟叶的质量往往是决定卷烟质量的根本,烟叶复烤环节也就成了烟草生产过程中至关重要的环节。朱尊权[1]指出:“烟叶的化学性质和物理性质往往决定烟叶的质量”。左天觉[2]指出:“烟叶的可用性或者说契合性就是烟叶的质量”。复烤过程的质量均匀性和稳定性是提升产品质量的要求。化学成分对均质化生产的研究一直以来都是烟草行业研究的重点,阴耕云[3]等人用化学指标衡量打叶复烤片烟均质性进行了研究;符在德等[4,5]以化学成分均质性为研究目标,进行了化学指标均值性评价和初烤烟精选分级等相关问题。
随着大数据研究浪潮的来临,统计学的诸多方法,已经开始广泛地应用在烟叶质量测评方面,灰色关联分析法就是目前比较常见的基于烟叶化学成分对烟叶质量进行测评的方法。杨进文[6]等人用灰色关联度对烟草不同模块的化学成分进行分析;谭仲夏[7,8]运用灰色关联对不同品种烟叶内在质量进行了分析。灰色关联分析法能够处理样本量不大并且并不一定具有典型分布或线性关系的数据,相对于传统的通经分析、聚类分析和多元回归分析等方法具有更佳的适用性和实用性。
灰色系统利用较少的原始数据进一步挖掘一些未知的信息,目的是寻求体系中的规律,用于解释所研究的问题,其灰色模型对数据的容量大小和概率分布没有严格要求,适用性较强[9]。与此同时,现有的灰色关联方法存在一些缺点:测度值分布离散的情况下测度值大的决定了总体关联度的偏向;计算测度值平均值的办法掩盖了许多测度值的个性,造成信息的损失。基于灰色关联分析方法的缺点,本文采用了改进了的灰关联分析方法,一定程度上弥补了灰关联法的缺点[10,11]。近年来,对模糊系统的问题研究的灰色方法被广泛运用在各种研究中,灰色熵关联分析也被广泛运用,但在烟草行业的研究中还比较少见。
本文采用灰色关联熵方法对麒麟复烤厂成品烟叶的化学成分进行综合评价。通过采集不同等级的成品烟叶样本作为研究对象,利用ANTARIS II近红外光谱仪对烟叶的主要化学成分进行检测,主要检测指标包括:烟碱、总糖、还原糖、总氮、K和Cl,然后利用灰色关联熵分析法,引入不同化学成分的衡量比重,通过相对灰熵加权关联度作为成品烟叶聚类测度,建立成品烟叶内在化学成分的灰色关联熵分析聚类模型。
1 灰色关联熵分析模型
灰色关联分析模型就是对运行机制模糊的灰色关系进行模式化和序列化,然后量化和序化灰色关系,因此对复杂系统建模时灰色关聯分析是研究问题的重要手段。灰色关联分析的原理是通过比较数列与参考数列几何形状的相似程度来判断因素间关联程度,这种方法能够很好的解决线性关系不明确的问题。灰关联分析存在一定的缺点,例如局部点的关联倾向,信息的损失,因此,根据有关的研究[10]认为,灰关联熵分析法能有效的克服灰色关联度分析法的缺点,是改进了的灰关联分析方法。
灰关联熵分析法分析确定因子间影响程度的有效方法,基本步骤:①采用标准化、初值化和均值化等无量纲化方法对原始数据进行转换;②进一步计算出序列对应参考序列的关联系数;③求出灰熵关联分布的密度值;④求出序列灰关联熵;⑤依据序列灰熵关联度的大小进行排序,关联度值越大说明序列间关联性越好。
1.1 参考序列的选择
设选取的样品数为m,选取的评价指标数为n,由此评价单元序列表示为{Xak}(a=1,2,3,…,m;k=1,2,3,…,n;本研究中m=23,n=5)。
灰色关联分析选择一组序列作为参考序列,其他的序列为比较序列,通过比较序列和参考序列的相似程度判断联系的紧密性,参考序列的选择没有既定的标准,一般选择最优参考序列和最差参考序列分别比较。设最优参考序列为{Xsk}(k=1,2,3,…,n),对应所选样本各项指标的最大值,最差参考序列为{Xtk}(k=1,2,3,…,n),对应所选样本各项指标的最小值[12-14]。
1.2 原始数据无量纲化处理
测量指标间的数据差异往往较大,测量数据不统一,无法进行序列之间的比较,应对原始数据进行标准化处理。灰关联度分析的数据规格化处理就是对数据无量纲化处理,无量纲化方法常用的有初值化和均值化,这里采用了均值化对数据进行处理。设处理后的数据为Yik,初始数据为Xik,XK为样本指标均值,公式如下:
Yik=Xik/XK (1)
1.3 关联系数的计算[12-14]
1.3.1 与最优参考序列比较的关联系数按式(2)计算:
)
1.3.2 相对于最差参考序列的关联系数计算公式为:
1.4 关联熵的计算
按照式(4)计算灰色关联系数分布的密度值,按照式(5)计算加权分布密度值,按照式(6)计算灰关联熵,按照式(7)计算灰熵关联度。设各个指标的权重为λk[15]。
1.5 定义并计算相对灰熵关联度
对于最优参考灰熵关联度ri (s)越大,同时对于最差参考灰熵关联度ri (t)越小,表示所评价序列越理想,被比较单元序列{Xik}相对于{Xsk}和{Xtk}的相对灰熵关联度为[10]:
根据相对灰熵关联度的大小对评价的序列进行排序。
2 成品烟叶化学成分的灰色关联度模式聚类分析
2.1 样本数据集的建立
用近红外光谱仪对选定的23个等级成烟的6个化学指标进行测定,并计算其所占的含量百分比,建立评价成品烟叶质量的灰色模式识别数据集,如表1所示。
2.2 原始数据无量纲化处理endprint
将原始数据按公式(1)进行规范化处理,结果如表2所示;并计算各评价单元序列相对最优(差)参考序列的差值。
2.3 关联系数与关联度的计算
根据麒麟复烤厂复烤过程质量控制的标准,各化学成分的权重为:烟碱占0.4;总糖占0.2;还原糖占0.2;总氮占0.1,K占0.05,CL占0.05,依据公式(2),(3),(4),(5),(6),(7)分别计算各评价单元相对于最优参考序列、最差参考序列的关联系数和关联度,结果如表3,4,5所示。
2.4 相对灰熵关联度的计算
依据公式(6)计算23个批次成品烟叶的相对灰熵关联度,并进行排序,确定不同等级成品烟叶化学指标排序,结果如表6所示。
2.5 烟叶品种的聚类分析
通过使用SPSS软件,选择K-均值聚类法根据表6中的灰熵关联度对烟叶品种进行聚类分析,根据最终聚类中心把烟叶品种分为4个等级,如表7所示。与麒麟复烤厂长期以来对烟叶品吸的分类比较,本论文所建立的聚类分析模型与经验所得的分类结论吻合,分类上更加细致准确。
3 小结与讨论
通过采集麒麟复烤厂不同等级的成品烟叶样本,利用检测仪器得出其主要化学成分的各项指标,最后得出了23个等级成品烟叶的相对灰熵关联度,并进行了化学指标含量排序,最后得到表6。再用K-均值聚类法对样本种类进行分类,共分为5个类别,从表7中可以看出,B2F、B3F、B(2F、BB03、BB01、B03等级的烟叶内在化学成分最为接近,B01、CF03、F03、C4C03、CC03等级的烟叶内在化学成分最为接近,YCC03、C3FL、C4X2F、C3X2F、C4F、X03、X30、X2F等级的烟叶内在化学成分最为接近,此结论与传统感官判断得出的结论比较吻合。因此,可以利用灰色系统,加入各化学指标所占的权重,以定义的灰熵相对关联度为测度的方法,对选后烟叶进行分析,建立复烤厂选后烟叶内在化学成分的灰色关联熵聚类模型,代替传统的统感官判断方法来确定烟叶进行配比方案,保证烟叶内在化学成分的均匀性,从而保证产品的质量的均质化。此模型的使用有利于实现烟叶品质判定的数据化和科学化,为不同客户的烟叶配方的确定提供新的数据支撑。
参考文献:
[1]朱尊权.烟叶的可用性与卷烟的安全性[J].烟草科技,2000,8.
[2]左天觉.烟叶质量和可用性理论模型工[J].烟草科技通讯,1977(04):54-61.
[3]阴耕云,徐世涛,侯读成,等.以化学指标衡量打叶复烤片烟均质性的初步研究.中国烟草学会工业专业委员会2010年烟草工艺学术研讨会论文集[C].
[4]符在德.烟叶化学成分检测及其在打叶复烤均质化加工中的研究与应用[D].吉首大学.
[5]李东亮.基于化学成分的烟草质量评价方法研究与应用[D].郑州:河南农业大学,2008.
[6]杨进文,史雨刚,王曙光,等.用灰色关联度对烟草不同模块化学成分分析[J].山西工业大学学报,2013,33(2).
[7]谭仲夏.应用灰色关联对不用品种烟叶内在质量的分析[J].中国农学通报,2006,22(8).
[8]冯连军,朱列书,朱静娴.湖南烤烟烟叶主要物理特性与主要化学指标间的灰色关联度分析[J].安徽农业大学学报,2012,39(1):140-143.
[9]Liu S, Forrest J, Yang Y. A summary of the progress in grey system rese-arch[C]//Grey Systems and Intelligent Services, 2013 IEEE International
[10]张岐山,郭喜江.灰关联熵分析方法[J].系统工程理论与实践,1996(8):7-11.
[11]劉思峰,蔡华,杨英杰,等.灰色关联分析模型研究进展[J]. 系统工程理论与实践,2013,33(8):2041-2046.
[12]谭仲夏,秦西云.灰色关联分析方法在烟草内在质量评价上的应用[J].安徽农业科学,2006,34(5):924.
[13]李硕,李成义,李敏,等.基于灰色关联分析方法评价商品甘草药材质量[J].中国实验方剂学杂志,2015,21(1):89-94.
[14]王平,王云峰.综合权重的灰色关联分析法在河流水质评价中的应用[J].水资源保护,2013(05):52-54,64.
[15]吴喜荣.基于灰关联熵分析法的沥青混合料抗裂性能影响因素分析[J].水利与建筑工程学报,2017(02):92-95,137.endprint