APP下载

基于BPNN的烤烟褐变程度识别及其分类烟叶质量分析

2023-03-31孙光伟郭青青孙敬国张鹏龙吴哲宽李建平陈振国

西南农业学报 2023年1期
关键词:褐化褐变烟叶

孙光伟,郭青青,柳 均,冯 吉,孙敬国,张鹏龙,吴哲宽,李建平,陈振国

(1.湖北省烟草科学研究院,武汉 430030; 2.湖北大学生命科学学院,武汉 430062; 3.湖北省烟草公司烟草质量监督检测站,武汉 430030; 4.湖北省烟草公司恩施州公司,湖北 恩施 445000)

【研究意义】烟叶褐变是烟叶烘烤中常见的现象,是造成烘烤损失的主要因素之一。通过建立烤烟褐变程度识别模型,可实现褐变程度的有效区分,降低烤坏烟损失。【前人研究进展】褐变烟主要是由于烤烟烘烤过程“酶促棕色化反应”造成的[1],即多酚类物质在多酚氧化酶(PPO)的作用下被氧化成醌类物质,然后进一步和其他物质聚合成大分子深色物质[2-4]。烟叶褐变的产生原理已经被提出很多年,前人通过改进农艺措施[5-7]、烘烤工艺[8-10]、添加褐变抑制剂[11-12]等途径使烟叶褐变几率得到了一定缓解,但酶促褐变仍然是造成烟叶烘烤损失的主要原因,尤其是上部叶,其叶片较厚、酚类等内含物含量充足[13],导致烤后烟叶褐变现象较重。烟叶褐变程度与外观质量、内在化学成分含量密切相关,直接影响着烟叶的工业可用性[14]。目前褐变程度轻重主要靠肉眼识别,主观性较强,误差较大[15]。近几年,BP化图像识别在烟叶生产上的应用越来越广泛[16-17],如刘剑君等[18]为量化判别烤烟鲜烟叶成熟度,提出一种基于数字图像处理的成熟度指数计算方法,可实时判别和比较烟叶的成熟度。陈飞程等[19]以烟叶的图像信息建立的烟叶含水率预测模型,可精准把控烟叶过程中含水率的变化。但是BP化图像识别在烟叶褐变程度方面的应用还没有报道。【本研究切入点】以云烟87上部烟叶为样本,通过扫描获取烟叶颜色等特征信息,建立BP神经网络烤烟褐变程度识别模型。【拟解决的关键问题】本研究拟通过建立烟叶褐变程度图像识别BP神经网络模型,探究褐变程度与烟叶质量的关系,明确不同褐变程度对上部烟叶可用性的影响。

1 材料与方法

1.1 试验材料

2018年,在恩施州利川市柏杨镇进行试验,品种为云烟87,土壤为砂壤土,有机质2.71%,pH 5.71,速效氮89.72 mg/kg,有效磷66.45 mg/kg,速效钾190.12 mg/kg,施肥比例m(N)∶m(P2O5)∶m(K2O)=1.0∶1.5∶2.5,行距1.2 m,株距0.55 m。其他技术措施和田间管理按优质烟生产技术规程实施。选取14~16叶位的上部烟叶为供试材料。

1.2 试验设计

图片信息数据准备:由烤烟分级技术人员对烤后上部烟叶300份样本进行褐变程度分类(Browning degree, BD),分为正常(叶片干净鲜亮)、稍褐变(灰褐色斑点零星分布,叶片光泽暗淡)、轻度褐变(褐色斑点零星分布)、中度褐变(灰褐色斑点集块连片,占叶片面积的30%)、重度褐变(灰褐色斑点集块连片,占叶片面积的50%以上)5类,分别设为0、1、2、3和4级。分类结果为:0级65份,1级52份,2级61份,3级54份,4级68份。利用CANON 60D数码相机对样品进行图像采集并保存为JPG格式,图片大小尺寸统一修改为256×256像素(dots per inch,dpi)。然后对图片进行灰度化、二值化、梯度锐化等处理,具体参照卜富清[20]的方法,并将提取R、G和B信息存入Excel中。

BP网络训练与测试:首先对图片信息数据进行随机排序产生随机数据集(Random_Data),从随机数据集抽取图片信息生成输入信息集(Input_Data),利用decodeClassLabels函数将烟叶褐变等级信息(BD_data)编码转化成二进制矩阵,利用splitForTrainingAndTest将按4∶1拆成训练集和测试集,包括训练的输入集(Inputs_Train)、训练的结果集(Target_Train)、测试的输入集(Inputs_Test)和测试的结果集(Target_Test),然后对数据进行标准化处理到[0,1]。利用R语言RSNNS软件包构建全连接神经网络(Multi-Layer Perception,BP)。通过设定不同隐藏层神经元以及迭代次数,获得均方根偏差,最终确定BP参数。在运行中隐藏层神经设置为1~25,迭代次数分别设为100~20 000。

BP神经网络系统识别结果验证:取100份样本,按顺序标号(1~100),首先由BP识别系统对样本进行褐变程度分类,并记录分类等级,然后由人工对样本进行褐变程度分类,并记录分类等级。以人工识别分类为参照,BP识别系统正确率=1-|NBP-NRG|/NRG×100%(NBP为BP神经网络自动识别系统数量,NRG为人工识别数量),总体识别正确率=(1-∑|NBP-NRG|/300)×100%,通过计算皮尔逊相关系数(Pearson correlation coefficient)检验两组数据相似度,利用配对T检验显著性差异,重复3次。为进一步验证BP神经网络识别系统识别结果,在BP识别的样本集中随机分选0、1、2、3、4级烟叶各3份,共计15份样本;在人工识别的样本集中随机分选0、1、2、3、4级烟叶3份,共计15份样本。分别测定外观质量、常规化学成分、TSNAs含量、多酚含量和感官质量,然后进行比对分析,两组数据利用公式皮尔森类似度(Pearson similiarity)进行计算。

1.3 测定项目及方法

随机选取5片烟叶,混合为1次重复,70 ℃烘干至恒重,剔除主脉和较粗的支脉,研磨粉碎过250 μm筛保存。常规化学成分检测采用美国API公司生产的305D型连续流动分析仪参照行业标准测定;多酚含量参照行业标准[21]测定,TSNAs含量采用液质联用[22]测定,外观质量和感官质量由BP神经网络识别和人工识别完成。

1.4 数据处理

采用Excel 2016进行数据处理,利用R语言软件进行多层感知器神经网络分析,建立褐变程度判定模型,利用软件R语言Hmisc软件包进行皮尔森类似度分析。

2 结果与分析

2.1 BP网络训练与测试结果

在BP神经网络构建中,隐蔽节点数分别设为1~25,随着隐蔽层节点数增加训练集和测试集均方根偏差均呈下降趋势,当隐蔽层节点数为16时,训练集和测试集均方根偏差下降趋于平稳,隐蔽节点数设定为16(图1-A);迭代次数从100增加至4000时,训练集和测试集均方根偏差均呈下降趋势,达到0.015,随着迭代次数增加出现上升趋势,5500次以后,训练集和测试集均方根偏差下降趋于平稳(图1-B),当迭代次数为4000时测试集均方根偏差达到极小,为此,选择迭代次数4000次时应停止迭代次数,与之相对应的权重选为实验中的最佳数学模型。在此基础上进行训练集和测试集拟合误差模拟分析,结果显示训练集拟合线(图1-C,红色)和测试集(图1-D,红色)接近黑色对角线,说明在隐蔽节点数为16,迭代次数为4000时为合理的建模参数,写入函数代码后输出BP网络(图1-E)。

A、B为蔽节点数和迭代次数模拟分析;C、D为训练集和测试集拟合误差模拟分析;E为BP神经网络模型输出结果:输入层中RBG为输入色差,隐藏层中H为隐藏节点及编号,输出层中1、2、3、4和5为输出特征代码,BD0、BD1、BD2、BD3和BD4为对应褐变等级。红色连线代表权重值为正,蓝色代表权重值为负,线条粗细代表权重值绝对值大小。B1和B2为偏差参数,设为默认值。

2.2 BP神经网络识别效果验证

300份不同褐变程度烟叶经过BP神经网络识别系统和人工识别后,结果显示,对0、1、2、3和4级识别正确率分别为100%、100%、96.96%、98.44%和98.33%(表1),BP神经网络识别系统总体正确率达到98.75%。

表1 BP神经网络模型检验

2.3 褐变程度和外观质量验证

通过比较分析BP和RG识别的不同级别(0~4)褐变烟叶颜色、成熟度、叶片结构、身份、油分变差和色度以及指数之和等外观质量参数。BP识别(图2-A)和RG识别(图2-B)褐变烟叶随着0~4级褐变程度加重。对于多数样本而言,BP识别和RG识别差异不明显(图2-C);进一步分析发现,R3M2样本人工识别为3级,BP识别为2级,R2B3样本人工识别为2级,BP识别为3级,R3B4样本人工识别为3级,BP识别为4级,而R3B2可以归为2级,R2B3也可以归为3级,这样的样本应该介于两者之间,这对于BP识别系统可能有一定的难度,另外R3B4也与烟筋颜色较深有关(图2-D)。通过烟叶颜色、成熟度、叶片结构、身份、油分和色度等指标对比分析,发现BP识别褐变烟叶外观质量参数与RG识别的变化规律相似(表2,R>0.777,P<0.001)。说明BP和RG识别的不同级别(0~4)褐变烟叶外观质量没有显著差别(T-test,P>0.05)。

表2 BP和RG识别不同褐变程度烟叶外观质量

A.人工识别不同褐化级别烟叶;B.智能识别不同褐化级别烟叶;C.人工识别和智能识别不同褐化级别烟叶单叶比较;D.人工识别和智能识别存在差异的不同褐化级别烟叶。

2.4 常规化学成分分析验证

随着烟叶褐变程度的增加,人工识别褐变烟叶中还原糖、总糖含量逐渐降低,重度褐变与未褐变烟相比还原糖含量显著降低,降幅达17.77%,褐变程度(x)与烤后烟叶还原糖含量(y1)呈负相关,y1=-0.1236x2-0.6047x+ 24.559(R2= 0.9991),可见烟叶发生褐变与糖类过度消耗有关;烟碱、氯离子含量逐渐增加,重度褐变与未褐变烟相比,烟碱含量显著增加,增幅达19.79%;糖碱比、氮碱比、钾氯比降低,内在化学成分的协调性变差。智能识别褐变烟叶中烟碱、还原糖、氯、总糖、总氮和钾的变化趋势与人工识别褐变烟叶的变化趋势基本一致,两组数据间差异不显著(T-test,P>0.05,表3)。两组数据相似度分析显示,钾、氯和总氮含量相似度未达到显著水平,烟碱、还原糖和总糖含量显著相似(图3)。

A、B、C、D、E和F分别为烟碱、还原糖、钾、氯、总糖和总氮含量相似系数及显著性;*表示显著值小于0.05,达显著水平;*** 表示显著值小于0.001,达极显著水平。

表3 不同褐化程度的烟叶化学成分

2.5 多酚含量分析验证

随着烟叶褐变程度的增加,人工识别褐变烟叶中适当褐变引发的轻微褐变绿原酸、芸香苷等多酚含量增加;随着烤后烟叶褐变程度的加重,绿原酸含量逐渐降低,莨菪亭含量逐渐升高,芸香苷含量先升高后降低,重度褐变烟叶绿原酸、多酚总量显著降低。褐变程度(x)与烤后烟叶绿原酸含量(y2)呈一元二次关系,y2=-0.3457x2+ 0.9029x+ 10.085(R2=0.9896)。智能识别褐变烟叶中绿原酸、莨菪亭、芸香苷和多酚总量的变化趋势与人工识别褐变烟叶的变化趋势基本一致(表4)。两组数据相似度分析显示,绿原酸、莨菪亭、芸香苷和多酚总量相似度均达到显著水平(图4,R≥0.59,P<0.05)。

A、B、C和D的分别为绿原酸、莨菪亭、芸香苷和多酚总量相关性分析;R为相似系数,P为显著值。

表4 不同褐变程度烟叶多酚含量

2.6 TSNAs含量分析验证

从表5可以看出,随着褐变程度的增加烟叶TSNAs含量逐渐增加,褐变程度(x)与烤后烟叶TSNAs含量(y3)呈正相关,y3=-1.3121x2+62.69x+435.76(R2=0.9974),烟叶发生褐变后吸食安全性降低,重度褐变烟叶与未褐变相比,TSNAs总量增幅达53.84%。智能识别褐变烟叶NNN、NNK、NAT和NAB的变化趋势与人工识别褐变烟叶的变化趋势基本一致,两组数据间差异不显著(T-test,P>0.05,表5)。两组数据变化趋势分析发现,智能识别褐变烟叶NNN、NNK、NAT和NAB与人工识别的变化趋势基本一致(图5,R≥0.85)。

表5 不同褐变程度烟叶TSNAs含量

2.7 感官质量分析验证

从表6可以看出,人工识别和智能识别的未褐变烟叶、稍褐变烟叶为一档,香气质感较清晰,烟气柔顺、蓬松感较好,余味较舒适,浓度劲头中等;与未褐变烟叶相比,稍褐变烟叶香气量有所增加,烟气稍柔顺,浓度劲头中等;随着褐变程度的增加,烟叶感官质量逐渐降低,主要表现在香气质、余味变差,杂气加重;轻度褐变烟为二档,香气质感较好,杂气略重,余味稍欠舒适,烟气尚柔顺,浓度中等,劲头略偏大;褐变达到中度及以上程度,香气质、香气量明显下降,香气质感较差,烟气粗糙,杂气稍重,杂味较多,余味舒适性较差(表6)。

3 讨 论

褐变烟叶是烤坏烟占例最大的一类烟叶,也是影响交售等级最大的问题[22]。目前生产上褐变烟的收购主要通过验级员的主观判断,缺乏客观数据支撑,部分具有可用性的褐变烟叶定为杂色烟不予收购,经济损失较重。马建元[23]和李胜[24]采用计算机图像处理技术初步建立了烤烟等级的BP网络识别模型,为不同褐变程度烟叶的智能化识别提供了参考。本研究基于BP网络构建烤烟褐变程度识别模型,并对比分析BP网络识别与人工识别效果及分类烟叶质量,为客观评价不同程度褐变烟叶提供了技术支持,是烤烟分级图像识别的重要补充,建立的褐变程度识别模型能有效区分不同褐变程度烟叶的可用性。

BP网络构建通过反复计算和修正,确保网络架构趋于稳定、输出层的输出值达到期望标准,其核心在于降低输出层实际输出和期望标准值存在误差。本文中通过设置不同的隐藏节点数和迭代次数,发现隐藏节点为16,迭代次数4000次为最佳模型参数,训练集和测试集拟合误差模拟分析结果也证实了该参数条件下拟合度最佳并输出BP网络模型。通过BP构建的神经网络只是数字化模拟结果,是否能适用于实际生产,有必要通过实际验证。以人工识别结果为标准,BP神经网络识别所识别的300份样本中,0级47份,正确率100%,1、2、3和4级识别正确率分别为100%、96.96%、98.44%和98.33%。BP神经网络对小麦群体图像绿色面积识别精度为85.43%,对叶面积的平均识别精度为86.38%[25],烤烟烟叶图像特征提取和质量分级研究中BP网络平均识别率为80%[24],基于图像处理的烤烟烟叶质量分级的关键技术研究识别率为92%~96%[22],而本文所构建的烟叶褐化识别网络精准度达98.75%。本研究中仅针对褐化所涉及到的特征数据比较单一,从而获得较高的精准度。

烟叶发生酶促褐变对内在质量也有较大影响,与还原糖、总糖含量降低,化学成分协调性变差,感官评吸质量变化有关[15]。本研究中,智能识别褐变烟叶随着程度增加,常规化学成分、多酚含量、TSNAs含量和感官质量变化与人工识别的变化基本一致,而且与其他研究结果也基本一致[15,25-26],说明智能识别的褐变烟叶表征与内在品质相符合。识别分类的烟叶内在质量差异较大、区分性较好,通过烟叶质量分析表明分类的中度褐变烟叶化学成分较协调,多酚含量较高、TSNAs含量较低,感官评吸香气质感较好,具有一定的可用性,挽救了部分损失。因此,智能识别系统能够比较精准的识别褐化烟叶,为烤烟收购杂色烟分级争议提供客观评价。但本研究中还有一些问题有待研究,比如R3M2样本人工识别为3级,BP识别为2级,R2B3样本人工识别为2级,BP识别为3级,R3B4样本人工识别为3级,BP识别为4级,而R3B2可以归为2级,R2B3也可以归为3级,这样的样本应该介于两者之间,这对于BP识别系统可能有一定的难度,有必要增加图片的分辨率,或者增加烟叶的其他表征信息(如纹理特征),剔除主支脉颜色偏差从而提高识别准确率。

4 结 论

本文基于BP神经网络建立烟叶褐变程度图像智能识别模型,代替传统的肉眼鉴别,鉴别结果更客观准确,识别准确率为98.75%;智能识别褐变烟叶表征与内在品质相符合,为实现烟叶褐化等级智能化和规模化应用提供了参考信息。

猜你喜欢

褐化褐变烟叶
梨矮化砧木‘中矮1号’离体培养中褐化现象的抑制研究
外源乙烯处理对黄冠梨果皮褐变和货架期品质的影响
温185核桃内种皮褐化程度与土壤相关性分析
‘洛阳红’牡丹腋芽培养过程中褐化的防止技术研究
不同处理对牡丹叶柄离体培养时褐化的影响
关于新形势下烟叶生产可持续发展的思考
烟叶主要真菌病害的发生与防治
影响牡丹石榴外植体褐变的因素分析
一种降低造纸法再造烟叶平滑度的方法
湘西上部烟叶化学成分特征及聚类分析