基于BP神经网络的烟叶醇化感官质量仿真模拟
2020-05-14邓羽翔李东亮陈思昂
邓羽翔 - 罗 诚 李东亮 - 杨 杰 周 东 杜 薇 陈思昂 -
(四川中烟工业有限责任公司技术中心,四川 成都 610066)
烟叶发酵是卷烟加工中极为重要的环节,良好的发酵工艺可以改善烟叶品质,降低烟叶青杂气和刺激性,使烟草特征香气显露,显著提高其可用性[1]。打叶复烤后烟叶需自然醇化,醇化会使烟叶内主要化合物和致香成分发生急剧的变化[2-3],经相关性分析和回归分析发现主要化学成分与感官质量存在直接或间接的关系[4-7]。杨波等[8]对四川凉山会理的烟叶进行了跟踪仓储试验,采用了描述统计和回归分析拟合了烟叶醇化品质变化的曲线方程,得到了烟叶适宜的醇化时间。刘红光等[9]发现复烤片烟感官品质和化学成分可用性指数(CCUI)随醇化时间的延长均呈现先上升后下降的变化趋势。对于烟叶醇化感官评价研究,大多数研究仅限于传统的数理统计方法,包括一般线性相关性分析、主成分分析、多元回归分析、曲线回归分析、逻辑回归分析、因子分析等,这类统计方法在定性研究中能够快速找到规律性,但目前已知影响烟叶醇化质量的主要因子是微生物群落在一定温度、相对湿度、氧气浓度下发生的生化、物理反应,而烟叶醇化质量不能仅以感官质量中的杂气、刺激性或主要化合物和致香成分含量所决定,选用何种因子和因子采用何种表达式是一种推测,影响了因子的多样性和某些因子的不可测性,使得回归分析在某些情况下受到限制,且无法达到有效预测效果。
神经网络的优点在于它具有模拟多变量而不需要对输入变量做复杂的相关假设的能力[10]。杨淑娥等[11]研究表明,经过BP(Back Propagation)神经网络训练可避免重复的因子表达,在指标间相关度较高、呈非线性变化,或数据缺漏不全的情况下仍可得到比较满意的结果。试验拟通过对醇化周期内烟叶感官质量评分进行BP神经网络训练,对烟叶醇化过程中感官质量变化的预测方法进行研究,旨在建立BP神经网络模型,为仓储环节烟叶周转、配方设计使用提供指导。
1 材料和方法
1.1 材料
醇化样品:2012年广东南雄、云南曲靖、福建三明、河南洛阳、重庆丰都、四川凉山6个产区的打叶复烤后的片烟,每个产区均包含上(B2F)、中(C3F)、下(X2F)3个部位等级,共计18种片烟样品,四川中烟工业有限责任公司。每种样品各取同一批次的成品片烟24件,分别存放于四川中烟工业有限责任公司的成都多宝寺仓库、成都多宝寺气调仓库、什邡李子园仓库、西昌新厂仓库进行自然醇化,每种样品每个仓库存放6件。
1.2 试验设备
卷烟机:ZB25型,上海烟草机械厂。
1.3 方法
1.3.1 醇化后样品取样及卷烟样品制备 从复烤片烟入库起,以每6个月为周期对醇化的片烟样品取样,试验周期36个月,共取样6次。抽样方法按GB/T 19616—2004,每次随机取1箱(下次取样时,排除前期已取样的烟箱),从上、中、下3个取样点,每个取样点取5 kg左右。剔除烟叶中残留的烟梗后,将烟片切成1.0 mm左右的烟丝。切丝前要求烟叶的水分在12%左右,若烟叶较湿,采用自然晾干的方法平衡水分,若烟叶较干,采用蒸锅来增大水分。切丝后,将烟丝混合均匀,采用四分法保留500 g,用于评吸卷烟样品的卷制。在同一机台,按照“娇子(时代阳光)”工艺标准,进行卷烟样品的卷制。
1.3.2 感官评吸方法 采用“九分值”行业单料烟感官评价方法[12],从香气特性、烟气特性、口感特性三方面进行评价,其中:香气特性包括香气质、香气量、丰满程度及杂气,烟气特性包括浓度、劲头、细腻程度及成团性,口感特性包括刺激性、干燥感、干净程度、甜度及余味。
1.3.3 训练样本集的准备 6位感官评吸专业人员按“九分值”单料烟感官评吸方法每隔6个月,共6次感官评吸,结果见表1。
表1 样本的感官评吸总分描述性统计
2 综合评分指数的构建与等级划分
基于主成分分析分别对4个仓库在6个时间节点年的感官评吸结果进行因子分析、指数构建与等级划分。以成都多宝仓库为例。
2.1 综合指数的构建
根据主成分分析方法的原理,以因子方差累计贡献率>80%为准则来提取主成分因子[13]。由表2可知,3个因子解释了18个指标91.64%的方差。因此提取前3个主成分可以代替整体信息。
表2 主成分分析结果
根据SPSS算出成分载荷矩阵,再用载荷矩阵中的指标系数除以对应各个主因子的特征根,得出各个原始变量的系数,进一步得到因子得分系数矩阵,主成分因子表示:
F1=0.774x1+0.661x2+0.114x3+0.669x4+0.873x5+0.859x6+0.503x7+0.901x8+0.930x9+0.837x10+0.913x11+0.863x12+0.959x13+0.968x14-0.797x15+0.971x16+0.971x17+0.846x18,
(1)
F2=-0.144x1+0.272x2+0.758x3+0.279x4+0.246x5+0.473x6-0.843x7-0.410x8-0.034x9+0.465x10-0.176x11+0.187x12-0.023x13-0.133x14+0.456x15-0.234x16-0.039x17+0.299x18,
(2)
F3=0.399x1-0.268x2-0.492x3+0.559x4-0.367x5-0.194x6-0.182x7-0.137x8-0.148x9+0.277x10+0.288x11-0.202x12+0.130x13-0.162x14+0.363x15+0.005x16+0.117x17+0.322x18。
(3)
根据因子的贡献率,将每个变量的原数据代入,即可得到每个变量的综合评价得分,计算公式为:
(4)
综合评分结果如表3所示,评分越大则等级越高,评分越小则等级越低。
表3 各个仓库烟叶醇化度综合评分
2.2 评分等级的划分
取各个地区各个时间节点的综合指数的前3个四分位数,得到3个等级临界值,将醇化得分指数划分为4个区间,即对各个仓库评分进行等级划分。划分区间即可确定每个仓库对应时间节点相应的烟叶醇化等级,见表4。
表4 烟叶醇化度等级评分
3 BP神经网络在模拟应用中的训练与应用
BP神经网络具有任意复杂的模式分类能力和优良的多维函数映射能力,解决了简单感知器不能解决的异或(Exclusive OR,XOR)和一些其他问题。从结构上讲,BP网络具有输入层、隐藏层和输出层见图1。从本质上讲,BP算法就是以网络误差平方为目标函数、采用梯度下降法来计算目标函数的最小值[14]。
根据BP神经网络模型原理,需将采集到烟叶醇化得分指标数据划分为训练集、检验集和预测集。具体而言,将4个仓库中的前4个时间节点的样本数据作为网络模型的训练集,以后第5个时间节点(间隔30个月)的数据作为检测集,以最后时间节点(间隔36个月)作为预测集,对4个仓库的烟叶醇化度进行检验与预测。
图1 BP神经网络映射结构图
3.1 BP神经网络模型建立
采用Matlab软件对烟叶醇化得分模型进行训练。调用Trainlm函数网络对输入数据和期望输出值进行神经网络训练,训练策略采用调节训练次数和期望误差进行对比试验,使实际输出值和期望输出间的误差达到最小。当达到较合适的期望误差值,则网络的训练结束。确定较合适的值是通过不断调整隐含层神经元个数来确定的,一般认为增加隐含层可以降低网络误差,提高精度,但也会使网络复杂化,增加了网络的顺联时间和出现“过拟合”,通过试验可知增加隐含层神经元个数来获得较低的误差,其训练效果要比增加隐含层层数更容易实现[15]。其输入数据为4个仓库中的前4个时间节点的72组数据,建立的BP神经网络模型的输入层节点有11个,试验对比确认网络误差最小时对应隐含层节点为10;对应的期望输出值则是根据综合指数和烟叶醇化等级划分区间,该仓库不同种类的烟叶醇化等级,模型输出层节点有4个。当网络性能达到期望误差要求时训练结束,网络训练学习率为0.01,将期望误差设置为1.00E-06。网络训练的误差拟合图见图2,BP神经网络训练界面见图3。
3.2 BP神经网络模型的检验
期望目标输出由主成分因子分析法得出的烟叶醇化综合指数转化而来,BP神经网络模型检验通过比较实际输出和期望目标输出大小判断,若实际输出小于期望目标输出,判断模型准确性较高,反之较低。采用样本数据中第5个时间节点(间隔30个月)数据作为检验集,将其烟叶醇化度等级状况与期望的目标输出进行检验,误差较小则表示模型通过检测。由表5中模型的检验输出烟叶醇化度等级状态与期望输出结果基本一致,模型检验结果较满意,表明网络有较好的预测效果。
图2 BP神经网络误差拟合图
图3 BP神经网络训练
表5 BP神经网络模型的检验输出与期望输出对比
3.3 基于BP神经网络的预测
如神经网络原理所述,神经网络第n年的输入值对应的期望目标输出值则是第n+1个月的烟叶醇化等级状况,这就使网络模型训练得到的输出值具有预测下一年醇化等级的功效[16]。因此,将间隔36个月数据输入模型,则可得间隔42个月的4个仓库18个不同产地等级烟叶的预测结果,预测结果以成都多宝库为例见表6。
根据结果可知,在下一次抽检过程中,烟叶醇化为优的产地和种类有:福建三明B2F、福建三明C3F、云南罗平B2F、C3F,重庆丰都C3F、B2F、X2F,可以预测这些产地不同等级烟叶在成都多宝库经42个月醇化水平较高,其感官评吸预测结果也较好,配方设计使用价值高。处于不合格或刚合格的烟叶醇化级别的为:福建三明X2F、广东南雄X2F、云南罗平C3F以及凉山会理B2F,可能是由于不同地区烟叶种植条件环境不同,烟叶化学成分差异性较大造成,在成都多宝库条件下醇化在这一时间节点处于低水平状态,使用价值欠佳,因此,建议尽快处理,并需进一步探讨合理的醇化环境和方式。
4 结论
烟叶醇化过程中发生复杂的生化、物理反应,这一类问题的共同特点是:难以达到解析解,而神经网络具有识别复杂非线性可反映射的特征,BP神经网络能学习和储存大量输入—输出模式映射关系,而无须事先了解描述这类映射关系的数学方程。通过Matlab软件,建立烟叶醇化感官质量BP神经网络模型,应用在时间节点质量预测方面,从检验结果可知具有准确性,为烟叶醇化质量评价和预测提供了科学的实践方法和可靠的理论依据,可指导烟叶仓储养护工作者、卷烟配方师提前采取风险预控措施,规避由醇化不当导致烟叶质量下降所带来的损失。
表6 成都多宝仓库烟叶醇化结果分析
Table 6 Analysis of alcoholification results of tobacco leaves in Chengdu Duobao warehouse
醇化度等级产地种类不合格凉山会理C3F合格河南洛阳C3F云南罗平C3F凉山会理B2F醇化良广东南雄X2F、C3F、B2F河南洛阳B2F、X2F福建三明X2F凉山会理X2F醇化度优福建三明B2F、C3F云南罗平B2F、C3F重庆丰都C3F、B2F、X2F