APP下载

卷烟感官质量制丝生产影响因素挖掘
——基于随机森林分类

2020-08-30王丽芳李丽萍丁姗

消费导刊 2020年29期
关键词:制丝红河卷烟

王丽芳 李丽萍 丁姗

红云红河烟草(集团)有限责任公司红河卷烟厂

一、引言

卷烟生产过程由制丝、卷接、包装等多个环节构成,而制丝生产过程是卷烟加工的重要阶段,其生产过程中每个工序工艺参数都会对卷烟感官质量、化学成分产生一定的影响[1]。目前,针对制丝工艺参数的变化对卷烟感官质量的影响研究已较多,但系统的制丝工艺参数对卷烟感官质量影响的重要性度量相对欠缺。本文针对我厂红河A品牌卷烟感官质量评价采用随机森林分类的方法,挖掘卷烟感官质量制丝生产影响因素,并对其影响重要性排序,作为卷烟产品品质提升的研究依据,确定制丝加工参数优化和试验研究的方向。

为掌握红河A品牌卷烟感官质量现状,调取2019年3月份共23批成品烟支感官质量评吸综合得分结果,绘制其I-MR控制图。

图1 红河A品牌感官质量得分的I-MR控制图

从图可以看出,红河A品牌各批次间感官质量综合打分有较大波动,说明红河A品牌各批次间的感官质量的确存在差异。为验证评吸员感官质量评价的准确性及各评吸员之间感官质量评价是否存在差异,随机抽取四名评吸员,对不同样品评吸的再现性、重复性做一致性检验,结果显示各评吸员自身、评吸员之间、评吸员与标准的一致性较好,证明测量系统可用,卷烟感官质量差异来源于卷烟本身,卷烟感官质量制丝生产影响因素的挖掘不可或缺。

二、数据说明及研究方法

(一)数据来源及说明

红河A品牌卷烟正式投入生产后,我厂针对每一批次卷烟开展在线针对性评吸,因此本文选择红河A牌号为研究对象,探索制丝生产过程卷烟感官质量的影响因素。数据来源于年度内红河A品牌共139个批次卷烟在线针对性评吸结果,从我厂制造执行系统(MES)调取各批次对应生产全过程共26个可控加工参数数据,并依据集团数据截取规则对过程异常数据进行了处理 。

(二)随机森林分类

随机森林是集成学习的重要方法,由Breiman(2001)提出,其分类和bagging 分类非常类似,即从原始训练样本集N中有放回的重复抽取n个观测值作为自助法样本(bootstrap sample),根据这个新样本建造一个(分类)决策树。在建造树的过程中并不用所有的变量当候选拆分变量,而是随机地挑选部分变量来竞争拆分变量,这样,不仅仅是每棵树所用的数据是随机抽取的, 而且每个节点的拆分变量的选择都是随机的。

随机森林是用随机方式建立一个森林,森林里面有很多决策树,每一棵决策树之间是没有关联的。当输入新的样本时,就让森林中的每一棵决策树分别进行判断,并用票选法决定预测的结果。随机森林分类的交叉验证的综合结果即OOB误差估计,通过其OOB可知模型误判率及准确率。

随机森林能够处理观测值很少,或自变量高阶交互作用及自变量相关的问题,在现有算法中,其精度是无可比拟的,且随机森林在分类的应用中可以计算出不同变量属性的重要性,是卷烟感官质量影响因素挖掘方法的必然之选。

三、实证分析

首先在R软件下,对全部变量及其观测值用randomForest()进行拟合,计算其拟合精度,分类结果显示,随机森林OOB误差估计为15.83%。预测类错判主要在A-B和B-C之间,没有A-C之间的错判。由于制丝生产过程卷烟感官质量评价主要用于生产过程改善,不用于标样定值,此处OOB误差估计已满足实际需要。

图2 随机森林拟合的变量部分依赖图

通过随机森林拟合的变量部分依赖图可以看出,各变量在因变量的取值上的影响很不一样。比如最不重要的变量X4仅仅在很小的范围和Y有关, 而有些变量则是全方位的,据随机森林Gini指数绘制变量重要性的Pareto图,并根据二八原则找到17个关键变量。

图3 变量重要性的Pareto图

为验证模型有效性,在R软件下使用predict()函数对模型进行交叉验证,输出均方误差(NMSE)为0.0139669。

四、结论及建议

本文基于随机森林方法及系统理论,构建了卷烟感官质量制丝生产影响因素挖掘模型,通过对红河A品牌多个批次生产数据进行分析,研究结论及建议如下:

1.制丝全过程各个工段都存在对卷烟感官质量产生影响的因素,而在二八原则找出的17个关键影响因素中,叶丝处理段工艺参数占比最多,由此证明叶丝处理段的影响力举足轻重。在实际生产过程中,叶丝处理段可调节参数较多、设备可调节范围较广,因此为实现卷烟感官质量的稳定和提升,可针对叶丝处理段过程控制稳定性做进一步探索。

2.本文仅在卷烟感官质量制丝生产影响因素的挖掘上做了抛砖引玉,在测试范围内对部分关键参数进行了重要性度量。鉴于制丝连续生产的特点,其生产过程参数牵一发而动全身,在针对卷烟感官质量的改善过程中,可能对其物料消耗、物理指标、化学指标等产生影响。因此,如何对制丝生产过程参数做综合调控、实现精益生产,还需进一步研究。

3.随机森林分类方法在在分析定性变量时具有显著优势,是一种有效的分类方法,随着条件的日益成熟以及大数据的推广,预测精度也会越来越高。因此,立足于满足消费者的消费习惯和需求,并结合实际生产现状,可有针对性的将本方法进一步推广应用到制丝生产工艺参数优化、过程稳定性控制及其加工效果的探索和改善中,以此提高顾客对卷烟产品的满意度,提高产品市场竞争力。

猜你喜欢

制丝红河卷烟
基于责任矩阵的卷烟制丝设备维修管理模式探索
魅力红河 大美梯田
红河学院作品选登
红河书法作品欣赏
烟草制丝车间的除尘技术探究
HELIUS激光除杂在制丝生产线异物剔除中的应用
制丝工艺中真空渗透的测控与信息化系统
卷烟包装痕迹分析
我国卷烟需求预测研究述评
卷烟引燃倾向测试方法的研究与改进