APP下载

基于随机森林和逻辑回归分类模型的烟叶精选品控指标筛选

2020-04-10张莉纪铭阳胡宗玉

江苏农业科学 2020年3期
关键词:细支色度外观

张莉 纪铭阳 胡宗玉

摘要:为进一步提高细支烟原料的工业适用性及精选效率,选取福建省三明市宁化县的翠碧一号原烟进行外观分类及质量评价。针对细支烟原料需求,通过对各类别烟叶样品的外观质量指标和感官质量指标进行关联分析,应用随机森林和逻辑回归分类模型确定烟叶精选外观品控指标(身份、色度),应用证据权重确定外观指标要求(身份:中等-稍厚,色度:强-浓),模型准确率达82.69%。结果表明,采用模型确定的外观敏感性指标,精选效率大幅提升,选出的烟叶工业适用性也明显提高。

关键词:细支烟;烤烟;精选;随机森林;逻辑回归;证据权重;品控指标;外观质量;感官质量

中图分类号: TS47  文献标志码: A  文章编号:1002-1302(2020)03-0214-04

我国烟草种植以散户为主,烟叶等级质量受人工影响较大,工商交接烟叶等级合格率不高的现象一直存在,工业企业采购的烟叶等级合格率不高,可用性降低,严重影响卷烟产品配方的稳定性[1-2]。精选不仅可以提高烟叶等级合格率,而且有效剔除青杂、霉变烟和非烟物质,全面提高烟叶资源利用率[3]。

目前,国内外针对烟叶质量的研究主要侧重于烤烟外观质量与化学成分的关系[4-7],外观质量与感官质量指标间的关系[8-9],外观质量指标的检测和量化[10-12],对于基于品牌需求的精选外观品控指标筛选及量化尚未见报道。因此,本研究基于细支烟原料需求,应用随机森林和逻辑回归分类模型对烟叶精选品控指标进行筛选,并基于证据权重辅助确定指标量化区间,为优化提升烟叶原料的均质性和工业适用性提供参考。

1 材料与方法

1.1 试验材料

选自2015—2017年连续3年福建省三明市宁化县的翠碧一号初烤烟C2F。

1.2 评价方法

1.2.1 外观质量评价 由高级技师和技师共6人组成外观评价小组,根据GB 2635—1992《烤烟》品质因素规定,对样品进行细分,3年共制84个烟叶样品。按照表1外观评价指标及标准对各类样品外观指标进行量化。

1.2.2 感官质量评价 由国家级评委和省级评委8人组成评吸小组,按照YC/T 530—2015《烤烟 烟叶质量风格特色感官评价方法》对样品进行感官评吸及指标量化,并对每类样品是否符合品牌细支烟原料需求给予判定,判定一致率低于80%的进行复评。符合品牌细支烟配方需求的类别样品记为0,不符合品牌细支烟配方需求的类别样品记为1。

1.3 数据处理与分析

采用Excel 2007进行证据权重运算;采用R i386 3.1.1进行描述统计和相关分析,构建随机森林、逻辑回归分类器。

2 结果与分析

2.1 烤烟烟叶外观及感官质量特征指标统计分布

由表2可知,样品外观与感官评价指标在不同样品间存在较为广泛的变异,其中外观评价指标的变异明显大于感官評价指标。

2.2 烤烟烟叶外观质量特征与感官质量特征指标的相关分析

数据特征可采用线性相关分析考察外观质量各指标与感官质量指标的相关关系,结果(表3)表明,不仅样品外观特征指标与其感官特征指标间存在显著或极显著相关关系,各外观特征指标间也存在显著或极显著相关关系,这反映了各变量间潜在的共同的信息维度。成熟度与所有感官指标呈显著或极显著相关关系;身份与烟气浓度、劲头、香气特性均呈极显著相关关系;油分与香气特性、烟气特性、口感特性均呈极显著相关关系;色度与香气特性、烟气特性、口感特性呈极显著相关关系。

2.3 精选外观品控指标重要性排序

随机森林算法评估所有变量的重要性,无需顾虑变量的多元共线性问题[13]。由图1可知,随机森林规模在400左右时,误差率已趋于平稳。为进一步增强平稳性,将随机森林规模设置为450,建立并运行随机森林分类模型,输出结果显示:OOB分类错误率为25%,即基于随机森林建立的分类模型预测正确率可达75%,分类结果混淆矩阵显示判别分析的错误率(表4)。

基于基尼指数的自变量相对重要性见表5。基尼系数越大,说明该变量对工业适用性的分类重要性越高,因此,基于细支烟的精选外观品控指标重要性排序为身份>色度>颜色>成熟度>油分>叶片结构。

2.4 精选重点外观品控指标的筛选及其阈值的确定

变量间的自相关将导致逻辑分类模型无法进行有效拟合,选择逐步进入法应用逻辑分类模型,基于AIC值最小原则进行变量筛选,模型输出结果见表6。

引入10折交叉验证分层随机抽样进行对比,模型分类准确率为76.5%,将外观变量进行降维后,筛选出的指标为身份和色度,结合随机森林模型得出的指标相对重要性排序,最终确定的重点外观品控指标为身份和色度。

对筛选后的指标进行分箱,计算证据权重(WOE)值,结果见表7、表8。

由表7、表8可知,样品外观质量同时满足身份在(5,7]和色度(6,9]时,可较大程度选出符合细支烟需要的烟叶原料类别。根据变量筛选、分箱后,对原始数据进行回判,所得混淆矩阵见表9。由混淆矩阵结果可知,根据最终确定的重点品控指标及范围,分类正确率为82.69%。

为尽可能减少错分样本,更为贴合实际地指导生产,对错分样本进行归纳,最终确定基于细支烟原料需求的精选方式为:在严控副组和下部烟叶的基础上,重点把控身份和色度指标,确保上选烟叶身份在中等至稍厚区间,同时色度在强至浓区间,可确保选上烟叶趋于完全符合分类预期。

2.5 生产验证

将400 000 kg的C2F原烟随机分成2份,200 000 kg 用于常规精选(精选出符合国标C2F等级的烟叶),200 000 kg用于基于细支烟需求的分类模型精选。生产试验结果(表10)表明,分类模型精选J1类上选率为41.52%,远高于常规精选J类的17.63%,提高了1.35倍,有效提高了该等级烟叶的整体工业适用性。

由表11可知,分类模型精选试验J1类烟叶和常规精选的J类烟叶相比,烟气浓度、透发性较好,香气量微有减少,香气质和烟气特性(细腻程度、柔和程度、圆润感)微有下降,杂气略有增加,整体感官质量较符合细支烟原料“高浓度、高香气、高透发”的需求预期。

3 结论与讨论

原烟精选是卷烟工业配方工作前移的必备项目,相关的研究多集中在精选的作用及过程管理上。本研究基于细支烟原料“高香气、高浓度、高透发”的需求,采用随机森林、逻辑分类模型和证据权重从众多质量评价指标中筛选出身份和色度2个重点外观品控指标,通过证据权重计算其阈值为身份(中等-稍厚)和色度(强-浓),分类模型准确率达82.69%。研究结果在生产中的指导作用显著,从技术上简化了品控指标,降低了操作难度,有效提高了精选效率;精选出的烟叶和品牌需求契合度更高,有效提高了烟叶工业适用性。

工业适用性分类一般发生在正组烟叶等级中,各类别烟叶样品间成熟度的波动幅度较小且操作难度较大。烟叶身份与烟气浓度呈极显著正相关关系,且样品间身份波动幅度较大,生产中易识别。色度则包含烟叶颜色的均匀程度和光泽度,与颜色和油分呈极显著相关关系。因此,本研究基于細支烟的精选外观品控指标重要性排序为身份>色度>颜色>成熟度>油分>叶片结构,该排序仅仅说明6个分级因素对样品工业适用性分类的敏感性,这与传统认为成熟度、油分决定烟叶品质的观点并不冲突。

参考文献:

[1]许洪庆,王玉平,李 淳. 等级合格率对复烤烟叶质量影响研究初报[J]. 耕作与栽培,2010(2):17-18,20.

[2]杨尚明,韩中波,徐 鹏,等. 烟叶散叶收购方式对等级质量的影响[J]. 现代农业科技,2013(6):307-309,312.

[3]阚宏伟,胡亚杰,张纪利. 加强原烟精选提高烟叶等级质量[J]. 天津农业科学,2016,22(7):98-101.

[4]陈庆园,陈 雪,袁有波. 初烤烟叶外观质量与主要化学成分关系的研究[J]. 中国烟草科学,2008,29(1):30-32.

[5]汤朝起,刘 伟,潘红源,等. 烤烟外观质量的评价延伸指标与内在品质的关系[J]. 烟草科技,2011(9):71-74.

[6]孙 平,程 森,窦玉青,等. 四川会东初烤烟叶外观质量与主要化学成分关系研究[J]. 中国烟草科学,2013,34(1):29-33.

[7]唐 宇,程 森,窦玉青,等. 云南宣威初烤烟叶外观质量性状与内在品质的关系[J]. 烟草科技,2011(3):72-76.

[8]罗万麟,李永栋,路晓崇,等. 红花大金元外观质量与感官质量的典型相关分析[J]. 山东农业科学,2016,48(7):35-38.

[9]闫洪洋,闫洪喜,吉松毅,等. 河南烤烟外观质量与感官质量的相关性[J]. 烟草科技,2012(7):17-23

[10]蔡宪杰,王信民,尹启生.烤烟外观质量指标量化分析初探[J]. 烟草科技,2004(6):37-39,42.

[11]蔡宪杰,王信民,尹启生. 成熟度与烟叶质量的量化关系研究[J]. 中国烟草学报,2005,11(4):42-46.

[12]邓小华,周冀衡,杨虹琦,等. 湖南烤烟外观质量量化评价体系的构建与实证分析[J]. 中国农业科学,2007,40(9):2036-2044.

[13]李欣海. 随机森林模型在分类与回归分析中的应用[J]. 应用昆虫学报,2013,50(4):1190-1197.

猜你喜欢

细支色度外观
鲁产细支烟产业发展环境与策略分析
——基于波特五力模型理论的视角
外观动作自适应目标跟踪方法
不同细支卷烟机型卷烟物理指标差异性研究
A Shopping Story to Remember
不论外观还是声音,它都很美 Yamaha(雅马哈)A-S3200合并功放
细支烟市场营销策略探析
方外观遗迹旧照
基于改进色度模型的非接触式心率检测与估计
景德镇早期青白瓷的器型与色度
如何提高苹果的着色度