APP下载

基于MARS的卷烟吸阻和通风预测模型

2020-05-14何孝强李泓燊张云飞邹玉胜刘戈弋U李绍臣

食品与机械 2020年3期
关键词:卷烟纸滤棒烟支

何孝强 - 李泓燊 - 向 虎 王 龙 张云飞 - 邹玉胜 -g 赵 荣 刘戈弋U - 杨 涛 李绍臣 -

(1.红云红河烟草﹝集团﹞有限责任公司曲靖卷烟厂,云南 曲靖 655001;2.红云红河烟草﹝集团﹞有限责任公司,云南 昆明 650000)

卷烟吸阻是指消费者在吸烟时能感受到的阻力[1],会影响吸烟者对产品的接受性。卷烟通风是指通过未点燃卷烟(除前端外)吸入的空气[2],包括从卷烟纸和水松纸进入烟支的空气量,通风是一种影响卷烟烟气(焦油、CO等)产生量和成品吸阻的决定性因素。卷烟吸阻和通风是影响卷烟抽吸感受、烟气和感官质量的重要指标,因此建立卷烟吸阻、通风预测模型对产品设计和质量改进具有重要意义。目前,国内外对卷烟吸阻和通风的研究主要包括:研究相关因素对卷烟吸阻和通风的影响,包括卷烟材料、烟丝特性、物理指标和生产过程对卷烟吸阻、通风的影响[3-6],该类研究通过单一卷烟牌号的试验探讨了部分因素对卷烟吸阻和通风的影响,未能建立统一的吸阻、通风预测模型,存在一定局限性;通过原理分析建立通用的吸阻、通风数学模型[7-10],但该类模型中的部分关键参数如烟丝渗透率等需要借助专业的检测仪器进行试验获取,且需要生产出烟丝和滤棒后才能进行相关参数的测量,对于卷烟设计存在一定的滞后性。

多元自适应回归样条方法(Multivariate adaptive regression splines,MARS)由Friedman[11]提出,具有灵活适用于回归和分类问题的线性和非线性建模、支持变量交互、简单易懂、几乎不需要数据预处理、适用于不同类型的数据、数据预测效果好等特点[12-13],该方法已被应用于冻土分布模拟[14]和语音清晰度客观评价[15]等方面。试验拟从卷烟吸阻、通风原理出发,对检测数据进行深入挖掘,利用多元自适应回归样条方法建立卷烟吸阻、通风预测模型,为产品设计和生产改进提供参考。

1 试验原理及方法

1.1 试验原理

收集不同规格牌号卷烟的物理指标检测数据并进行清洗,结合卷烟吸阻、通风的原理分析可能的影响因素,根据原理分析结果构建中间变量形成新的基础数据,并将数据集分为训练集和测试集,利用MARS方法对训练集建立卷烟吸阻和通风预测模型,利用测试集对模型进行验证。

1.2 数据准备

曲靖卷烟厂2018年1月~2019年6月各牌号卷烟物理指标检测数据17万余条,涵盖了14个卷烟牌号,卷烟规格包括常规烟支、中支和细支,卷烟纸透气度、接装纸透气度、滤棒长度、滤棒吸阻、烟丝填充值等因子。以各牌号的产品技术标准为参考,对数据进行初步清洗,剔除明显异常数据,形成如表1所示的数据。

卷烟吸阻是在烟丝柱体吸阻、接装纸打孔上游滤棒压降、下游滤棒压降、卷烟纸透气度、接装纸透气度的综合作用下形成的[1],其中烟丝柱体吸阻与烟支长度、直径、气流黏度、烟支比阻有关,烟支比阻反映了烟丝形状、尺寸及孔隙率对流体流动的影响[16]。根据烟支比阻的定义,与之相关且可测量的有烟支内的烟丝填充密度和烟丝本身的填充能力,烟填充密度越大,阻力越大,填充值越高,阻力越大,因此以烟丝填充密度与烟丝填充值的乘积表示气体通过烟丝柱体受到的阻力,即烟丝填充系数:

表1 数据示意

(1)

式中:

fd——烟丝填充系数;

f——烟丝填充值,cm3/g;

m——单支卷烟所含烟丝量,g;

v——无嘴段烟支体积,mm3。

根据定义,fd反映了烟丝在烟支中的实际填充量与烟丝本身的填充性能的比值,值越大,烟丝在烟支内的填充越紧实,对气体的阻力越大,吸阻越大。

卷烟通风包括纸通风和滤嘴通风,二者之和为总通风。卷烟通风与卷烟吸阻、卷烟纸透气度、接装纸透气度、接装纸打孔位置、滤棒压降等因素有关,为此在原始数据集中加入卷烟纸透气、接装纸透气度、滤棒压降、滤棒长度,并根据水松纸打孔位置计算出滤棒上、下游压降,根据卷烟重量、规格和卷烟材料重量、烟丝填充值计算出烟丝填充系数,形成如表2所示的数据集。

1.3 方法

MARS模型通过样条函数拟合复杂的非线性关系[14-15],其数学表达式为:

表2 变量注释†

† 卷烟长度、滤棒长度、卷烟纸透气度、接装纸透气度、卷烟直径、无嘴段烟支长度为已知参数;辅料重量、滤棒压降和烟丝填充值采用对应批次卷烟的平均值;滤棒上、下游压降和烟丝填充系数根据已知参数计算;卷烟吸阻、滤嘴通风、纸通风和总通风为检测结果。

(2)

式中:

a0——截距;

am——第m个样条函数的系数;

M——样条函数数量;

km——不同区域之间的线性回归线交点的结点数;

Skm——右侧或左侧的样条函数,取1或-1;

v(k,m)——标识变量;

tkm——结点位置。

样条函数定义为:

11.2.1.1 瘤状原基期:空气相对湿度80%~90%,覆土层保持既疏松又湿润;在土质疏松、原基出现较多时,应勤喷雾状水。以保持瘤状原基表面有水珠为准。

(3)

式中:

t——结点的位置;

x-tkm、tkm-x——给定t时右侧和左侧区域的样条函数;

+——对于负值取0。

MARS模型通过交叉验证实现变量的自动选择,默认的方法是前向过程建模然后通过后向过程精简模型,精简过程根据广义交叉验证(GCV)进行,其定义为:

(4)

式中:

yi——实际观测值;

M(λ)——模型中有效参数数量;

N——基函数个数。

GCV(λ)最小时对应的模型为最佳模型。

2 模型建立与验证

2.1 吸阻模型

将数据集分为训练集和测试集,其中训练集为总样本的80%,采用分层抽样的方法在每个牌号卷烟的检测数据中随机抽取80%的样本量组成训练集建立模型,剩下的20%为作为验证模型的测试集。考虑到模型的实际应用,数据变量中的辅料重量、烟丝填充值和滤棒压降为对应批次的平均值,因此这些变量的波动可能会对结果产生影响,为尽量消除人为添加变量的波动和测试过程中的误差,首先对训练样本进行聚类。以卷烟规格(重量、圆周、长度)为变量,利用K-Means聚类算法对训练集进行聚类,根据总的类内平方和变化,同时为避免不同牌号卷烟数据的样本量差异过大对模型精度造成影响,最终确定每个卷烟牌号的聚类数为200,以每个类别的数据中心值为新的训练样本,共2 800条数据。

利用MARS模型拟合训练集,得到模型拟合的变量重要性见表3。

根据nsubsets(精简过程完成后包含该变量的模型个数)准则[12],最终模型用到了10个变量中的8个,其中接装纸透气度和滤棒下游压降最重要,其次为烟丝填充系数、卷烟长度、滤棒上游压降、卷烟纸透气度、无嘴段烟支长度和卷烟直径,而滤棒长度和滤棒压降在最终的模型中被删除。

由图1可知,当模型基函数为16时,GCV值达到最小421.6,因此确定最佳模型的基函数为16。

最终建立的模型为:

pd=947.483-97.976h1+943.738h2-616.126h3-0.111h4-34.639h5+0.210h6+7.048h7+1.124h8+0.754h9-5.128h10-10.473h11-83.608h12-7.382h13-22.855h14-8.835h15。

(5)

表3 变量重要性

图1 模型选择

其中各基函数表达式如表4所示。

表4 基函数†

† max(0,a)表示取0和a的较大值。

利用该模型对测试集进行5折交叉验证,得到吸阻测试集的标准化均方误差为0.276[23],预测绝对误差平均值为37.5 Pa,相对误差为3.26%,模型拟合效果较好。

2.2 通风模型

利用同样的方法建立卷烟纸通风、滤嘴通风预测模型。其中纸通风预测模型包含7个变量,其重要性由高到低依次为:lbpd(滤棒压降)、st(接装纸透气度)、d(卷烟直径)、jt(卷烟纸透气度)、fd(烟丝填充系数)、lbl(滤棒长度)、yzl(无嘴段烟支长度),最优模型包含15个基函数,建立的预测模型为:

pv=10.153+0.011 96h1+0.027 6h2-0.069 28h3-0.249h4+0.026 9h5-0.231h6+20.722h7-15.507h8-0.077 5h9-1.041h10-0.056 5h11+0.035 8h12+0.001 98h13+5.856h14-3.564h15。

(6)

其中各基函数表达式如表5所示。

表5 基函数

5折交叉验证得到纸通风测试集的标准化均方误差为0.184,预测绝对误差平均值为0.91%,模型拟合效果较好。

滤嘴通风预测模型包含6个变量,其重要性由高到低依次为:st(接装纸透气度)、jt(卷烟纸透气度)、lbpd2(滤棒下游压降)、l(卷烟长度)、lbpd(滤棒吸阻)、lbpd1(滤棒上游压降),最优模型包含11个基函数,建立的预测模型为:

fv=7.994+0.162h1-0.02h2+0.273h3+0.157h4+0.032 7h5-0.007h6+0.029 2h7-0.018 4h8+6.353h9+0.79h10-0.097 7h11。

(7)

其中各基函数表达式如表6所示。

5折交叉验证得到滤嘴通风测试集的标准化均方误差为0.044,预测绝对误差平均值为1.27%,模型拟合效果较好。

表6 基函数

卷烟总通风为滤嘴通风与纸通风之和,根据模型预测出的纸通风与滤嘴通风即可预测出总通风,通过计算,总通风测试集的预测绝对误差平均值为1.7%。

为进一步分析模型预测效果,将卷烟吸阻和通风指标的实测值波动和指标产品技术标准进行对比,如表7所示。由表7可知,模型预测误差远小于吸阻实际波动范围和技术标准规定允差,因此模型完全可应用于产品设计和实际生产中的吸阻和通风预测。

表7 模型预测误差对比表

3 结论

通过对卷烟吸阻、通风率的原理分析找出相关的影响因子,结合大量丰富的不同规格和原辅料特性的卷烟数据,利用多元自适应回归样条(MARS)方法建立了卷烟吸阻、通风预测模型,其中吸阻预测模型的标准化均方误差为0.276,绝对误差平均值为37.5 Pa;纸通风预测模型的标准化均方误差为0.184,绝对误差平均值为0.91%;滤嘴通风预测模型的标准化均方误差为0.044,绝对误差平均值为1.27%,模型预测效果较好,可应用于实际生产中的卷烟吸阻、通风预测。试验中用于拟合模型的数据为曲靖卷烟厂目前生产的牌号和规格卷烟检测数据,后续将纳入其他生产厂的不同牌号、规格卷烟数据进行分析,进一步优化模型。

猜你喜欢

卷烟纸滤棒烟支
KDF3E成型机滤棒端面触头的原因及排除方法
一种智能化柔性烟支翻盘输送机构的设计应用
对ZJ17卷烟机卷烟纸搭接消耗的分析与研究
降低卷烟储存输送系统中细支烟横烟频次的研究
烟用特种滤棒分类研究
细支卷烟烟支物理指标相关性分析
烟支重量和密度对加香加料表达效果的影响研究
一种具有防伪功能的卷烟纸
影响卷烟纸阴燃速率的因素
滤棒输送系统生产能力匹配分析与改进