基于多因素辅材参数的短支卷烟烟气有害成分预测模型
2023-08-01何静宇宋伟民庞艳红王红霞李国政
何静宇,宋伟民,陈 洋,李 倩,陈 谦,庞艳红,王红霞,顾 亮,李国政*,杨 松
1. 河南中烟工业有限责任公司技术中心,郑州经济技术开发区第三大街8 号 450000
2. 河南中烟工业有限责任公司许昌卷烟厂,河南省许昌市明礼街1 号 461000
3.中国烟草总公司郑州烟草研究院 烟草行业烟草化学重点实验室,郑州高新技术产业开发区枫杨街2号 450001
卷烟辅助材料参数对卷烟主流烟气有害成分释放量具有影响和调节作用[1-3]。通过研究辅材参数对于卷烟主流烟气中有害成分的影响规律,构建基于卷烟辅助材料参数的卷烟烟气有害成分预测模型,已经成为卷烟产品设计数字化的重要途径之一。近年来,科研人员针对常规卷烟和细支卷烟的辅助材料对烟气有害成分释放量的影响进行了大量研究,并建立了相关预测模型[4-11]。预测模型的建立大大节约了人力、物力成本,有效提高了卷烟产品开发和维护的效率,越来越受到卷烟企业的重视。
短支卷烟自2006 年投放市场以来,逐渐成为市场主流产品之一,获得了广大消费者的青睐。与常规卷烟相比,短支卷烟烟丝段长度缩短了15.3%[12-13],导致短支卷烟的烟丝段过滤效率和扩散效率远远低于常规卷烟,进而影响烟气成分的产生和释放[14-15];与细支卷烟相比,短支卷烟在烟丝段长度和圆周的差异更大。由于短支卷烟与常规卷烟、细支卷烟的烟丝段长度和圆周均具有较大差异,烟气化学成分的生成、过滤和扩散也存在较大差异,因此,文献中报道的预测模型不能直接应用于短支卷烟。目前,未见短支卷烟预测模型的相关报道。科研人员在研发短支卷烟时,各个辅助材料的参数均需要重新设计和不断试验,这也成为制约短支卷烟健康可持续发展的一个重要因素。因此,本研究中采用线性回归法和逐步回归法建立了短支卷烟卷烟纸、滤棒和接装纸等辅助材料参数对主流烟气中7 种有害成分释放量、H值(危害性指数)的多因素预测模型,旨在为短支卷烟的产品研发和数字化设计提供技术支撑。
1 材料与方法
1.1 实验卷烟
选取卷烟纸定量、卷烟纸透气度、卷烟纸助燃剂质量分数、卷烟纸助燃剂钾钠比、滤棒压降和接装纸透气度共6个因素,样品设计涉及的因素、范围及水平见表1。
根据以上设计方案,采用中心组合结合正交设计,使用河南中烟工业有限责任公司某一规格在产短支卷烟同一批次的烟丝,在同一机台卷制辅材多因素短支卷烟样品共50 个,具体设计方案见表2。同时卷制两种不同烟丝配方的短支卷烟验证样品,用于对建立的短支卷烟预测模型进行验证,其中,编号YZ1~YZ9 的样品与建立模型的样品烟丝配方相同,编号YZ10~YZ15的样品与建立模型的样品烟丝配方不同,设计参数见表3。卷制短支卷烟样品所需卷烟纸由民丰特种纸股份有限公司生产,接装纸由江苏卫星新材料股份有限公司生产,滤棒由许昌帝豪实业公司生产,短支卷烟样品由河南中烟工业有限责任公司生产。
表3 多因素预测模型验证样品的设计参数Tab.3 Parameters of designed samples for verifying experiments of multifactor prediction models
1.2 方法
采用标准方法[16-23]分别测定短支卷烟主流烟气中CO、HCN、NNK、氨、B[a]P、苯酚和巴豆醛7 种有害成分的释放量,并用各有害成分释放量计算该短支卷烟的H值。使用SPSS Statistics 17.0 软件,采用线性回归法和逐步回归法建立短支卷烟材料参数对主流烟气7 种有害成分以及H值的多因素预测模型,并对上述预测模型进行交叉验证,依据交叉验证标准差(Root mean square error of cross validation,RMSECV)筛选出最优预测模型,最后采用外部验证样品对预测模型的预测能力进行验证。
2 结果与讨论
2.1 多因素预测模型的建立
6 个卷烟材料设计参数分别为卷烟纸定量X1、卷烟纸透气度X2、卷烟纸助燃剂质量分数X3、卷烟纸助燃剂钾钠比X4、滤棒压降X5和接装纸透气度X6。预测指标共计8 个:CO、HCN、NNK、氨、B[a]P、苯酚、巴豆醛和H。分别建立多元线性模型、二次多项式模型、多因子及互作项模型,并对模型进行95%置信水平的P检验,再依据决定系数R2及RMSECV值,从中筛选出最优预测模型。R2和RMSECV 分别按照公式(1)和公式(2)计算。模型的R2值越接近1,RMSECV值越小,模型的预测能力就越好。
式中:SSR—回归平方和;SST—总偏差平方和;SSE—残差平方和。
式中:i—模型预测值;Ci—标准方法实测值;n—校正集样品数。
以CO 预测模型的建立为例。采用多元线性回归法和逐步回归法分别建立了CO 的预测模型。通过P检验的CO预测模型共计3个,各预测模型参数见表4。模型1 是采用多元线性回归法建立的6 因素线性模型,模型2 是采用逐步回归法建立的二次多项式模型,模型3 是采用逐步回归法建立的多因子及互作项模型。
表4 短支卷烟CO释放量预测模型Tab.4 Prediction model for mainstream CO release from short cigarette
从表4 中可知,3 个模型的P值均远小于0.05,说明所建模型均具有统计学意义;R2均在0.8 以上,说明3 个模型回归效果均较好,具有一定的预测能力。图1 为CO 预测模型内部验证图及残差图,3 个模型的拟合值与观测值之间的误差大多分布在±1.0 mg/支范围内,且没有任何趋势,说明建立的模型可靠。其中,模型2 的R2最大,RMSECV值最小,说明该模型的预测值整体上较为接近实测值,吻合度最好。因此,选择模型2 作为CO 最优预测模型。
图1 CO预测模型内部验证图及残差图Fig.1 Internal validation plots and residual graphs of mainstream CO prediction models
采用上述方法,依次建立并筛选出了7 种有害成分及H值的最优预测模型。由表5可知,8个指标预测模型的P值均远小于0.05,且R2均较为接近1,说明模型均可通过显著性检验,具有统计学意义。其中,指标H预测模型的R2最接近1,RMSECV相对较小,说明该模型可能具有最优的预测结果。对于HCN 的预测模型,由于HCN 释放量的数值与其他有害成分相比较大,根据公式计算得出的RMSECV也较大,但该模型所有系数P值均小于0.05,且RMSECV 为所有HCN 预测模型中最小,因此,仍为最优选择。
表5 7种有害成分释放量及H的最优预测模型Tab.5 Optimal prediction models for 7 harmful components and the H index value
2.2 多因素预测模型的验证
用卷制的短支卷烟验证样品对筛选出的最优预测模型的预测效果进行验证。其中,编号YZ1~YZ9的样品与建立模型的样品烟丝配方相同,编号YZ10~YZ15 的样品与建立模型的样品烟丝配方不同。测定的样品实际参数见表6。
表6 多因素预测模型验证样品的实际参数Tab.6 Actual parameters of verification samples for multifactor prediction models
为评价预测模型预测结果的准确性,采用相对误差(Relative error,RE)和平均绝对误差(Mean absolute error,MAE)对预测结果进行计算和评估。分别按照公式(3)和公式(4)计算RE 和MAE。其中,平均绝对误差把离差绝对值化了,避免了正负互相抵消的情形,能够较好地反映误差的实际情况。
式中:N—验证样品数。
仍以CO 为例,CO 多因素预测模型验证结果见表7。结果表明,短支卷烟验证样品通过CO预测模型计算的预测值与测量值均较为一致,15 个验证样品中8个样品预测值的相对误差在±5%以内,6个样品在±5%~±10%之间,1个样品在±10%~±15%之间。
表7 CO预测模型验证结果Tab.7 Verification results of mainstream CO prediction model
8 个指标的最优预测模型验证结果的预测值与测量值的相对误差见表8和表9。结果表明,短支卷烟验证样品的8个预测指标的计算值共120个,大多数样品的预测偏差较小,误差范围在±15%以内的预测指标总计117 个,占总数的97.5%。整体来看,与建立模型的样品烟丝配方相同的YZ1~YZ9 样品,由于辅材参数的变化幅度远远超过不同烟丝配方下的YZ10~YZ15样品,因此,导致预测误差相比整体偏大。YZ10~YZ15 样品选用的辅材参数在预测模型的中心值附近,预测误差相对偏小。其中,验证样品的H值的预测结果最好,相对误差均在±10%以内,平均绝对误差在5%以内。验证样品的CO、HCN、NNK、B[a]P 和巴豆醛释放量的相对误差大部分在±10%以内;个别在±10%~±15%之间;仅YZ1样品的HCN、YZ9 样品的NNK 和氨的相对误差超出15%,但仍小于20%。8 个指标的平均绝对误差在3.4%~6.5%之间。模型总体预测结果较好,对不同辅材参数和不同烟丝配方均具有良好的适用性。
表8 多因素预测模型验证结果Tab.8 Verification results of multifactor prediction models (%)
表9 多因素预测模型验证结果统计Tab.9 Statistics of validation results of multifactor prediction models
使用烤烟型短支卷烟建立预测模型,设计样品的NNK 释放量范围为2.33~4.63 ng/支。对于采用远超过该释放量范围的烤烟型短支卷烟以及混合型短支卷烟,模型的预测效果尚未进行验证。且混合型短支卷烟未见研发及上市,目前没有制作和验证的意义。针对NNK释放量相对较高的短支卷烟,后续可以通过补充不同辅材参数和烟丝配方的样品数据,对模型进行维护和优化,进一步提升预测模型的准确性和适用性。
2.3 不同类型卷烟预测模型对比
为考察其他类型卷烟的预测模型对短支卷烟的适用性,以短支卷烟验证样品YZ1~YZ15为例,将所建立的短支卷烟模型与楚文娟等[4]的细支卷烟模型和赵乐等[5]的常规卷烟模型进行对比。15个样品的8个指标预测值与测量值的平均绝对误差如表10所示。文献[5]中缺少常规卷烟H值预测模型,因此,本研究中未针对H值指标进行计算。由表10 可知,短支卷烟模型8 个指标的平均绝对误差均在3.4%~6.5%之间,均小于10%;细支卷烟模型在23.6%~101.8%之间,均大于20%;常规卷烟模型在9.5%~48.8%之间,大部分在10%以上。细支卷烟和常规卷烟模型预测值与测量值的平均绝对误差大,预测准确性低,不适用于对短支卷烟的测量值进行预测。
表10 不同类型卷烟预测模型平均绝对误差对比Tab.10 Mean absolute errors of prediction models for different types of cigarettes (%)
3 结论
(1)使用SPSS Statistics 17.0 软件,用线性回归法和逐步回归法建立了基于短支卷烟辅助材料参数的CO、HCN、NNK、氨、B[a]P、苯酚、巴豆醛和H值多因素预测模型,依据交叉验证标准差(RMSECV)确定了各指标的最优预测模型。
(2)采用通过调整卷烟辅材的参数和烟丝配方制备的短支卷烟样品对预测模型进行验证,7 种有害成分及H值的预测模型的预测精度均良好,8 个模型的验证数据中97.5%的相对误差在±15%以内,平均绝对误差在3.4%~6.5%之间,说明短支卷烟模型对不同参数的辅助材料和不同配方的样品具有良好的适用性,可为短支卷烟辅助材料的数字化设计提供技术支撑。
(3)将本研究中建立的短支卷烟模型与文献中的细支卷烟模型和常规卷烟模型对比,细支卷烟模型和常规卷烟模型8个指标的预测值与测量值的平均绝对误差较大,预测准确性低,不适用于对短支卷烟的测量值进行预测。因此,本研究中针对短支卷烟建立专用的预测模型十分必要。