烤烟热分析图谱的香型判定模型构建
2020-07-02张同琢梅吉帆王安然乔学义李巧灵
张同琢,王 乐,梅吉帆,王安然,乔学义*,王 兵,李巧灵,李 斌
1.中国烟草总公司郑州烟草研究院,郑州高新技术产业开发区枫杨街2 号 450001
2.河南农业大学烟草学院 国家烟草栽培生理生化研究基地,郑州市金水区农业路63 号 450002
3.福建中烟工业有限责任公司技术中心,福建省厦门市集美区滨水路298 号 361022
烤烟烟叶香型是烤烟烟叶燃吸过程中烟气所呈现出的整体香气格调,在中式烤烟型卷烟产品质量风格特征构成中发挥着重要作用。在日常的卷烟产品开发和配方维护过程中,经常需要根据产品设计的目标以及特征,通过感官评吸的方式,从不同产地不同等级烟叶中筛选出符合配方需求的不同香型烟叶。然而,由于受人体嗅味觉疲劳、评吸环境、心理等诸多因素影响,评吸员不得不将每日的样品评吸数量控制在一定范围之内[1],以提高评吸结果的准确性。当烟叶样品数量较多时,目标香型烟叶的筛选需要较长的时间才能完成,人力、物力成本相对较高。
为了建立更为高效的烟叶香型判定方法,申钦鹏等[2-6]尝试从烟叶化学成分与香型关系的角度建立香型评判模型,并开展了大量的数据分析和基础算法研究工作,例如:基于114 种化学指标的Bayes 香型定量判别模型;基于烟叶香味成分的随机森林算法;基于致香成分的线性判别法和高斯混合模型等。与感官评价相比,基于化学成分的烟叶香型判定方法避免了人的生理、心理等主观因素对检测结果的影响,缩短了香型判定时间,但为了提高判定结果的准确率,仍需以大量的化学指标检测数据为基础,人力、物力成本依然较高。
热重分析法是研究样品质量随温度变化的方法,具有灵敏度高、重复性好、可自动化进样等优点[7]。Baker[8]研究认为绝大部分的烟气都是在热解/蒸馏区域产生,而烟叶香型本质上是热解烟气作用于人体嗅味觉器官的特征体现,不同烟叶香型的差异与其热解特性密切相关。李巧灵等[9-10]采用热重分析法考察了不同产地、年份、部位烤烟烟叶热解差异性,发现产地对烟叶热解差异性存在显著影响。因此,采用热重分析的方法研究全国烟叶热解特征,并基于烟叶热分析图谱的差异性和机器学习方法构建香型判别模型,旨在进一步提高烟叶香型判定的效率,降低评判过程成本,为烟叶香型判定技术的拓展提供依据。
1 材料与方法
1.1 烟叶样品和仪器
选择全国104 个县烤烟烟叶作为试验样品(表1),烟叶年份2014 年,等级C3F。所有烟叶样品香型均由全国评烟委员会、全国卷烟调香技术委员会委员组成的评吸专家组进行了鉴定。
TA Discovery 热重分析仪(美国TA 公司);FW100 高速万能粉碎机(天津泰斯特仪器有限公司);标准筛(绍兴市上虞宝成仪器设备有限公司)。
表1 试验烟叶样品信息Tab.1 Information of tobacco leaf samples used in the study
1.2 热分析图谱的获取
将烟叶样品放置在温度(22±1)℃、相对湿度(60±2)%的恒温恒湿箱中平衡48 h 后,经高速粉碎机粉碎,过60 目(250 μm)筛。称取(10.0±0.5)mg 烟粉进行热重试验,设置热重分析仪反应区吹扫气(氮气)流量为30 mL/min,天平保护气(氮气)流量为20 mL/min;将样品以10 ℃/min 的速率由40 ℃升至105 ℃,并保持30 min 以脱出样品中的水分,再以10 ℃/min 的升温速率升温至800 ℃。试验过程中,每个样品每分钟记录120 个数据点,选取105~800 ℃区间的热分析图谱(DTG 曲线)数据进行计算分析。
对数据按温度进行插值运算,得到同一温度下不同烟叶样品的热分析图谱。插值的温度范围为105.1~800.0 ℃,间隔0.1 ℃,每个样品共得到6 950 个数据点。
1.3 香型判别模型的构建与验证
对于分类问题而言,相比其他分类方法,支持向量机(Support Vector Machine,SVM)具有速度快、样本需求量小等优点[11-13],因此选择支持向量机构建香型判别模型,其核函数类型选择高斯核函数。惩罚因子C 和核函数参数g 的值对支持向量机的分类结果有重要影响。遗传算法[14]具有不依赖于梯度信息或其他辅助知识,只需要影响搜索方向的目标函数和相应的适应度函数的特点,因此采用遗传算法来寻找支持向量机的最优参数。利用遗传算法对支持向量机参数进行优化时,首先对分类器参数(惩罚因子C 和核函数参数g)进行编码,然后通过随机选择、交叉和变异等步骤寻找最优参数值,提高支持向量机的精度和效率。
香型判别模型构建与验证的具体流程见图1。本研究中涉及的算法均在MATLAB 软件中实现,支持向量机基于LIBSVM 工具箱实现[11]。
图1 香型判别模型构建与验证流程图Fig.1 A flow chart to illustrate the construction and verification of flavor type discrimination model
2 结果与分析
2.1 不同香型烤烟烟叶热分析图谱
八大香型烤烟烟叶样品热分析图谱见图2。由图2 可以看出,在105~400 ℃的温度范围内,随着热解温度升高,烤烟烟叶质量损失速率均较大;当温度高于400 ℃后,烟叶质量损失速率迅速减小。对八大香型烤烟烟叶样品热分析图谱进行比较可以看出,在150~400 ℃区间,不同香型烟叶热解特性差异明显,说明通过热解特性的差异来判定烟叶香型可行。
由图3 可知,同一香型各产地烟叶样品的热解特性也存在差异,且与不同香型间的热解特性相比,在150~400 ℃区间,香型内与香型间烟叶样品质量损失标准偏差均较大,许多香型内的标准偏差已经大于香型间的标准偏差。因此,直接基于整个温度区间的热解特性差异判定烟叶香型存在一定难度,需对温度进行筛选。
2.2 不同香型烤烟烟叶热解特征温度
通过逐一比较每种香型烟叶与其他所有香型烟叶热解特性差异,得到八种香型烟叶特征温度。具体筛选、计算过程如下:计算某一香型烟叶样品某一温度下的质量损失速率标准偏差S1与其余所有样品的标准偏差S2,并计算该香型烟叶样品在该温度下的质量损失速率均值μ1与其余所有样品的均值μ2,取两个均值之差的绝对值μ=|μ1-μ2|,取两个标准偏差中最大的标准偏差S=max(S1,S2),计算μ/S 特征值。比较某一香型烟叶在不同温度下的μ/S 特征值,为了获取最有利于分类结果的差异特性,将最大的μ/S 特征值对应的温度作为该香型烟叶相对于其他所有香型的热解特征温度。
图2 八大香型烤烟烟叶样品热分析图谱Fig.2 Thermal analysis spectra from flue-cured tobacco of eight flavor types
图3 八大香型内及香型间标准偏差Fig.3 Standard deviations within and among the eight flavor types
八种香型烤烟烟叶μ/S 特征图见图4。由图4可知,在不同热解温度条件下,同一香型烟叶样品计算得到的μ/S 特征值波动较大;不同香型相比较,μ/S 特征值差异明显。因此选择每种香型最大值对应的温度作为该香型特征温度。计算后得到的Ⅰ~Ⅷ香型烟叶特征温度分别为368.3、763.4、613.0、517.2、611.2、652.6、336.1、383.5 ℃。
图4 八大香型烤烟烟叶μ/S 特征图Fig.4 μ/S Characteristic figures of flue-cured tobacco leaves of eight flavor types
2.3 烤烟烟叶香型判别模型的建立
从104 个烟叶样品中随机抽取92 个样品作为训练集,将训练集烟叶样品的八种香型特征温度对应的质量损失速率进行归一化处理后,输入到支持向量机模型中,采用遗传算法对模型进行优化。遗传算法的参数为:种群的规模选择50,交配概率选择0.8,变异概率选择0.017 5,进化代数选择300。将GA-SVM 算法运行5 次,得到惩罚因子C 和核函数参数g 平均值(表2)。由表2 可知,训练集平均正确率为76.8%,波动较小;惩罚因子C的平均值为87.1;g 的平均值为893.4。
通过惩罚因子C 和核函数参数g 等支持向量机参数计算得到的香型判别函数如下:
表2 GA-SVM 模型参数Tab.2 Parameters of the GA-SVM model
2.4 烤烟烟叶香型判别模型的验证
将104 个烟叶样品中除训练集外的12 个样品作为测试集进行模型验证,将测试集烟叶样品的特征温度对应的质量损失速率输入香型判别函数中进行判别,并与感官评吸结果进行对比验证,所有测试样品的香型判定函数预测结果见图5。由图5 可以看出,12 个测试样本中,10 个预测正确,正确率达到83.3%。测试集的准确率高于训练集,这是因为测试集样本数量较少,而有的香型种植区域面积较小,样品数量较少,因此有些香型的样品不太适合作为测试集。另外本方法是基于八大香型的判定,之前的方法均是基于传统三大香型的判定,当香型数量增加后,位于香型分布区过渡地带特征不明显的烟叶样品数量增多,增加了模型测试时的香型判定难度,因此需要较多的训练样本来建立模型。
图5 烤烟烟叶香型判别模型验证结果Fig.5 Validation results of discriminant model for flavor types of flue-cured tobacco leaves
3 结论
通过采用热重分析仪测定不同香型烤烟烟叶热分析图谱,提取八大香型的热解特征温度,依据遗传算法改进的支持向量机构建香型判别模型,并测试模型准确率,结果表明:①八大香型烤烟烟叶热分析图谱在150~400 ℃区间存在明显差异;②Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ、Ⅵ、Ⅶ、Ⅷ香型热解特征温度分 别 为368.3、763.4、613.0、517.2、611.2、652.6、336.1、383.5 ℃;③GA-SVM 方法构建的香型判别模型对烤烟烟叶香型判定准确率为83.3%。