基于内源性致香物质和化学计量学的烟草感官评价研究
2017-06-29徐金巧谈满良徐清泉
徐金巧,陈 勇*,谈满良,徐清泉,吴 键
(1.浙江大学 药学院 现代中药研究所,浙江 杭州 310058;2.浙江大学 苏州工业技术研究院,江苏 苏州 215163;3.浙江中烟工业有限责任公司,浙江 杭州 310024)
研究简报
基于内源性致香物质和化学计量学的烟草感官评价研究
徐金巧1,陈 勇1*,谈满良2,徐清泉3,吴 键3
(1.浙江大学 药学院 现代中药研究所,浙江 杭州 310058;2.浙江大学 苏州工业技术研究院,江苏 苏州 215163;3.浙江中烟工业有限责任公司,浙江 杭州 310024)
采用主成分分析法结合遗传算法和神经网络,建立了基于烟草内源性致香物质的感官质量评价预测模型。利用气相色谱-质谱(GC-MS)技术对超临界萃取-分子蒸馏所得烟草精油中的内源性致香组分进行定性定量分析,汇总各类致香指标后,对其进行主成分分析;以提取所得5个主成分的得分作为输入变量,感官评吸分数作为输出变量,分别使用标准BP神经网络和遗传算法(GA)优化的BP神经网络建立预测模型。对比实验结果表明,GA优化后的模型预测效果更优,其预测值与实验值间的相关系数为0.96,预测均方根误差为1.81,说明GA-BP模型具有更好的拟合能力和预测能力,该模型能有效地预测烟草精油的感官品质。
主成分分析;内源性致香物质;化学计量学;遗传算法;BP神经网络;感官评吸
烟草中化学成分众多且复杂,其中与烟草香味相关的化合物有700多种。致香化合物一般含有不同的致香功能基团,如—OH,—CO,—NH,—SH等[1-3],能给人不同的嗅觉刺激,各类成分的相互作用构成了烟草的独特香味。烟草感官质量是烟草中各类致香成分综合作用的结果,对烟草品质起着决定性作用。传统的烟草质量评价以感官评吸为主,而感官评吸需要成立专业的评吸小组,且其结果易受评吸专家经验、情绪等主观因素及客观外在环境因素的影响[4-6],评吸结果的稳定性和科学性有待改善。烟草感官评吸质量与烟草中化学成分的含量和组成息息相关,目前关于烟草化学成分与感官评吸质量之间的关系研究较多,主要集中在烟草中总糖、总氮、总碱、氯、钾等常规化学成分对其感官质量的影响[7-9],而针对烟草中各类关键致香成分对其感官质量影响的研究鲜有报道;其次,现有的研究方法多为传统的数理统计方法,如简单相关分析、主成分分析、多元回归分析、灰色关联度分析等[10-12],这些传统方法只能定性分析两者之间的关系而无法对感官评吸进行科学预测并给出评价结果。因此,如何通过烟草中各类致香物质的定性定量分析建立烟草感官评价预测模型,以简单、准确地了解烟草感官品质已成为烟草行业亟待解决的问题。高速发展的化学计量学方法基于其综合利用复杂数据中有用信息来解决实际问题的特点,已在众多领域得以应用[13-16],也为烟草感官质量预测模型的建立提供了新契机。
本研究根据烟草精油中致香物质复杂多样的特性,按照致香官能团的不同进行分类,采用主成分分析对各类致香成分指标相关性进行分析,筛选出特征变量后,分别采用标准BP神经网络和遗传算法优化的GA-BP神经网络建立了致香指标与感官评吸分数之间的相关预测模型,旨在建立一种准确、科学的烟草精油感官品质评价方法,从而为其感官评价提供理论依据。
1 实验部分
1.1 材料与仪器
不同产地的烟草原料(浙江中烟工业有限责任公司提供),原料信息见表1。1,2-丙二醇、二氯甲烷(分析纯,江苏强盛功能化学股份有限公司);乙酸苯乙酯(98%,阿拉丁试剂(中国)有限责任公司);纯净水(杭州娃哈哈集团有限责任公司)。
HL-3×20L/40MPa-ⅡA型超临界流体萃取仪(杭州华黎泵业有限公司);MDS-80-Ⅱ型分子蒸馏实验设备(佛山市新杰大型钢结构工程有限公司);7890A-5975C气相色谱-质谱联用仪、HP-5MS毛细管色谱柱(60 m×0.25 mm i.d.×0.25 μm d.f.,美国安捷伦科技有限公司);AL204型电子天平(梅特勒-托利多仪器(上海)有限公司);KQ-500DB 型数控超声波清洗器(昆山市超声仪器有限公司)。
表1 烟草原料信息统计表
1.2 实验方法
1.2.1 烟草精油的制备方法 将不同产地的废次烟草原料(共15个产地),采用超临界CO2萃取结合分子蒸馏进行精制得到轻组分烟草精油。超临界CO2萃取工艺条件为:萃取时间2.5 h,萃取压力25 MPa,萃取温度40 ℃,1,2-丙二醇为夹带剂,夹带剂用量为10%,CO2流量为2.0 L·min-1;分子蒸馏工艺条件为:刮膜转速200 r·min-1,进料速度150 mL·h-1,蒸馏压力50 Pa,蒸馏温度90 ℃。
1.2.2 烟草精油中致香成分分析方法 准确称取烟草精油0.5 g于50 mL容量瓶中,加入0.50 mL 0.173 7 mg·mL-1的乙酸苯乙酯内标,5 mL二氯甲烷混合均匀后进行GC-MS测定。
色谱条件:HP-5MS毛细管色谱柱(60 m×0.25 mm i.d.,0.25 μm d.f.);进样口温度为250 ℃;载气为He,流速为1 mL·min-1;进样量为1 μL;分流比为10∶1;程序升温:70 ℃以5 ℃·min-1升温至100 ℃保持4 min,再以2 ℃·min-1升温至280 ℃保持20 min;电离方式为电子轰击离子源(EI);离子源温度:230 ℃;电离能量:70 eV;传输线温度:250 ℃;四极杆温度:150 ℃;电子倍增器(EM)电压:1 812 V;隔垫吹扫流量:3 mL·min-1;溶剂延迟:10 min。
通过Nist和Wiley谱库检索并结合标准质谱图和相关文献,对各致香物质进行定性;以乙酸苯乙酯为内标,采用内标法定量[17],假定相对校正因子为1,按照致香功能基团不同进行分类汇总。
1.2.3 烟草精油感官评吸方法 按照卷烟国家标准 GB YC/T 498-2014,将得到的轻组分精油用5 mL 70%乙醇稀释后,用喉头喷雾器按烟草香料占烟丝重量的0.1%分别均匀地喷洒在空白烟丝上,喷后,烟丝于温度为(22±1) ℃、湿度为(60±2)%的环境中平衡48 h,然后卷制成烟支,再在温度为(22±1) ℃、湿度为(60±2)%的环境中平衡48 h。以未添加的空白烟丝作对照,由杭州利群环保纸业有限公司和浙江中烟工业有限责任公司的评吸师进行感官评吸。
1.2.4 模型的建立方法及其性能评价指标 15个产地的烟草原料经超临界萃取和分子蒸馏工艺制备烟草精油,每个产地有10~12批次,总共可取精油样本152个。致香物质按官能团不同汇总后采用主成分分析进行特征参数的选择,从而确定输入变量,以感官评吸分数作为输出变量,分别采用BP神经网络和 GA-BP神经网络建立烟草精油品质的预测模型,并进行比较。152个样本中随机选用122个作为校正集,用于建立校正模型;30个剩余样本作为预测集,用于验证模型性能。
以模型相关系数(R)、校正集预测误差均方根(RMSEC)、验证集预测误差均方根(RMSEP)、校正集相对偏差(RSEC)和验证集相对偏差(RSEP)作为模型性能的评价指标。
2 结果与讨论
2.1 主成分分析结果
收集152个烟草精油样本中各类致香物质的含量,对其进行相关系数计算得到相关系数矩阵,结果见表2。从表2可以看出大部分相关系数均较高,说明各变量间呈较强的线性关系。对烟草精油各类致香物质的原始数据进行标准化处理后,对原始数据进行 KMO 检验和 Bartlett 球度检验。Bartlett 值为183.18,显著性系数Sig 为 0.00<0.05,检验结果的 KMO 值为 0.64,这说明各类致香物质之间有相关性,根据Kaiser给出的KMO度量标准可知原始数据变量适合进行主成分分析。使用SPSS 20.0软件对原始数据进行主成分分析,并对原始因子载荷矩阵进行方差最大化正交旋转,计算其特征值、贡献率、累积贡献率、因子载荷矩阵和因子得分系数矩阵,具体结果见表3~5。
表2 烟草各香气指标间的相关矩阵
由于累积贡献率表明的是提取出的主成分所包含全部指标信息的百分比,从表3可以看出,原始8个致香指标可以提取5个主成分,这5个主成分可以解释原始变量的87.31%,反映了原始数据绝大部分的信息,原有变量的信息丢失较少,因子分析效果理想。因此可以利用5个主成分对烟草精油感官品质进行研究。表3结果也表明,因子旋转后总的累积方差贡献率未改变,即原变量的共同度没有变化,只是重新分配各个因子解释原有变量的方差,即改变了各因子的方差贡献率,使得因子更易于解释。旋转后这5个因子的累积贡献率分别为 26.51%,45.88%,61.23%,74.36%和87.31%。
表3 主成分特征值、贡献率和累积贡献率
表4 因子载荷矩阵
表5 因子得分系数矩阵
将旋转前后的因子负荷矩阵对比分析发现,每个主成分所表征的致香指标含义发生了显著变化(表4)。 因子旋转前,多个致香指标均在同一个主成分上有较大的绝对值取值,如醇类、醛类、酮类、酯类在F1上均有较大取值,说明F1由多个致香指标共同表征,F1意义含糊不清,无法进行合理解释;经过因子正交旋转后,8个致香指标在5个主成分因子载荷矩阵中的分布有明显区别,与旋转前相比,因子含义更加清晰。
根据回归法求得因子得分系数矩阵,结果见表5。由于得分系数给出的是各致香指标在5个主成分上的负荷值,因子得分系数与相应方差贡献率的乘积即可表示各致香指标在样本中的贡献,通过进一步计算得到各主成分得分表达式如下:
F1=-0.04X1-0.03X2+0.13X3+0.14X4-0.02X5-0.02X6+0.02X7-0.07X8
F2=0.05X1+0.05X2+0.03X3+0.05X4+0.01X5+0.02X6-0.01X7-0.15X8
F3=0.03X1+0.05X2+0.01X3+0.02X4-0.01X5-0.13X6-0.02X7+0.04X8
F4=-0.01X1-0.02X2-0.02X3+0.01X4+0.13X5-0.01X6+0.02X7-0.01X8
F5=0.01X1-0.02X2+0.01X3+0.01X4+0.02X5+0.01X6+0.14X7-0.01X8
式中X1,X2,X3,X4,X5,X6,X7,X8分别指醇类、醛类、酮类、酯类、酚类、酸类、杂环类和新植二烯。
2.2 BP与GA-BP模型的建立及预测结果
将原始数据经主成分分析后所提取出的5个主成分得分作为输入变量,感官评吸分数作为输出变量,分别采用BP算法和GA-BP算法建立模型。其中,BP神经网络模型采用三层网络结构,分别为输入层、隐含层和输出层,隐含层通过试差法确定隐含层数为20;在Matlab软件中运用Mapminmax函数对原始数据进行归一化处理,隐含层传递函数采用S型正切函数tansig;输出层传递函数采用S型导函数logsig;网络的学习算法采用Levenberg-Marquardt反向传播算法;学习速率为0.01;动量系数为0.90;训练次数为1 000;训练目标为0.01。遗传算法初始种群数量为20;最大迭代次数为50;交叉概率为0.70;变异率为0.10。在上述参数条件下建立的模型结果如图1所示,GA算法优化前后所建立模型的预测结果比较见表6。
表6 BP与GA-BP模型结果比较
从图1可以看出,BP模型校正集和预测集的相关系数分别为 0.81和0.85;GA-BP模型校正集和预测集的相关系数分别为0.95和0.96。对比表6中两种模型的结果可以看出,GA-BP模型性能明显优于BP模型,其校正集和预测集的相关系数均大于0.90,高于BP模型对应的相关系数;同时,GA-BP模型的 RMSEC 和 RMSEP 均小于BP模型的RMSEC和RMSEP,且两者更加接近,说明GA-BP算法建立的模型具有更小的预测误差,拟合效果更好。综合来看,GA-BP模型的准确性和精确性均优于BP模型,说明通过遗传算法优化权值阀值的神经网络的预测效果优于标准的神经网络,GA-BP神经网络建立的预测模型能更好地评价烟草精油的感官品质。
3 结 论
本研究结合化学计量学方法对经SFE-MD技术提取所得的烟草精油建立了感官质量评价预测模型。研究结果表明,利用GA-BP算法建立的感官质量预测模型是可行的,所建立模型可根据烟草精油中各类致香指标对其感官评吸分数进行合理预测,且预测结果较准确,具有一定实用价值。本研究使用主成分分析对原始样本数据进行预处理,筛选出特征参数,可在保留原始数据绝大部分信息的前提下,对数据进行合理降维和相关性剔除处理,以便于建模过程参数的合理选择,起到优化网络结构的目的。同时,通过对比标准BP神经网络和遗传算法优化的BP神经网络所建立模型的预测效果发现,GA-BP用于建立预测模型更加合理,预测效果更好。GA算法能对BP神经网络的权值和阈值进行全局搜索寻优,可有效解决BP神经网络收敛速度慢,以及易陷入局部最小值等缺陷,使得建立模型的效果更优。本研究实验过程中采用30批样本对所建模型进行精度检验,其预测值与实验值间的相关系数为0.96,预测均方根误差为1.81,说明GA-BP模型具有很好的拟合能力和预测能力,适用于烟草精油中各类致香成分与烟草感官品质两个不同体系之间的相关性研究,对于烟草质量品质评价和烟草化学的研究具有重要的理论和实际意义。
[1] Shi H Z,Liu G S,Yang H J,Ji X M.TobaccoAromaScience.Beijing:Chinese Agricultural Publishing House(史宏志,刘国顺,杨惠娟,姬小明.烟草香味学.北京:中国农业出版社),2011:10-13.
[2] Jing Y Q,Gong C R,Zhang Y H,Liu X P,Li Y Q.Chin.TobaccoSci.(景延秋,宫长荣,张月华,刘晓萍,李炎强.中国烟草科学),2005,26(2):44-48.
[3] Wu L J,He Z J,Wu Y S,Liu J Y,Li C Z,Cao J L,Wang B X,Min S G.AsianJ.Chem.,2013,25(16):8853-8858.
[4] Qiao X Y,Wang B,Ma Y P,Fan J Q,Xiong B,Ruan X M,Gao Z H,Zhang Z P,Shen Y J,Luo D S.TobaccoSci.Technol.(乔学义,王兵,马宇平,范坚强,熊斌,阮晓明,高泽华,张朝平,申玉军,罗登山.烟草科技),2014,(9):5-9.
[5] Deng X H,Yang L L,Lu Z S,Zhou M L,Tian F,Tian M C,Xiang D M.ActaTabacariaSin.(邓小华,杨丽丽,陆中山,周米良,田峰,田茂成,向德明.中国烟草学报),2013,19(5):22-27.
[6] Feng X H,Li Y Y.Agric.Sci.Technol.(冯小虎,李琰琰.农业科学与技术),2016,17(1):168-174.
[7] Wang L L,Tang C Q,Wang Y H,Dou Y Q,Cao J M,Zhang Y Z,Ding R,Wang Y B.ActaTabacariaSin.(王丽丽,汤朝起,王以慧,窦玉青,曹建敏,张义志,丁睿,王允白.中国烟草学报),2013,19(3):23-27.
[8] Shao H F,Xu Z C,Li D L,Zheng C,Dai Y,Ren S C.ActaTabacariaSin.(邵惠芳,许自成,李东亮,郑聪,戴亚,任胜超.中国烟草学报),2011,17(2):8-12.
[9] Li H X,Pan W J,Li J W,Huang F.HubeiAgric.Sci.(李洪勋,潘文杰,李建伟,黄峰.湖北农业科学),2013,52(8):1836-1841.
[10] Xia B B,Liang Y J,Zhang Y,Meng G Y,Feng J X,Liu S M,Wang Y B.Chin.TobaccoSci.(夏冰冰,梁永江,张扬,孟广宇,冯俊喜,刘善民,王允白.中国烟草科学),2015,36(1):30-34.
[11] Wang Y J,Zhou J H,Li Q,Zhang Y Y,Zeng M,Xie Y,Mao J S.TobaccoSci.Technol.(王育军,周冀衡,李强,张一扬,曾敏,解燕,毛建书.烟草科技),2014,(11):67-73.
[12] Liu Z G,Tuo Y Y,Ma C F,Wang Q,Yu C F,Zhang Y J.GuizhouAgric.Sci.(刘志广,拓阳阳,马长峰,王强,于存峰,张友杰.贵州农业科学),2016,44(7):113-116.
[13] Lu H T.PartialLeastSquaresRegressionModelsandAlgorithmsResearch.Beijing:North China Electric Power University(陆洪涛.偏最小二乘回归数学模型及其算法研究.北京:华北电力大学),2014.
[14] Wang C K,Pan X Z,Zhou R,Liu Y,Li Y L ,Xie X L.ActaPedolog.Sin.(王昌昆,潘贤章,周睿,刘娅,李燕丽,解宪丽.土壤学报),2012,49(2):237-245.
[15] Wu L C,Zhang F,Chen Y L.J.YibinUniv.(吴良超,张帆,陈延礼.宜宾学院学报),2013,13(6):43-46.
[16] Xu L M,Wang Q,Chen J P,Pan Y Z.J.JilinUniv.:EarthSci.Ed.(徐黎明,王清,陈剑平,潘玉珍.吉林大学学报:地球科学版),2013,43(1):186-191.
[17] Wang T,Zhao M Y,He B J,Huo X K,Xu X J,Xu Z Q,Zhuo H L,Xie J D,Ma Y P,Hu J.TobaccoSci.Technol.(王甜,赵明月,何保江,霍现宽,徐秀娟,徐志强,卓浩廉,谢金栋,马宇平,胡军.烟草科技),2015,48(7):46-52.
Sensory Evaluation on Tobacco Based on Endogenous Aromatic Components and Chemometrics
XU Jin-qiao1,CHEN Yong1*,TAN Man-liang2,XU Qing-quan3,WU Jian3
(1.Institute of Modern Chinese Medicine,College of Pharmaceutical Sciences,Zhejiang University,Hangzhou 310058,China;2.Suzhou Industiral Technology Research Institute of Zhejiang University,Suzhou 215163,China;3.China Tobacco Zhejiang Industrial Co.,Ltd.,Hangzhou 310024,China)
The principal component analysis method combined with genetic algorithm and neural network was used to establish the sensory evaluation model based on the endogenous aromatic components of tobacco.GC-MS method was used to qualitatively and quantitatively analyze the endogenous aromatic components of tobacco essential oil obtained by supercritical extraction and molecular distillation.Initially,principal component analysis(PCA) was used to analyse endogenous aromatic components.Scores of the five extracted principal components and sensory evaluation were then used as the input and output variables,respectively.Back-propagation(BP) neural network was used to establish the prediction model.Genetic algorithm(GA) was further applied to optimize the neural network weights and thresholds.The experimental results showed that the performance of GA-BP model was better than that of BP.The correlation coefficient between the predicted value by the GA-BP model and the experimental value was 0.96,and the root mean square error of prediction(RMSEP) was 1.81.The GA-BP model showed better fitting ability and prediction ability.The model could effectively predict the sensory quality of the essential oil.
principal component analysis;endogenous aromatic components;chemometrics;Genetic algorithm;BP neural network;sensory evaluation
2017-01-04;
2017-02-20
国家自然科学基金资助项目(21275138);浙江中烟工业有限责任公司科技项目(ZJZY2014A003)
10.3969/j.issn.1004-4957.2017.06.010
O657.72;F768.29
A
1004-4957(2017)06-0762-06
*通讯作者:陈 勇,博士,研究方向:中药制药过程关键工艺建模与仿真,Tel:0571-88208427,E-mail:chenyong1@zju.edu.cn