APP下载

基于神经网络的香水百合香气成分的定量结构色谱保留相关

2018-03-15琴,张丹,朱

许昌学院学报 2018年2期
关键词:香水百合预测值

何 琴,张 丹,朱 蕾

(许昌学院 化学化工学院,河南 许昌 461000)

香水百合是百合花的一种,以其清新扑鼻的香气得名.香气是衡量果实[1,2]、烟叶[3,4]、茶[5,6]、酒[7,8]等风味品质的重要指标,也是衡量花卉质量[9,10]的重要内容.香气成分量微而复杂,近年来大多侧重于定性、定量研究香气的主要成分[2~10].定性、定量研究香气主要成分时,通常需选用不同的方法获得其挥发性组分后,结合气相色谱/质谱联用仪进行测定[11,12],方法较为繁琐.近年来,物质定量结构-色谱保留相关(Quantitative structure retention relationship,QSRR)研究备受关注[13-16],可用于解释和预测各种香气物质的色谱保留行为[17],在香气成分的分析、基于香气成分的聚类评价及产地预报等方面应用广泛,能够解决一些传统的化学研究方法难以解决的问题[18,19].因此,QSRR技术对于建立香气中化合物分子结构与色谱保留之间的变化规律具有重要的意义.

有关香水百合头香成分的QSRR研究,论文采用人工神经网络(Artificial Neural Network,ANN)方法构建香水百合头香成分的QSRR模型,分别建立结构与色谱保留时间、结构与Kovats指数的定量关系的一维和二维模型,对预测香水百合头香成分色谱保留值、选择其分离条件等具有重要意义,并为了解香水百合头香成分特征,对香水百合进行深加工和开发应用以及香水百合香气成分分离条件的选择等提供适当的理论依据.

1 材料与方法

1.1 数据来源

香水百合头香成分结构数据和色谱保留数据来源于文献[17].

1.2 研究方法

采用ANN方法建模,构建一维(保留时间、科瓦茨指数)分别预测模型和二维(保留时间和科瓦茨指数)同时预测模型,并与多元线性回归(multiple linear regressions,MLR)方法进行比较.

1.3 模型的检验

一个好的模型除了拥有很好的自相容能力和泛化能力,还必须进行必要的模型检验.论文采用留一交叉检验法(Leave-one-outcross-validation ,LOO-CV)和外部检验相结合的方法对构建的模型进行稳健性和交叉预测能力的检验.

2 结果与讨论

2.1 BP-ANN模型的网络拓扑结构及相关参数

经过反复的数据试验,最终确定BP-ANN模型的网络拓扑结构为6×4×1(二维模型6×4×2),网络目标函数为10-5,网络学习速度为0.1,网络训练步长为10 000.

2.2 BP-ANN法与MLR法预测结果比较

在BP-ANN的最优条件下,一维模型分别预测和二维模型同时预测的预测值、MLR模型预测值及相对误差见表1.

表1 ANN和MLR预测结果

注:*表示测试集;1为one-dimensional model,一维模型;2为two-dimensional model,二维模型.

图1 ANN和MLR预测相对误差值散点图

挑选BP-ANN二维模型的同时,将预测得到的RI(Kovats)预测值与文献值之间的相对误差做相对误差分布图,如图1所示,并将其与MLR法进行比较.

由表1和图1可见,BP-ANN模型预测值(一维分别预测和二维模型同时预测)与实验值比较接近,与MLR法也相当.而MLR法在多维预测时,需要分别构建多个模型才能实现,方法比较耗费时间.ANN一维模型分别预测的RI(Kovats)预测值与文献值的相对误差分布在-6.84%~2.90%之间,ANN二维模型同时预测的RI(Kovats)预测值与文献值的相对误差分布在-3.70%~4.16%之间,MLR法的相对误差分布在-3.55%~6.62%之间,说明BP-ANN拟合能力与MLR法相当.但是,二维模型可以同时预测保留时间和保留值,相对于MLR法需要建立两个模型分别进行预测而言,更节省时间.这意味着在实际应用时,神经网络多元建模可以更好地节省时间成本.另外,二维模型同时预测与一维分别预测所得数值相当,说明BP-ANN模型的同时预测效果也非常好.

2.3 留一交叉检验和外部检验

以Kovats保留指数为代表,进行模型相关分析.三种模型的相关分析如表2、图2、图3所示.一维BP-ANN模型线性相关系数R为0.994 6(Kovats保留指数)和0.999 3(保留时间),ANN二维同时预测模型的相关系数R为0.991 3(Kovats保留指数)和0.990 9(保留时间),MLR模型相关系数R为0.990 1,BP-ANN模型略优于MLR模型,自相容能力更好.基于BP-ANN模型的训练集留一交叉检验相关系数RCV分别为0.999 3(Kovats保留指数、一维)、0.999 7(保留时间、一维)和0.994 1(Kovats保留指数、二维)、0.988 8(保留时间、二维),而基于MLR法的训练集(Kovats保留指数)留一交叉检验相关系数RCV为0.990 5,说明三种模型的稳健性相当.而基于BP-ANN模型的外部检验相关系数Rext为0.983 1(Kovats保留指数、一维)、0.997 2(保留时间、一维)和0.981 0(Kovats保留指数、二维)、0.983 6(保留时间、二维),基于MLR法的外部检验相关系数Rext为0.893 7,说明BP-ANN法的泛化能力优于MLR法.

表2 BP-ANN网络模型和MLR模型的效果分析

图2 基于BP-ANN的35种香气成分保留时间的实验值与预测值的相关分析(一维)

图3 基于MLR的35种香气成分保留时间的实验值与预测值的相关分析(一维)

由上可知,可以采用BP-ANN进行保留时间和保留值的二维同时建模,模型稳健性与BP-ANN一维模型相当,自相容能力和泛化能力优于MLR一维模型.不过,二维模型在稳健性相当的前提条件下具有快速和准确的优势,比一维模型更能大量节省时间.

3 结论

采用人工神经网络中的误差反向传播神经网络BP-ANN对35种香水百合头香成分进行了QSRR研究,分别建立了BP-ANN的一维模型和二维模型,并且模型预测得到的预测值与文献值非常接近,相对误差分布在-6.84%~2.90%(一维模型)和-3.70%~4.16%(二维模型)之间,与MLR法的相对误差分布(-3.55%~6.62%)相当.BP-ANN二维模型具有自组织、自适应和自学习能力,可以同时预测多种色谱保留值,大量节约时间.在模型的稳健性方面,两种方法基本相当,但BP-ANN的外部预测能力要更强一些.

[1] 郭东花,范崇辉,李高潮,等.不同果袋对“阿布白”桃果实香气成分的影响[J].食品科学,2016,37(2):232-237.

[2] 胡文舜,蒋际谋,黄爱萍,等.“晚香”龙眼果实香气成分的3种萃取头GC-MS效果分析[J].福建农业学报,2015,30(12):1 149-1 154.

[3] Yan Jun, Liu Xin-Bo, Zhu Wei-Wei, et al. Retention Indices for Identification of Aroma Compounds by GC:Development and Application of a Retention Index Database[J]. Chromatographia, 2015, 78(1): 89-108.

[4] 潘 玲,云月利,孙光伟,等.湖北烤烟中性香气成分的主成分分析和聚类分析[J].湖北大学学报:自然科学版,2016,38(2):127-134.

[5] 乔 阳,杜丽平,肖冬光.不同极性色谱柱在滇红香气成分分析中的对比研究[J].茶叶科学,2016,36(1):38-44.

[6] 鲍忠赞,董荣建,邓昭浦,等.基于陈茶特征香气成分的绿茶新茶和陈茶鉴定方法的研究[J].茶叶科学,2015,35(6):583-588.

[7] 刘殿锋,吴春昊,朱学文,等.番茄酒香气成分的气相色谱-质谱分析[J].酿酒科技,2016(2):104-106.

[8] 陆 印,陈 亮,胡仙妹,等.不同蒸馏次数对蓝莓白兰地香气成分影响[J].食品研究与开发,2016,37(1):95-99.

[9] Yang Xiaoxia, Zhao Jing, Zheng Jian, et al. Analysis of floral scent emitted from Syringa plants[J]. Journal of Forestry Research, 2016, 27(2): 273-281.

[10] 张辉秀,胡增辉,冷平生,等.不同品种百合花挥发性成分定性与定量分析[J].中国农业科学,2013,46(4):790-799.

[11] Li Zuguang, Cao Hui, Lee Mawrong, et al. Analysis of Volatile Compounds Emitted from Chimonanthus praecox (L.) Link in Different Florescence and QSRR Study of GC Retention Indices[J]. Chromatographia, 2009, 70(7-8): 1 153-1 162.

[12] 高天荣,徐 锐,杨 树,等.GC、GC/MS分析香水百合香精的化学成分[J].云南师范大学学报,2005,25(5):55-57,70.

[13] Noorizadeh Hadi, Farmany Abbas. QSRR Models to Predict Retention Indices of Cyclic Compounds of Essential Oils[J]. Chromatographia, 2010, 72(5-6): 563-569.

[14] 陈 欣,金 俏,金 飙.QSRR结合人工神经网络预测多氯联苯色谱保留时间[J].计算机与应用化学,2013,30 (5):515-518.

[15] Ghavami Raouf, Faham Shadab. QSRR Models for Kováts’ Retention Indices of a Variety of Volatile Organic Compounds on Polar and Apolar GC Stationary Phases Using Molecular Connectivity Indexes [J]. Chromatographia, 2010, 72(9-10): 893-903.

[16] Li Zuguang, Cao Hui, Lee Mavrong, et al. Analysis of Volatile Compounds Emitted from Chimonanthus praecox (L.) Link in Different Florescence and QSRR Study of GC Retention Indices[J]. Chromatographia, 2009, 70: 1 153.

[17] 曹 慧,李祖光,杨美丹,等.香水百合头香成分的定量结构-色谱保留关系研究[J].分析测试学报,2008,28(11):1 198-1 202.

[18] Angelo Antonio D’Archivio, Maria Anna Maggi, Fabrizio Ruggieri. Artificial neural network prediction of multilinear gradient retention in reversed-phase HPLC:comprehensive QSRR-based models combining categorical or structural solute descriptors and gradient profile parameters [J]. Analytical and Bioanalytical Chemistry, 2015, 407(4): 1 181-1 190.

[19] 李祖光,曹 慧,王丽丽,等.萜类化合物的QSRR研究及其在结构鉴定中的应用[J].化学学报,2009,67(4):289-294.

猜你喜欢

香水百合预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
香水
AI讲座:ML的分类方法
风吹百合香
清心消暑话百合
一款畅销21年的现代+经典香水——点评贝丽丝1997香水
做桂花香水
百合依依
香水省着用小贴士