APP下载

红葡萄酒香气成分色谱保留时间模拟

2015-10-16廖立敏

分析科学学报 2015年5期
关键词:分子结构描述符顶点

廖立敏*

(果类废弃物资源化四川省高等学校重点实验室,内江师范学院化学化工学院,四川内江 641199)

葡萄酒是由鲜葡萄、葡萄汁或葡萄皮经发酵酿造而成的低酒精度饮料,主要成分是水和乙醇。葡萄酒营养丰富,美味可口,广受人们欢迎。葡萄酒中含有大量的功能性成分,如白藜芦醇、儿茶酚、芸香苷、花色苷等,具有抗氧化、抗衰老、调节血脂、预防心血管疾病等多种保健功能[1 - 3]。发酵刚结束的葡萄酒存在口味粗糙、苦涩、香味淡薄、极不稳定、饮后缺乏回味感等缺陷,经过一段时间的贮存和陈酿后达到口感柔和、协调的最佳饮用状态[4,5]。于静等[6]采用固相微萃取法萃取赤霞珠干红葡萄酒的香气成分,结合气-质联用技术分离并鉴定出65种化合物。定量结构-色谱保留关系(QSRR)研究对预测化合物色谱保留时间、选择分离条件、探索色谱保留机理等具有重要意义。QSRR/QSAR研究首先需要将化合物分子结构进行参数化,即构建或引入适当的分子结构描述符,研究者们在这方面已经做过较多工作,例如二维分子结构描述符[7,8],利用分子二维结构直接计算获得,计算简便易懂,但对一些顺反异构等难以区分;三维分子结构描述符[9,10],利用分子空间结构进行计算,可区分顺反等异构体,但计算量大、计算复杂、使用不便。

本文在分子结构表征时,首先对分子中的非氢原子(即顶点原子)进行分类,根据非氢原子电子结构及在分子中的微环境计算出分子顶点特征值,将分子顶点特征值按其原子所属类型分别进行累加,作为分子顶点自身对化合物色谱保留时间的贡献项;再计算不同类型非氢原子之间的电性相互作用,作为分子顶点间的相互影响对色谱保留时间的贡献项。借助多元线性回归(MLR)和逐步回归(SMR)方法,构建了赤霞珠干红葡萄酒香气成分中65种化合物的分子结构和气相色谱保留时间之间的关系模型,以期为发酵果酒及精细化工产品的色谱行为提供有益参考。

1 原理与方法

有机化合物的色谱保留行为与分子结构直接相关,分子的大小、质量、柔韧性、极性、分子之间的氢键等都会影响化合物在色谱柱中的保留时间。在有机化合物分子的隐氢图中,每一个非氢原子即为分子顶点。我们认为分子顶点自身及分子顶点之间的相互作用对化合物色谱保留时间产生重要影响,处在不同微环境中的分子顶点及不同类型分子顶点间的相互作用对分子性质的贡献不同,处在相同微环境中的分子顶点及相同类型分子顶点的相互作用对分子性质的贡献具有加和性。因此首先需根据分子顶点所处微环境将其进行分类,借鉴文献方法[11 - 13]将分子内的顶点原子依据其所连接的其它顶点原子数分为A1、A2、A3、A4四种顶点原子类型,分别表示与1、2、3、4个其它分子顶点相连,如与三个分子顶点相连的叔碳原子属于A3顶点原子类型。然后根据顶点原子电子层结构及该原子在分子中的微环境,通过文献方法[14 - 16]并结合所研究化合物的性质特点,采用式(1)计算分子顶点特征值Zi:

Zi=[(ni-1)mi-hi]1/2

(1)

式中,ni为分子顶点i的电子层数;mi为分子顶点i的价电子数;hi为与分子顶点i直接连接的氢原子数。

对于不同类型分子顶点自身对色谱保留时间的贡献,按式(2)计算:

(2)

式中,i为分子顶点在分子中的编码;k为分子顶点i的顶点类型;Zi为分子顶点特征值(按式(1)计算)。根据顶点原子的分类,一个分子最多含四种顶点原子类型,每个分子最终可得到四个顶点项,用x1、x2、x3和x4表示。

对于分子顶点间的相互作用对色谱保留时间的贡献。采用文献方法[11 - 13]计算分子顶点间的相互作用,如式(3):

(3)

式中,Z为分子顶点原子相对电负性(即该原子电负性与碳原子电负性之比);rij为分子顶点原子i、j之间的相对距离(即所经最短途径键长之和与碳碳单键键长之比);n和l为分子顶点所属顶点原子类型。

化合物分子中四类分子顶点原子可以组合出以下10种相互作用项:m11、m12、m13、m14、m22、m23、m24、m33、m34、m44,分别记为x5、x6、x7、x8、x9、x10、x11、x12、x13和x14。这样对于所有的样本最多将产生14个变量(结构描述符)来描述分子结构信息。由于研究的65个红葡萄酒香气成分中缺少第四类顶点原子,得到的描述符中有5项(x4、m14、m24、m34、m44)为全0项,化合物非全0结构描述符值列入附表(由于版面所限,附表本文不拟发表,如读者需要可向作者索取)。

2 数据集的选取

本研究所采用的样本及其色谱保留时间的实验值来自于文献[6],文献作者采用固相微萃取(SPME)萃取赤霞珠干红葡萄酒的香气成分,化合物色谱保留时间是以DB-WAX石英毛细管色谱柱分离测得,结果列于表1(tR(Exp))。

表1 65个化合物结构描述符及色谱保留时间(tR)Table 1 Descriptors and chromatographic retention times(tR) of 65 compounds

(续表1)

3 结果与讨论

多元线性回归(MLR)在构效关系中最为常用,也是经典的建模方法之一。借助MLR方法对9个分子结构描述符和tR(Exp.)进行相关性研究,得到9变量的预测模型,见式(4):

tR=-10.679+16.795×x1+6.361×x2+5.027×x3-29.769×x5-14.195×x6

-7.774×x7-4.373×x9-1.675×x10-4.600×x12

(4)

模型拟合:N=65,R=0.913,SD=4.449,F=30.436;交互检验:RCV=0.818,SDCV=6.264,FCV=12.327。

式中,N为回归点数,R为复相关系数,SD为估计标准偏差,F为Fischer检验值;RCV为交互检验的复相关系数,SDCV为交互检验的标准偏差,FCV为交互检验的Fischer检验值。

该模型的复相关系数(R)较高,达到0.913,SD为4.449,模型拟合效果好。但交互检验的结果并不理想,其交互检验复相关系数(RCV)值与建模复相关系数(R)值相比下降较多,说明变量数过多,模型不够稳定。为进一步考察各描述符对QSRR建模过程的影响和对模型的贡献大小,对变量进行了逐步回归(SMR)分析,以偏F检验值对应的显著水平依次将变量引入模型,模型采用“留一法”进行交互检验。逐步回归的复相关系数(R/RCV)及标准偏差(SD/SDCV)随变量引入的变化情况见图1及图2。

从图1可以看出,随变量个数n的增加,建模复相关系数(R)及交互检验的复相关系数(RCV)逐渐增加,n=7时R接近最大值,而此时的RCV已达到最大值,继续增加变量R变化很小,而RCV反而有所下降。同样从图2也可以看出,随变量个数n的增加,建模标准偏差(SD)及交互检验的标准偏差(SDCV)逐渐减小,n=7时SD接近最小值,而此时的SDCV已达到最小值,继续增加变量SD变化很小,而SDCV反而有所增大。综合考虑R、SD、RCV和SDCV,说明应该选择7变量(列入表1)进行建模,7变量模型见式(5):

tR=-9.591+16.456×x1+6.467×x2+0.176×x3-26.466×x5

-13.973×x6-6.453×x7-4.496×x9

(5)

模型拟合:N=65,R=0.907,SD=4.507,F=37.646;交互检验:RCV=0.849,SDCV=5.656,FCV=20.930。

图1 R及RCV随逐步回归的变化情况Fig.1 Plot of R and RCV change with SMR

7变量模型与9变量模型相比,变量数由9个减少到了7个,模型的复杂程度大大降低了。虽然建模复相关系数(R)略微有所变小、标准偏差(SD) 略微有所增大,但是在交互检验中RCV有所变大、SDCV有所减小,说明7变量模型预测能力更强、模型更稳定。并且F及FCV都变大,说明7变量模型更加显著有效。模型中x1、x2、x3分别对应化合物第一类、第二类、第三类顶点原子自身的贡献,并且它们都与化合物色谱保留时间呈正相关,说明分子链越长、支链越多,化合物在色谱柱中保留时间就越长。

7变量模型对研究样本的色谱保留时间(tR)进行了模拟,计算值列于表1的tR(Cal)栏。计算值与实验值相关图见图3,从图3可以发现绝大多数样本点都落在45°直线附近,说明模型的估计和预测能力较强。误差分布见图4,以2倍模型标准偏差(SD)为限,大多数样本的计算误差都未超出此范围,只有4个样本(7、17、32和48号,不足7%)的计算误差超出±2SD,模型预测误差较为满意。个别样本点误差较大,可能是分子结构描述符不够完善,有些特殊的分子结构信息没有得到表达。也有可能是实验值本身就存在一定的误差,从而影响计算结果。大误差样本点毕竟只是少数,总体预测结果是值得肯定的。需特别说明的是,本文研究的样本体系中包含酯、醇、烯烃、羧酸、硫醚、呋喃等化合物,包含直链、苯环、五元环、六元环等结构,含有S、O等杂原子,化合物种类多、分子结构跨度大,对于这样一个复杂的样本体系,模型的结果应该是满意的。

图3 实验值与计算值相关图Fig.3 Calculated vs.experimental values

图4 计算值残差分布Fig.4 Comparative residuals of compounds

4 结论

本文通过分子顶点自身和顶点之间的相互作用对赤霞珠干红葡萄酒香气成分中的65个化合物结构进行了参数化表达,采用多元线性回归和逐步回归建立了该类化合物结构与气相色谱保留时间之间的关系模型。分子结构描述符完全来自分子本身的计算,计算过程相对简单。构建的分子结构描述符能够恰当表现该类化合物的结构特征,所建模型能较准确地预测该类化合物在文献所述条件下的色谱保留时间,在一定程度上阐明了化合物的色谱保留行为与其分子结构之间的关系。本文对于发酵果酒中的香气成分的QSRR研究具有一定的参考价值。

猜你喜欢

分子结构描述符顶点
基于结构信息的异源遥感图像局部特征描述符研究
过非等腰锐角三角形顶点和垂心的圆的性质及应用(下)
基于AKAZE的BOLD掩码描述符的匹配算法的研究
三步法确定有机物的分子结构
关于顶点染色的一个猜想
Linux单线程并发服务器探索
利用CNN的无人机遥感影像特征描述符学习
解读分子结构考点
外电场中BiH分子结构的研究
丙烯酸酯类降凝剂的Monte Carlo模拟计算及分子结构设计