APP下载

含苯环化合物结构与毒性关系研究

2019-09-25吕思源袁子雄廖立敏

山东化工 2019年17期
关键词:描述符氢原子苯环

龙 环,吕思源,袁子雄,廖立敏

(内江师范学院 化学化工学院,四川 内江 641100)

随着化学工业的迅猛发展以及人们生活水平的提高,使环境中有毒污染物的种类和数量日益增多,同时给我们的生态环境造成了巨大的威胁。含苯环有机化合物大多都是有毒害作用的物质,随着工业废水、农业径流水、生活污水等大量排入水体,对水生生物的生长、发育和繁殖构成严重危害,破坏了水生生态系统平衡,对动物和植物具有间接的或直接的危害,甚至使生物产生致癌、致畸和致突变作用[1-2],因此对其性质进行研究具有重要的意义。定量构效关系[3-4](QSAR)在环境毒理学方面已应用得非常广泛,本文以部分含苯环有机化合物为研究样本,对其结构进行了参数化表达,成功构建了该类化合物的QSAR模型,可望为定量评估和预测该类化合物的生物毒性及环境效应提供理论依据。

1 数据集的选取

本文采用的数据取自文献[5-6],其中EC50表示呆鲦鱼的半数致死浓度,常用负对PEC50表示,列于表1。

表1 化合物及毒性(PEC50)Table 1 Compounds and their toxicity (PEC50)

表1(续)

2 原理与方法

非氢原子自身及非氢原子之间的关系对分子性质有重要影响,处在不同微环境中的非氢原子及不同类型非氢原子间的关系对分子性质的贡献不同,处在相同微环境中的非氢原子及非氢原子间的关系对分子性质的贡献具有加和性。首先根据分子中的非氢原子所处微环境借鉴文献[7-9]方法将其分为A1、A2、A3、A4四种原子类型,分别表示与1、2、3、4个其它非氢原子直接相连,如与两个非氢原子直接相连的仲碳原子属于A2原子类型。然后根据非氢原子电子层结构及该原子在分子中的链接情况,借鉴文献[10]方法采用式(1)计算非氢原子特征值Zi:

式中:mi、ni、hi、ti、πi及Xpi依次为原子i的价电子数、电子层数、直接键合的氢原子数、自旋平行的单电子数、成π键单电子数、Pauling电负性,Xpc为碳原子的Pauling电负性。例如羰基氧原子“=O”按式(1)可求得Zi=10.9191。此原子特征值较复杂,但是它把关于原子结构的量化参数经非线性组合,使其蕴涵了分子中成键非氢原子丰富的结构信息,能较好反映取代基团对化合物性质的贡献。

对于非氢原子间的关系对化合物性质的贡献,首先应构建非氢原子之间的某种关系。非氢原子之间的关系并不是非氢原子间某种直接的作用方式,而是要反映出相关程度随两者距离增减呈反向变化,以及随非氢原子特征值改变呈正向变化的两个趋势。参照万有引力定律,采用倒数形函数式(2)进行计算:

Z为非氢原子特征值,按式(1)计算;rij是非氢原子i、j之间的相对距离(即所经最短途径键长之和与碳碳单键键长之比);n和l为非氢原子所属类型。化合物分子中四种不同类型的非氢原子可以组合出以下10种相关项:m11、m12、m13、m14、m22、m23、m24、m33、m34、m44,分别以x1、x2、…x9和x10表示。

依据以上原理,对于所有的化合物将产生10个变量(结构描述符)来描述分子结构,25个化合物中缺乏第四类原子之间的相关项,得到的描述符中有4个为全“0”项,其余6个非全“0”结构描述符用于建模研究。

3 建模与分析

3.1 多元线性回归(MLR)模型

首先利用6个描述符采用多元线性回归(MLR)对25个样本建立模型,MLR是一种经典建模方法,它对自变量和因变量加以线性拟合以得到最小二乘意义下最佳结果。其多元线性回归模型为(M1):

PEC50= -55.981-0.632×x1+0.039×x2-0.092×x3

+1.238×x5+1.421×x6+1.784×x8(3)

模型拟合:R=0.915,SD=0.319,F=15.427。R为复相关系数;SD为标准误差;F为显著性检验值。

图1 R及RCV随逐步回归变化情况Fig.1 R and RCV changes with stepwise regression

图2 SD及SDCV随逐步回归变化情况Fig.2 SD and SDCV changes with stepwise regression

R为0.915,说明模型具有良好的内部估计能力,为提高模型的稳定性和预测能力,消除变量之间的共线性,使用逐步回归(SMR)的方法对变量进行了筛选。逐步回归每一步建模都采用“留一法”进行检验,相关系数、标准误差分别以RCV、SDCV表示。在逐步回归中随着变量的引入,R/RCV及SD/RCV变化情况如图1、图2所示。

从图1、2可以看出当逐步回归进行到第4步时,R接近最大值,RCV达到最大值,继续增加变量R变化甚微,而RCV反而变小。此时SD和SDCV同时达到最小值,因此4变量模型(M2)最优。

PEC50= 11.625-1.135×x1-0.067×x2-0.168×x5-0.145×x6(4)

R=0.914,SD=0.304,F=25.437,RCV=0.777,SDCV=0.472,FCV=7.625

M2与M1比较,虽然R值略微降低,但是模型的变量数减少了2个,模型的复杂程度大大降低了。另外,4变量模型的SD和SDCV均比6变量模型的相应值大,说明4变量模型更优越,4变量模型对样本毒性预测结果见表1中Cal.列。从表可以看出,两模型对样本的计算值与实验值极为接近,计算误差较小,本文取得的结果仍然是满意的。

4 结论

本文采用新构建的分子结构描述符,对一系列含苯环有机化合物的结构进行表征,并成功构建了QSAR模型,对含本环化合物毒性进行了模拟预测。描述符可以直接从分子结构计算获得,没有引进其他结构参数和经验参数,计算简单和方便。本文对于含苯环有机化合物的结构-环境效应研究具有一定的参考价值。

猜你喜欢

描述符氢原子苯环
芳香族化合物同分异构体的书写
基于结构信息的异源遥感图像局部特征描述符研究
若干类芳香族化合物的改良Sombor指数
基于AKAZE的BOLD掩码描述符的匹配算法的研究
限定条件下芳香族有机物同分异构体的书写
基于深度学习的局部描述符
特征联合和旋转不变空间分割联合的局部图像描述符
对氢原子能量吸收的再认识お
系统分析法判定苯环上多元取代物的同分异构体
α-铁中氦缺陷对氢原子的俘获