APP下载

基于分子电性距离矢量的酚类结构与活性关系

2015-03-19刘红霞吴风林

湖北理工学院学报 2015年3期
关键词:电性苯酚毒性

刘红霞,李 琼,吴风林

(1湖北理工学院环境科学与工程学院,湖北黄石435003;2湖北理工学院矿区环境污染控制与修复湖北省重点实验室,湖北黄石435003)

酚类化合物已成为重要的环境有毒污染物,世界各国对于其环境污染和生态效应的研究都给予了高度重视[1-2]。其中,酚类化合物对水生生物的影响不容忽视,它能够使水生生物繁殖能力下降、生长变慢,甚至导致其死亡[3-5]。已有研究表明,酚类化合物具有较强激素作用,是诱发肿瘤的环境内分泌干扰物[6-8]。因此,对酚类化合物生物活性的研究具有重要意义。

酚类化合物种类繁多、数量庞大,近年来相关研究者已广泛运用定量结构-活性相关(Quantitative Structure-Activity Relationship,QSAR)推测其分子结构与生物活性的关系。酚类化合物常用的分子结构参数有物理化学参数、拓扑参数、几何参数以及量子化学参数[9],主要计算方法有拓扑指数法[10-11]、比较分子力场方法(CoMFA)[12]、支持向量机法[13-14]、量子化学密度泛函理论(DFT)法[15-16]等。QSAR 所建模型稳定性好,适用于预测酚类化合物各类生物活性,在研究环境污染物毒性方面有重要的实用价值。

近年来,分子电性距离矢量(Molecular Electronegativity-Distance Vector,MEDV)用于对多种有毒化合物的结构与活性研究,已显示出其良好的分辨率和高度相关性[17-18]。而将MEDV 用于酚类化合物对水生生物急性毒性等活性的研究相对较少[19-21]。因此,本文采用MEDV 法对25 种取代酚进行了结构表征,运用多元线性回归(Multiple Linear Regression,MLR)建立了该类化合物与其生物活性的QSAR 模型。

1 生物活性数据

王连生等报道了25 个取代酚化合物对黑头呆鱼的毒性数据,即其对黑头呆鱼的半数致死浓度LC50[10]。本文引用该LC50值,取其负对数(-lgLC50)作为生物活性指标,将25 个取代酚的MEDV 值以及对黑头呆鱼的毒性实验值、预测值列于表1。

表1 25 个取代酚的MEDV 值以及对黑头呆鱼的毒性实验值、预测值

2 MEDV 计算

2.1 MEDV 的原理

MEDV 需要指定分子中4 种非氢原子类型,用来表达分子中电性不同的原子以及不同类型化学键特征。MEDV 具体定义:根据与其相连的非氢原子数目将碳(C)、氧(O)、氮(N)、硫(S)等非氢原子分为1,2,3,4 这4 种原子类型,原子类型通常以k 或l 表示。如果k =1,表示该原子只与1 个非氢原子相连;依次类推,k =2,3,4,分别表示该原子与2 个、3个、4 个非氢原子相连。

MEDV 定义原子属性,意在表征不同原子或同一原子由于处于不同环境而性质不同的结构特征。原子属性包含元素的电负性和成键特性,可以反映出该原子在分子中的化学键型。一般地,原子属性以1 个双字符串表示,其中,第1 个字母表示原子元素符号,第2 个字母或数字表示键型。如原子属性为“CC”,表示该原子为处于共扼体系中的碳原子,第1个字母是该原子元素符号“C”,第2 个字符“C”表示碳原子(C)处于共扼体系中。

MEDV 定义相对电性及相对键长。某元素相对电性(q)为该元素电负性与碳元素电负性(2.55)的比值,如氧和氮的相对电性分别为q = 3.44/2.55 = 1.3490 和q = 3.04/2.55 = 1.1922。某化学键相对键长(d)为该键键长与碳碳单键(C-C,0.154 nm)的比值,如CC-CC 键的相对键长为d =0.144/0.154=0.9351 nm。分子结构中大多数化学键的键长数值变化小,考虑到计算的简便性,除共扼与环体系外同一化学键在不同分子环境中的键长均看作相等[22]。

2.2 MEDV 的计算

众所周知,一个化合物的分子性质取决于分子结构中不同环境原子间的各种相互作用,其大小随着原子的电性、化学键型以及各种连接关系而变化。MEDV 就是一个新的矢量型结构描述子,表示分子结构中各非氢原子的不同结构特征,通过获得各非氢原子之间的相互作用来定量估计分子的性质。MEDV 的计算公式如下:

式(1)中,k 或l 指原子类型,原子i 和j 分别属于第k 类型和第l 类型;qi和qj分别指原子i 和j 的电性(以相对电性表示);dij指原子i 和j之间的距离(以相对键长表示),是原子i 通过一个或多个化学键到原子j 的路径中各相对键长之和。因此,MEDV 应有10 个变量,依次为:M11、M12、M13、M14、M22、M23、M24、M33、M34、M44。

采用MEDV 计算方法得到了25 个取代酚的MEDV 值,具体数值如表1所示。其中,所有化合物的M44均为0,故舍去这一变量。

3 多元线性回归分析

3.1 多元线性全回归分析

采用SPSS17.0 统计分析软件对25 个取代酚化合物MEDV 值与生物活性实验值(表1)进行多元线性全回归法分析。其中变量M14被排除,得到8 个变量的预测模型(M1):

-lgLC50= 3.967 + 0.717 M11-0.010 M12-0.221 M13+ 0.100 M22-0.003 M23+0.307 M24+0.353 M33+0.383 M34;

统计参数:N =25,m =8,R =0.678,SD =0.712,F=1.701。

一般地,相关系数R 作如下划分[23]:

|R| <0.4 为低度线性相关,0.4 ≤|R| <0.7 为显著性相关,0.7≤|R| <1 为高度线性相关。模型(M1)中相关系数(R)为0.678,说明取代酚类化合物分子结构与其生物毒性之间存在着显著线性关系。

3.2 多元线性逐步回归分析

为消除变量间偶然性相关,逐步回归分析剔除影响模型稳定性的自变量而使回归方程始终显著。首先选择影响最显著的变量建立模型;再逐个引入其他变量,当原变量由于引入变量后影响不再显著时,就将其剔除。经过逐个“引入-剔除-引入”的反复过程,直到无显著变量引入也无显著变量剔除为止。采用SPSS17.0 统计分析软件进行逐步回归分析,结果如表2所示;逐步回归相关系数(R)及标准偏差(SD)随逐步回归的变化情况如图1所示。

表2 逐步回归分析结果(N=25)

图1 相关系数(R)和标准偏差(SD)随逐步回归的变化情况

由表2 和图1 可以明显看出,随着引入变量个数增加,相关系数(R)逐渐增大,标准偏差(SD)先逐渐减小而后逐渐增大。当引入变量数m =6 时,R =0.676,SD 最小(SD =0.673)。综合考虑各方面情况可以得出,当引入6 个变量时,建立的模型最好。此时用25 个取代苯酚的MEDV 值与其半数致死浓度LC50相关联,建立6 个变量的预测模型(M2)为:

-lgLC50= 4.038 + 0.344 M33-0.027 M12+ 0.096 M22+ 0.780 M11-0.231 M13+0.578 M24;

统计参数:N =25,m =6,R =0.676,SD =0.673,F=2.523。

模型(M2)中相关系数(R)为0.676。根据文献[23]对R 分级判定,同样说明取代酚类化合物分子结构与其生物毒性之间存在着显著线性关系。

3.3 模型的检验

比较2 个模型各统计参数(m,R,SD,F)。模型(M2)使用6 个变量得到与模型(M1)相同的相关系数(R),并且标准偏差(SD)更小,表明模型(M2)较模型(M1)更优越。使用模型(M2)对25 个取代苯酚生物毒性进行预测,计算结果如表1所示,将所得预测值与实验值相关情况绘于图2。在图2 中,绝大多数取代酚的实验值与预测值分布于过原点45°直线周围,只有少数化合物出现偏离。由此说明绝大多数取代酚的实验值与预测值呈显著线性关系,M2 模型对绝大多数取代苯酚生物毒性的预测值与实验值能较好地吻合。

图2 模型(M2)的预测值与实验值相关情况

3.4 对模型的讨论

针对25 种取代苯酚对黑头呆鱼急性毒性的QSAR 研究报道了3 种方法。王连生等采用拓扑指数法发现酚类结构与毒性之间显著相关(N =25,R =0.934)[10]。崔秀君等采用支持向量机法得到满意预测模型结果(N = 25,R =0.959)[13]。刘天宝等采用DFT 法得到稳定性和预测性良好的模型(N =25,R =0.964)[15]。需要指出的是,以上3 种方法涉及的分子结构描述子通常是单参数或者是大量描述子的各种参数的优化组合,因而所建立QSAR 模型的通用性和对异构体的分辨率均不太理想。MEDV方法采用矢量表征思想,对每个化合物均采用10 个参数表征其结构,适用于含多个杂原子、饱和键与不饱和键、环和非环等结构特征的化合物,具有较好的通用性[22]。对各类化合物和各种性质的QSAR 研究表明,MEDV 具有良好的分辨率和高度相关性[17-21]。

需要特别说明的是,本研究所选取的25种取代苯酚结构差别很大。25 种取代苯酚包括烷基取代苯酚、烷氧基取代苯酚、硝基取代苯酚、苯基取代苯酚、氯代苯酚、溴代苯酚、烯烃取代苯酚、萘酚等,各类取代苯酚的MEDV值相差较大(表1)。而很多文献均针对同一类型取代苯酚计算MEDV 值并建立QSAR 模型,如文献[19]分别针对14 个溴代苯酚、6 个氯代苯酚、48 个卤代苯酚进行讨论;文献[20]研究对象为20 个氯代苯酚;文献[21]研究对象为16 个氟代苯酚。因此,MEDV 方法对于同一类型化合物的QSAR 研究更为优越。

4 结论

计算了25 种取代苯酚的MEDV 值,采用SPSS 统计分析软件建立MEDV 值与取代苯酚生物活性的QSAR 模型,充分考虑各个非氢原子对酚类化合物生物活性的贡献。在此基础上,用逐步回归方法对变量进行筛选,得到的6 变量模型具有较好的预测能力。将所建模型与其他模型进行对比,MEDV 作为描述子进行QSAR 研究具有良好的通用性和高度分辨率。需要指出的是,MEDV 方法对于同一类型化合物的QSAR 研究更为优越。

[1]刘红霞,李琼.环境介质中挥发酚的监测技术现状与展望[J].环境科学与管理,2012,37(6):132-137.

[2]杜克久,徐晓白.环境雌激素研究进展[J].科学通报,2000,45(21):2241-2251.

[3]许文武,孟菁,胡威,等.5 种酚类化合物对3种水生生物的毒性作用[J].环境化学,2011,30(10):1751-1757.

[4]卢玲,沈英娃.酚类、烷基苯类、硝基苯类化合物和环境水样对剑尾鱼和稀有鮈鲫的急性毒性[J].环境科学研究,2002,15(4):57-59.

[5]聂晶磊,刘锋,周春玉,等.氯酚类化合物对金鱼的急性和亚急性毒性研究[J].环境科学研究,2001,14(3):6-8.

[6]张帅帅,刘堰,刘树深,等.不同终点检测5 种双酚A 类化合物对MCF-7 的细胞毒性[J].2012,33(11):3935-3940.

[7]郑敏,朱琳.五氯酚对斑马鱼胚胎的毒性效应研究[J].应用生态学报,2005,16(10):1967-1971.

[8]吕晓华,古燕,宋艳.壬基酚对红鲫、草鱼和鲢鱼的毒性及组织蓄积研究[J].卫生研究,2012,41(5):785-789.

[9]崔秀君.部分有机污染物构效关系的研究[D].长春:东北师范大学,2006.

[10]王连生,支正良.分子连接性与分子结构-活性[M].北京:中国环境科学出版社,1992:196-200.

[11]舒元梯.卤代苯酚和取代酚生物活性的分子拓扑研究[J].乐山师范学院学报,2005,20(5):44-46.

[12]钱力,陈华妮.取代苯胺和苯酚对鲤鱼毒性的3D-QSAR 研究[J].安徽农业科学,2010,38(24):13352-13354.

[13]崔秀君,王志欣,袁星,等.支持向量机用于酚类化合物毒性的QSAR 研究[J].计算机与应用化学,2008,25(5):298-302.

[14]李巍巍,代志军,谭显胜,等.基于支持向量回归的酚类化合物QSAR 建模[J].现代生物医学进展,2011,11(24):4857-4860.

[15]刘天宝,彭艳芬,汪新.DFT 法研究取代酚对黑头呆鱼的急毒性[J].计算机与应用化学,2012,29(2):175-177.

[16]叶庆国,宋斌,张宏哲,等.用密度泛函理论预测酚类化合物的正辛醇/水分配系数[J].化学研究,2011,22(4):66-71.

[17]周原,刘新玲,曾辉.酚类化合物色谱保留指数的估计与预测[J].湖南工程学院学报,2006,16(2):63-67.

[18]廖立敏,李建凤,王碧,等.酚类污染物土壤吸收系数定量预测[J].分析科学学报,2012,28(3):373-376.

[19]张建,孙体健,刁海鹏,等.分子电性距离矢量用于苯酚类化合物生物活性的QSAR研究[J].山西大学学报(自然科学版),2011,34(3):468-474.

[20]吕俊杰,宗喜梅,张生万,等.分子电性距离矢量用于氯苯酚对水生物毒性影响的研究[J].山西医科大学学报,2010,41(11):963-966.

[21]谢永红,廖立敏.氟化酚类化合物结构与生物毒性关系研究[J].河南师范大学学报(自然科学版),2012,40(2):112-114.

[22]刘树深,刘堰,李志良,等.一个新的分子电性距离矢量(MEDV)[J].化学学报,2000,58(11):1353-1357.

[23]郭红霞.相关系数及其应用[J].武警工程学院学报,2010(2):3-5.

猜你喜欢

电性苯酚毒性
毛细管气相色谱法测定3-氟-4-溴苯酚
亚洲将引领全球苯酚产能增长
动物之最——毒性谁最强
民间引爆网络事件的舆情特点——以“北电性侵事件”为例
用于燃烧正电性金属的合金的方法
苦豆子总碱对PC12细胞的毒性
色谱相关系数和随钻电性参数实时评价地层流体方法
负载型催化剂(CuO/TUD-1,CuO/MCM-41)的制备及其在一步法氧化苯合成苯酚中的应用
煅烧高岭土吸附Zn2+/苯酚/CTAB复合污染物的研究
带电粒子在磁场中的多解问题