APP下载

含氯苯酚类化合物结构表征与毒性预测

2017-03-14廖立敏李建凤雷光东

生态毒理学报 2017年6期
关键词:氢原子描述符氯苯

廖立敏,李建凤,雷光东

内江师范学院化学化工学院, 内江 641100

含氯苯酚类化合物用途广泛,如在木材防腐、水消毒、杀菌、除草等方面广泛应用。随着工农业的发展、废水的排放,含氯苯酚类化合物正在不断地进入江、河、湖、海等各种水体。环境中的含氯苯酚类化合物有毒、稳定性好,严重威胁动、植物生长和繁殖,影响人类健康。因此,研究含氯苯酚类化合物的性质对于规范其生产、使用和排放具有重要意义。定量构效关系(QSAR)研究是快速获取大量环境毒物生物毒性的有效手段之一,研究者们在这方面已经做过许多有意义的工作[1-3],在这些工作中都要进行分子结构优化或结构重叠等操作,计算工作量大、效率低,方法复杂难懂。含氯苯酚类化合物在淡水中的生物毒性QSAR研究已有一些报道,如顾云兰等[4]研究了氯酚化合物对发光细菌的毒性,仝建波等[5]研究了氯苯与氯酚类化合物对戈卑鱼的毒性。该类化合物对海洋生物毒性的QSAR研究较少,本文研究该类化合物对海洋中的杜氏盐藻的毒性。在有机化合物定量结构与性质关系(QSPR)研究中,分子结构参数化表达是关键的步骤之一。在分子结构参数化方面,实验室做过许多有意义的探索[6-9]。本文在参阅了文献的基础上,构建了新的结构描述符用于分子结构参数化表达,结构描述符完全来自化合物分子自身结构的计算,简单易懂、计算工作量小。采用偏最小二乘回归(PLS)建立了含氯苯酚类化合物结构与毒性(-lgIC50)关系模型,可为环境中有机污染物的QSAR研究提供参考。

1 材料与方法(Materials and methods)

1.1 实验材料

选取20 个含氯苯酚类化合物为研究样本,化合物毒性以其对海洋中的杜氏盐藻96 h的半数抑制浓度IC50表示,-lgIC50实验值取自文献[10],列于表1。

1.2 实验方法

1.2.1 化合物分子结构表征

化合物的毒性值(-lgIC50)除了与测量因素有关外,还与分子的结构相关,取代基的种类、大小及数目、杂原子等都会影响其毒性值(-lgIC50)。认为在化合物的隐氢图中,处于骨架地位的非氢原子及非氢原子之间的关系对化合物毒性值(-lgIC50)产生重要影响,而非骨架氢原子仅仅影响与其直接相连的非氢原子染色值。不同的非氢原子及不同类型的关系对毒性值(-lgIC50)的影响可能不同,首先将非氢原子按照文献[8-9]方法进行分类,记为A1、A2、A3、A4这4 种类型,A1表示与1 个其他非氢原子直接相连,以此类推。如与3 个非氢原子直接相连的叔碳原子属于A3。然后在参阅文献[11]的基础上为每个非氢原子进行参数化染色,采用式(1)计算。

Zi=[mi(ni-1)-hi]1/2

(1)

式中ni表示非氢原子i的电子层数,mi表示其最外层电子数,hi为与其直接连接的氢原子数。

各种类型的非氢原子自身对化合物毒性值(-lgIC50)的影响,按式(2)进行分类累加。

xk=∑Zi(k=1,2,3,4)

(2)

式中,k表示非氢原子i的原子类型;i为非氢原子在分子中的编码;Zi为非氢原子的染色值,按式(1)计算。根据非氢原子的分类,对于一个化合物最多含有4 种原子类型,因此最终可分类累加得到4 个非氢原子自身对化合物性质贡献项,用x1, x2, x3及x4表示。

(3)

Zi、Zj为非氢原子的染色值,按式(1)计算;dij为关系中的非氢原子i到非氢原子j的相对距离(两者间最短路径所经化学键键长之和/碳碳单键键长,如有多条路径,则以最短的为准);n和l为非氢原子按上述分类法所属类型;a=0.5。化合物中4类非氢原子可以组合出10种关系项:m11,m12,m13,m14,m22,m23,m24,m33,m34,m44,简写为x5,x6,… ,x13和x14,如m13(即x7)表示第1类非氢原子跟第3类非氢原子之间的关系,依此类推。这样对于所有的化合物最多将产生14个结构描述符值来描述结构信息。

1.2.2 QSAR建模与检验

采用偏最小二乘(partial least squares, PLS)回归方法建立模型,运用“留一法”对模型稳定性进行检验。PLS是近几十年发展起来的多元统计方法,在定量构效关系中广泛应用。PLS特别适合样本数较少,而变量数较多的情况建模。它通过对X和Y矩阵同时做双线性分解,并将分解所得潜隐变量再做一次最小二乘拟合以得到最终模型,详细原理请参见文献[12]。一般认为,建模相关系数(R2)在0.64~1.0之间,表明模型高度相关;标准偏差(SD)与数值范围的比例小于10%时,表明模型计算准确性良好;交互检验相关系数(Q2)≥0.50,表明模型具有良好的稳健性[13];模型对未参与建模的外部样本毒性预测误差小,表明模型预测能力强。

表1 化合物及其毒性(-lgIC50)Table 1 Compounds and their toxicity (-lgIC50)

2 结果(Results)

由于研究样本中不含有第4类非氢原子,因而得到的结构描述符中与第4类非氢原子相关的x4,x8,x11,x13,x14这5个变量为全“0”项,剩余9个变量用于建模分析。将化合物结构描述符作为自变量X,化合物毒性值(-lgIC50)作为因变量Y,建立偏最小二乘(PLS)模型。发现主成分数(A)为4的PLS模型效果良好,此时化合物毒性(-lgIC50)与原始自变量回归方程式为:-lgIC50= 18.359+0.213×x1+0.174×x2+0.203×x3-32.426×x5-2.413×x6-0.01×x7-1.336×x9-0.475×x10-0.219×x12。此时PLS模型建模相关系数(R2)为0.948,处在0.64~1.0之间;交互检验的相关系数(Q2)为0.922,远大于0.50;标准偏差(SD)为0.184,与数值范围[2.91-(-0.3)=3.21]之比为5.73%,小于10%的标准。

图1为样本在偏最小二乘(PLS)前2个主成分得分图,可以发现95%的样本点都落在95%置信度Hotelling T2椭圆置信圈内;为了考察样本在X空间的拟合情况,对样本在X空间的规格化模型距离作了分析(见图2),可以看到,所有样本的规格化模型距离都在95%的置信区间内,小于临界值1.926,没有特异点。以上说明本文构建的化合物结构描述符能够恰当表现含氯苯酚类化合物分子结构特征,并在统计模型中得到正确反映,模型总体质量良好,可以用于分析影响化合物毒性(-lgIC50)的结构因素。

图1 样本在前2个主成分得分分布Fig. 1 Compounds score distribution in the front two principal components

模型对每个样本的毒性值(-lgIC50)拟合程度的好坏,还可从样本的残差进行分析,图3为含氯苯酚类化合物的毒性值(-lgIC50)的标准化残差累积概率分布图,样本标准化残差基本服从正态分布,所有样本的标准化残差均小于±3 倍标准偏差,绝大多数样本的标准化残差小于±2 倍标准偏差,只有1个样本略微超出-2倍标准偏差范围,进一步说明模型拟合能力优良。

图2 偏最小二乘X空间规格化模型距离Fig. 2 Normalized distance to PLS model in X space

图3 标准化残差累积概率分布图Fig. 3 The cumulative probability of standardized residual

为进一步验证PLS模型稳定性,说明拟合效果是否为偶然因素所致,对模型进行了20 次Y随机排序验证(Y random permutations test)。以原始变量Y和排序后的变量Y的相关系数对模型的R2和Q2作图(图4),并作线性回归。一般来说,好的模型要求R2和Q2的截距分别小于0.300和0.050[14]。图中可以看到本文所建模型R2和Q2回归线的截距分别为:-0.0167和-0.480,因此可以认为模型的良好结果并非偶然因素所致。

图4 Y随机排序验证结果Fig. 4 The results of Y random permutations

图5 样本的偏最小二乘t1-u1图Fig. 5 The t1-u1 plot of the samples

图6 变量重要性投影Fig. 6 Importance of variables

为了分析X空间得分与Y空间得分的相关性,以t1-u1作图(见图5),从图中可以发现t1和u1之间表现出良好的线性相关性(相关系数R2达0.688),说明第一个主成分就可以很好地解析毒性数据Y中的信息。以毒性值(-lgIC50)大小进行着色,图中可以发现毒性值(-lgIC50)大的样本t1、u1得分值也较高,而毒性值(-lgIC50)小的样本t1、u1得分值也较低,化合物毒性值(-lgIC50)大小得到很好的区分和归类。

图6为变量重要性投影指标图,通过该图可以清楚地显示各结构描述符对化合物的毒性值(-lgIC50)的影响大小。一般认为,VIP大于1的变量对Y影响较大,解释能力较强。x5的VIP值明显大于1,因而对化合物毒性值(-lgIC50)影响最显著。x5对应于第 1 类非氢原子之间的关系项,说明第1类非氢原子的种类、数量及分布情况对该类化合物毒性值(-lgIC50)的影响显著,例如20号化合物具有最多的第1类非氢原子(取代基Cl),且分布均匀,因而具有最大的毒性值(-lgIC50)。含氯苯酚类化合物对杜氏盐藻产生毒性可能分为两步:化合物穿过细胞膜进入生物体内;化合物作为电子给与体或氢键受体而与生物体内的受体物质发生作用。化合物与受体发生作用主要是在羟基上,苯环上取代基Cl对羟基O原子净电荷影响较小,因而各化合物表现出的毒性效应主要取决于化合物对生物膜的穿透能力。苯环上的取代基Cl越多,化合物具有越大的脂水分配系数(KOW),越容易穿透细胞膜,因而毒性越大。

为进一步说明运用本文的结构描述符及所采用的建模方法构建的模型对外部样本的预测能力,抽取5、10、15和20号化合物(毒性值分别为0.88、1.39、1.73和2.91)作为外部测试样本,利用剩下的15个化合物同法建立模型。模型对上述样本毒性的预测值分别为0.88、1.28、1.63和2.46,误差分别为0.00、0.11、0.10和0.45。预测误差小,说明运用本文构建的结构描述符所建立的PLS模型预测能力强、预测效果好。PLS模型对全部化合物的毒性值(-lgIC50)进行了预测,预测值列于表1的Cal.列,误差列入Err.列,从表中也可以大致发现模型对化合物的毒性值(-lgIC50)预测准确性高、误差小,效果优良。

3 讨论(Discussion)

将化合物分子中非氢原子按照所连其他非氢原子数进行分类,将不同类非氢原子进行参数化染色,将分子中非氢原子自身染色参数值分类累加及非氢原子之间的关系作为结构描述符,对部分含氯苯酚类化合物结构进行了参数化表达,进而采用偏最小二乘回归(PLS)方法构建了该类化合物定量结构-毒性值(-lgIC50)的QSAR模型。模型经检验,具有可接受的预测能力与总体稳健性,可以用于含氯苯酚类化合物毒性值(-lgIC50)预测。本文所构建的分子结构描述符与文献[2-3]相比,不需要考虑分子构象优化、重叠等问题,因而具有简单易懂、计算方便、计算工作量小等优点,本文可为环境中有机污染物的QSAR研究提供一种新的方法,具有一定的参考价值。

[1] 廖立敏, 李建凤, 雷光东. 有机化合物结构与生物活性关系研究[J]. 环境污染与防治, 2017, 33(6): 653-657, 663

Liao L M, Li J F, Lei G D. Study on relationship between structure of organic pollutants and biological activity[J]. Envirmental Pollution and Control, 2017, 33(6): 653-657, 663 (in Chinese)

[2] 于艳军, 张勇, 韩伟, 等. N-取代氟乙酰胺结构与急性毒性的CoMFA和CoMSIA研究[J]. 生态毒理学报, 2015, 10(2): 183-189

Yu Y J, Zhang Y, Han W, et al. CoMFA and CoMSIA studies of N-substitued fluoroacetamide structures with acute toxicity [J]. Asian Journal of Ecotoxicology, 2015, 10(2): 183-189 (in Chinese)

[3] 堵锡华, 王晓辉, 冯长君. 1-取代-2-氨基苯并咪唑化合物毒性和热力学性质的密度泛函理论研究[J]. 生态毒理学报, 2014, 9(6): 1204-1209

Du X H, Wang X H, Feng C J. Density functional theory study on the toxicity and thermodynamic property of 1-replaced-2-amino benzimidazole compounds [J]. Asian Journal of Ecotoxicology, 2014, 9(6): 1204-1209 (in Chinese)

[4] 顾云兰, 费正皓, 张玉莹. 氯酚化合物对发光细菌毒性的构效关系研究[J]. 分析科学学报, 2012, 28(3): 333-337

Gu Y L, Fei Z H, Zhang Y Y. A quantitative structure-activity relationship study on the toxicity of chlorophenols to microtox [J]. Journal of Analytical Science, 2012, 28(3): 333-337 (in Chinese)

[5] 仝建波, 李云飞, 刘淑玲, 等. 氯苯与氯酚类化合物毒性的预测[J]. 计算机与应用化学, 2010, 27(3): 392-396

Tong J B, Li Y F, Liu S L, et al. Forecast toxicity of chlorinated benzenes and chlorinated phenols [J]. Chemical Research and Application, 2010, 27(3): 392-396 (in Chinese)

[6] Liao L M, Huang X, Lei G D. Structural characterization and octanol/water partition coefficient (logP) prediction for oxygen-containing organic compounds[J]. Chinese Journal of Structural Chemistry, 2017, 36(8): 1243-1250

[7] 廖立敏. 酚类化合物结构与醇/水分配系数(logKow)关系研究[J]. 生态毒理学报, 2017, 12(3): 709-715

Liao L M. Study on the relationship between structure and alcohol/water partition coefficients (logKow) of phenolic compounds [J]. Asian Journal of Ecotoxicology, 2017, 12(3): 709-715 (in Chinese)

[8] 廖立敏, 李建凤, 雷光东. 饮用水中挥发性有机物结构与色谱保留时间的关系[J]. 环境化学, 2017, 36(4): 710-715

Liao L M, Li J F, Lei G D. Relationship between structure and gas chromatography retention time of volatile organic compounds in drinking water [J]. Environmental Chemistry, 2017, 36(4): 710-715 (in Chinese)

[9] 廖立敏, 杨欢, 雷光东. 醛酮类化合物离子迁移谱QSSR研究[J]. 计算机与应用化学, 2016, 33(12): 1319-1321

Liao L M, Yang H, Lei G D. QSSR research on ion mobility spectrometry for aliphatic aldehydes and ketones [J]. Computers and Applied Chemistry, 2016, 33(12): 1319-1321 (in Chinese)

[10] Ertürka M D, Sacana M T, Novicb M, et al. Quantitative structure-activity relationships (QSARs) using the novel marine algal toxicity data of phenols [J]. Journal of Molecular Graphics and Modelling, 2012, 38: 90-100

[11] 王晓荣, 堵锡华.mB 对气相色谱保留指数的QSPR研究[J]. 南京工业大学学报, 2002, 24(3): 31-37

Wang X R, Du X H. The conectivity index for QSPR study of gas chromatography retention index[J]. Journal of Nanjing University of Technology, 2002, 24(3): 31-37 (in Chinese)

[12] 梅虎, 周原, 孙立力, 等. 氨基酸结构描述子矢量VHSE及其在肽QSAR中的应用[J]. 化学通报, 2005, 68(7): 534-540

Mei H, Zhou Y, Sun L L, et al. A new set of descriptors of amino acids and its application in peptide QSAR [J]. Chemistry, 2005, 68(7): 534-540 (in Chinese)

[13] 顾云兰, 陈鑫, 简美玲. 苯胺类化合物结构与毒性的密度泛函理论研究[J]. 化学研究与应用, 2015, 27(8): 1139-1144

Gu Y L, Chen X, Jian M L. Study on the structure-toxicity relationship of aniline compounds by density functional theory [J]. Chemical Research and Application, 2015, 27(8): 1139-1144 (in Chinese)

[14] Andersson P M, Sjöstrom M, Lundstedt T. Preprocessing peptide sequences for multivariate sequence-property analysis [J]. Chemometrics and Intelligent Laboratory Systems, 1998, 42: 41-50

猜你喜欢

氢原子描述符氯苯
基于结构信息的异源遥感图像局部特征描述符研究
一维模型氢原子在啁啾激光场中的阈上电离
氧化钙抑制固体废物焚烧过程中氯苯生成
Linux单线程并发服务器探索
关于氢原子跃迁问题的难点突破
利用CNN的无人机遥感影像特征描述符学习
对氢原子能量吸收的再认识お
氢原子n=2能级的二级斯塔克效应
2-(4-氯苯氨基)甲基苯酚降解的动力学研究
混二氯硝基苯氯化制备1,2,4-/1,2,3-三氯苯