APP下载

苯衍生物结构与毒性关系研究

2022-01-07蔡欣萍华志萍李建凤

湖南师范大学自然科学学报 2021年6期
关键词:氢原子衍生物毒性

蔡欣萍,华志萍,李建凤,2

(1.内江师范学院化学化工学院,中国 内江 641100;2.四川省高等学校“果类废弃物资源化”重点实验室,中国 内江 641100)

苯及衍生物常被用于各种溶剂及产品中,来源十分广泛,如工业生产、汽车尾气、装修装饰材料、办公设备等。由于生产活动和生活污染,苯及衍生物可在水、土壤、大气等环境介质中广泛检出。苯及衍生物大多有毒,对动植物生长、繁殖产生负面影响,并对人体血液、神经、生殖系统造成危害[1-3]。苯及衍生物种类多、数量大,可高达千万种以上,全面了解苯及衍生物的生物毒性,对于规范其生产和排放具有重要的意义。定量结构-性质关系为获取数以千万计的有机污染物环境参数提供了可行的途径且已有相关研究[4-6],化合物结构参数化是定量结构-性质关系研究的第一步,目前主要有二维(2D)结构表征法[7-9]和三维(3D)结构表征法[10-12]。3D法能再现化合物分子三维立体结构特征,能区分顺反异构体、光学异构体等,已经成为目前定量构效关系研究的主流方法。二维结构表征法由于其具有简单易懂、计算速度快,且多数情况下也能取得较为理想的结果等特点,在定量构效关系中仍然被广泛使用。本文基于苯及衍生物的2D结构,对非氢原子进行分类并参数化染色、建立各非氢原子之间的距离关系作为结构描述符,对苯及衍生物的结构表征后,构建苯及衍生物结构-毒性关系模型,讨论影响化合物毒性的结构因素,为有机化合物结构-性质关系研究提供参考。

1 材料与方法

1.1 实验材料

苯衍生物的毒性以其对呆鲦鱼的96 h半致死量(lg(1/LC50))表示,69个苯衍生物及对呆鲦鱼的96 h半致死量(lg(1/LC50))实验值取自文献[13],按照lg(1/LC50)值大小顺序列于表1。取出尾号为0和5的样本(以“*”标识)作为测试集样本,用于测试模型的外部预测能力;其余为训练集样本,用于建立模型。

表1 化合物及毒性值(lg(1/LC50))Tab. 1 Compounds and toxicity values (lg(1/LC50))

续表

2 实验方法

2.1 化合物结构参数化表征

结构表征是将研究样本根据其不同的结构转变成与结构相关的参数,忽略氢原子的影响,非氢原子及非氢原子之间相互关系影响化合物的性质。不同类型的非氢原子及其关系对化合物性质影响不同,根据非氢原子在化合物分子中的连接情况,将非氢原子分为4 种原子类型[14-16],以Ak(k为该原子连接其他非氢原子的数量,k=1,2,3,4)表示,如某非氢原子直接连接2个其他非氢原子,则该非氢原子属于A2(即第二类非氢原子)。根据非氢原子在周期表所处的位置、电子层结构、成键情况对其进行参数化染色[17,18],见式(1)。

(1)

式中νi为非氢原子i价电子层的电子数,ni为原子i电子层数,δσi表示原子i成σ键的电子数,δ(σ+π)i为原子i参与成σ和π键的总电子数。

不同类型非氢原子对化合物毒性lg(1/LC50)影响不同,同种类型非氢原子对化合物毒性lg(1/LC50)影响具有加和性,按式(2)分类累加。

(2)

式中,k为非氢原子i的所属原子类型。一个有机化合物分子中最多含有4类非氢原子,因此最终得到4项,用x1,x2,x3,x4表示。

非氢原子之间的关系与非氢原子本身取值以及非氢原子之间的距离有关,且随非氢原子取值增大而增大,随非氢原子之间的距离增大而减小。不同类型非氢原子之间的关系可用倒数型函数(式(3))进行计算。

(3)

式中,rij是非氢原子i与j之间最短路径键长之和与碳碳单键键长的比值;n和l表示原子所属类型。4类非氢原子可以组合出10种不同的关系项,如m11,m12,…,m44(简写为x5,x6,…,x14)。其中m12表示第一类与第二类非氢原子之间的关系,以此类推。所有化合物经结构表征后,最终可得与其结构密切相关的14个变量。

2.2 建模与检验

3 结果与讨论

化合物经参数化表征后,每个化合物得到与结构相关的一组结构描述符。由于在所有的化合物中均不存在第四类非氢原子,因而得到的结构描述符与第四类非氢原子相关的x4,x8,x11,x13,x14为“0”,剩余9个结构描述符(如读者需要,可向作者索取)用于建模分析。在建立多元线性回归(MLR)模型前,对变量进行筛选,剔除对化合物毒性影响较小的或相关性小的变量。运用SMR以变量显著性大小为顺序依次将变量引入模型。考察建模相关系数(R)及标准偏差(SD)随逐步回归变化情况,见图1和图2。

图2 标准偏差(SD)随逐步回归变化情况Fig. 2 Standard deviation (SD)changes with the stepwise regression

从图1中可以发现,建模相关系数(R)随着变量的引入而逐渐增大。起初建模相关系数(R)随着变量的引入缓慢增大,当变量达到5个时建模相关系数(R)突然迅速增大且接近最大值,当变量超过5个时,建模相关系数(R)增大不明显。同样,从图2中可以发现,标准偏差(SD)随着变量的引入而逐渐减小。当变量达到5个时标准偏差(SD)瞬间变小且接近最小值,之后标准偏差(SD)随着变量的引入略有减小。以上说明应该选择5变量建立模型,5变量模型(M1)见式(4)。

lg(1/LC50)=10.340 7-1.403 6x2+1.201 2x5+0.458 0x6-0.297 1x7+0.261 3x9

(4)

图3 相关系数(R2/RCV2)随主成分数变化情况Fig. 3 Correlation coefficient (R2/RCV2)changes with the number of principal components

变量重要性投影(VIP)见图4,通常认为变量重要性投影(VIP)值大于1时,该变量与所研究的性质相关性大[23,24]。苯环上的取代基种类、取代基数量和位置对化合物的分子体积、疏水参数等产生影响,取代基体积越大,整个化合物分子体积就越大,化合物越难穿过生物脂质膜产生毒性,表现出毒性较小。而取代基体积越小、疏水性越强,整个化合物分子体积就越小,越易透过生物脂质膜产生毒性,表现出毒性较大。图4可以看出变量x2,x3,x5,x7和x12的VIP值大于1,说明这5个变量与苯衍生物毒性lg(1/LC50)相关性大。x2和x3分别对应第二、三类非氢原子自身对苯衍生物毒性lg(1/LC50)的影响,x5,x7和x12分别与第一类、第一与第三类、第三类非氢原子相关。第一类非氢原子即为苯环上取代基的末端原子,第三类非氢原子大部分为苯环上接有取代基的碳原子,因而图4可以说明苯衍生物的毒性与苯环上的取代基种类、取代基数量和位置有关。

图4 变量重要性投影Fig. 4 Variable importance projection

两模型对化合物的毒性lg(1/LC50)预测值分别列于表1的Cal.1和Cal.2,Err.1和Err.2分别为预测误差。图5为以化合物的毒性lg(1/LC50)实验值为横坐标、预测值为纵坐标绘制的相关图,图6为相应的误差分布。从图5中可发现绝大部分样本点都处于正方形对角线两侧并紧靠对角线,显示出该类型化合物毒性lg(1/LC50)模型预测值与实验值之间良好的相关性,模型对化合物急性毒性lg(1/LC50)值预测较准确。模型M2的样本点更加靠近正方形对角线,说明模型M2的预测结果明显优于模型M1。

图5 化合物毒性预测值与实验值相关图Fig. 5 Correlation diagram of the compound toxicity prediction value and experimental value

图6 模型预测误差分布Fig. 6 Model prediction error distribution

从图6中可发现模型M2的样本点更加靠近中间“0”横线,说明模型M2的预测误差比模型M1的预测误差更小,再次说明模型M2的建模及预测效果优于模型M1。从图6中还发现超过94%的样本误差都落在±2SD范围,对于两模型均仅有不足6%的样本预测误差超出±2SD1和±2SD2,个别样本的预测误差较大,说明存在特殊的结构信息未得到充分表达。如果个别实验数据本身误差较大,也会影响模型计算结果。不论是何种原因导致的大误差,但这类样本仅占5.80%,可说明模型对绝大部分化合物(94.20%,远大于80%的标准)的毒性lg(1/LC50)能准确预测,误差可接受,在缺乏实验数据的情况下,预测值具有一定的参考价值。

4 结论

通过将化合物中的非氢原子进行分类、参数化染色,在化合物二维结构上计算各非氢原子之间的相互关系,进而以此为结构描述符对69个苯衍生物结构进行表征并建立定量结构-毒性lg(1/LC50)关系模型。该模型经过内部、外部双重检验,可以用于苯衍生物毒性lg(1/LC50)的预测。部分样本毒性预测误差较大,说明某些特殊的结构信息未得到完整表达,结构描述符仍然具有一定的改进空间。总的来说,本文提出的结构描述符具有较多的优点,如无需进行3D结构的优化及复杂计算,计算时间短,简单且重复性好,所建模型预测效果好等,有望在类似有机化合物结构-性质关系研究中得到进一步应用。

猜你喜欢

氢原子衍生物毒性
“60%敌畏马乳油”农药对家蚕残毒性调查
除草剂敌草快对克氏原螯虾(Procambarus Clarkii)的毒性研究
应激宁小鼠急性毒性试验及亚慢性毒性试验
甲基苯丙胺神经毒性作用及机制的研究进展
大孔ZIF-67及其超薄衍生物的光催化CO2还原研究
新型杀螨剂β-酮腈衍生物及其开发
索末菲量子化条件及其在周期性运动中的应用
烃的含氧衍生物知识链接
对氢原子能量吸收的再认识お
肌营养不良蛋白及其衍生物的表达与定位的研究