预测多氯二苯硫醚热力学性质的数学模型
2010-11-27房建州
陈 艳,房建州
(1.徐州工程学院化学化工学院,中国 徐州 221008;2. 徐州工程学院数理学院,中国 徐州 221008)
多氯联苯醚(PCDEs)来自于氯苯和氯酚等化工生产、城市垃圾的不完全燃烧[1],是一种介于多氯联苯和二噁英之间的一类自然界广泛存在的持久性有机污染物,它们能影响生物体的免疫功能、激素代谢、生殖遗传等多个方面[2],而且PCDEs在热或光作用下可以转化为剧毒的二恶英类化合物PCDDs和PCDFs[3],因此对其性质的研究受到了广泛的关注[4-5].多氯二苯硫醚(polychlorinated diphenyl sulfide, PCDS)结构和性质和多氯联苯醚类似,分子结构见图1.根据氯原子取代数目及位置的不同, 有209种异构体,主要来源于垃圾的焚烧和造纸厂排放的废水,也是一种对环境危害性很大的持久性有机污染物,对其性质的研究相对较少,朱红薇等[6]用密度泛函理论研究了多氯二苯硫醚的热力学性质,取得了很好的研究成果,本文采用分子连接性指数[7-8]、电性距离矢量[9-10]和PCDS的热力学性质进行关联,建立了良好的预测模型, 取得了与文献同样优良的估算和预测结果.
图1 多氯二苯硫醚的分子结构和碳原子的编号
1 数据的收集和研究方法
1.1 数据的收集
1.2 拓扑指数的建立
2 结果与讨论
2.1 模型的建立
利用MATLAB 程序计算了210种PCDS分子的18个描述符,和文献[6]中列出的它们的分子平均极化率、恒容热容、标准焓、标准熵和自由能等热力学参数多元线性相关分析,采用SPSS V 17.0 for windows程序拟合得到的相关方程:
α= 19.802 + 17.601X1+ 5.365m22+ 35.744m85.
(1)
n=210,R=0.999,S=0.952 8,F=36 643.707.
式中n、R、S、F分别为回归样本数、相关系数、估计标准误差、Fischer检验值(下同).
(2)
n=210,R=1.000,S=0.334,F=1 428 204.303.
H0=2 628.553-436.211X1.
(3)
n=210,R=1.000,S=4.841,F=5 765 445.061.
S0=179.236+29.762X1-5.861m22-1.535m91.
(4)
n=210,R=0.994,S=5.237,F=5 652.330.
G0=2 621.615 - 435.642X1.
(5)
n=210,R=1.000,S=0.039,F=9.030×104.
从式(1)~(5)的相关系数可以看出,本文的相关结果与文献[6]具有同样满意的结果.
图2 二苯硫醚和209个多氯二苯硫醚标准熵估算值和文献值的相关性
根据式(1)~(5)计算得到热力学性质的估算值和文献值一致,相对平均误差分别0.386%、0.108%、0.044%、0.644%、0.000 3%.
以相关性较差的式(4)为例,对标准熵的估算值和文献值作图,从图中可以看出,估算值和文献值吻合得很好.
2.2 模型的稳健性和预测能力的检验
采用Jackknife[15]法考察模型(4)的稳健性,由于该模型样本数较多,用逐组剔除法取代适用于小样本的逐一剔除法,把化合物按编码分组,将各位是0、1、2、…、9的各为一组,共10组,每次剔除一组,用余下9组化合物建模,重复10次,各得10个相关系数(R)和估计相对误差(S),见表1.
表1 相关方程(4)的稳健性检验
其中,相关系数除了一个0.995外,其余的均为0.994;估计相对误差5.000以下的有1个,5.000~5.300之间有3个,5.300~5.400之间有6个,平均值为5.231,和模型(4)的5.237接近,这说明模型(4)中不存在标准熵的异常及随机相关,具有总体可接受的稳健性和预测能力.
另外采用了“留一法”对模型(4)进行交互验证,得到交互验证相关系数RCV为0.993,交叉验证标准偏差SCV值分别为5.462,也只是比原模型的标准误差5.237略大,进一步说明模型(4)的稳定性和预测能力较为理想.
2.3 分子连接性指数和电性距离矢量共同揭示了PCDS热力学性质本质因素
化合物分子之间的相互作用如分子间色散力、诱导力、取向力、氢键等都能影响化合物热力学性质的大小,其中色散力主要和分子的大小有关,而X1为零阶分子连接性指数,是各个原子之点价平方根的倒数之和,分子越大,构成分子的原子数越多,那么其平方根的倒数项也越多,因此X1是分子大小的一个量度,它和热力学性质的递变规律是一致的,这已被以上所建模型X1前的系数和热力学性质的符号一致而得到验证;分子的诱导力、取向力和分子的极性有关,它受到分子中原子的种类、连接方式等因素的影响,分子电性距离矢量就是基于分子中的各原子固有属性、原子间的连接关系、原子间的距离等因素对分子结构进行数值化表征的一组参数,所建模型中所涉及的电性距离矢量为m22(2×10)、m85(10×13)、m91(13×13),其中m22是非极性基团和极性基团之间的相互作用;m85、m91是极性基团和极性基团之间的相互作用,它们反应了诱导力和取向力的大小,所以分子连接性指数和电性距离矢量共同揭示了PCDS热力学性质本质因素,用这两种指数联合建模来预测PCDS的热力学性质是可行的.
3 结束语
本文采用分子连接性指数和分子电性距离矢量两种拓扑指数联合对二苯硫醚和209个多氯二苯硫醚的分子结构和分子平均极化率、恒容热容、标准焓、标准熵和自由能等热力学性质的相关性研究取得了满意的结果,建立了具有良好稳健性的预测模型,该方法结构参数的取值完全来自分子本身的结构,不需要加任何经验性的性质参数或校正参数,较为客观,且计算易程序化,在实际应用中更加方便,可以尝试应用于各类有机物热力学性质及其他性质的定量-性质相关性的研究.
参考文献:
[1] YANG P, CHEN J, CHEN S,etal. QSPR models for physicochemical properties of polychlorinated diphenyl ethers[J]. Science of the Total Environment,2003,305(1-3):65-76.
[2] KOISTINEN J, SANDERSON J T, GIESY J P,etal. Ethoxyresorufin-o-deethylase induction potency of polychlorinated diphenyl ethers in H4IIE rat hepatoma cells[J]. Environmental Toxicology and Chemistry,1996,15(11):2 028-2 034.
[3] LINDAHL R, RAPPE C, BUSER H R. Formation of polychlorinated dibenzofurans (PCDFs) and polychlorinated dibenzo-p-dioxins (PCDDs) from the pyrolysis of polychlorinated diphenyl ethers[J]. Chemosphere,1980,9(5-6):351-361.
[4] 黄 俊,余 刚,张彭义. 分子连接性指数法预测多氯联苯醚(PCDEs)的理化性质[J]. 环境科学研究,2002,15(5):1-5,9.
[5] KURZ J, BALLSCHMITER K. Isomer-specific determination of 79 polychlorinated diphenyl ethers (PCDE) in cod liver oils, chlorophenols and in a fly ash[J]. Fresenius Journal of Analytical Chemistry,1995,351(1):98-109.
[6] 朱红薇,江建林,王遵尧. 多氯二苯硫醚结构参数和热力学性质的密度泛函理论研究[J]. 化工学报,2008,66(10):1 139-1 150.
[7] RANDIC M. On characterization of molecular branching[J]. J Amer Chem Soc,1975,97 (23):6 609-6 615.
[8] KIER L B,HALL L H. Molecular connectivity in structure-activity analysis[M]. England:Research Studies Press,1986.
[9] LIU S S, YIN C S, LI Z L. QSAR study of steroid benchmark and dipeptides based on MEDV-13[J]. J Chem Inf Comput Sci,2001, 41:321-329.
[10] 易忠胜,刘树深. 对多氯代二苯并二噁英的定量结构——气相色谱保留行为关系研究[J]. 计算机与应用化学,2005,22(7):521-526.
[11] 王 岩,曾小兰,方德彩.多氯代菲分子结构和热力学性质的密度泛函理论研究[J]. 化学学报,2009,67(10):1 047-1 056.
[12] 陈 艳,堵锡华. 多氯联苯醚热力学性质的定量构效关系[J]. 化工学报,2008,59(10):2 427-2 435.
[13] 陈 艳. 分子键连接性指数及其应用[J]. 南京理工大学学报,2005,29(5):594-597.
[14] 陈 艳,冯长君. 距离调和指数对有机污染物疏水性参数的预测[J]. 化学通报,2006,4:277-281.
[15] DIETRICH W S, DREYER N D, HANSCH C. Confidence interval estimaters for parameters associated with quantitative structure-activity relationship[J]. J Med Chem, 1980, 23:1 201-1 205.