一种研究脂肪酮溶解度和辛醇/水分配系数的拓扑新方法
2012-11-22周长会吴启勋
周长会,吴启勋
(1.青海民族大学化学与生命科学学院,中国 西宁 810007;2.聊城大学化学化工学院,中国 聊城 252059)
物质结构-活性/性质定量关系(QSPR/QSAR)的研究是目前化学及相关学科中一个比较活跃的领域,而拓扑指数作为该领域的一种研究方法应用得越来越广泛[1-5].拓扑指数在预测分子的物理化学性质方面起着重要的作用.目前该研究中较常见且具有代表性的方法主要有维纳指数法、分子连接性指数法及分子支化度指数法等[6-12].但这些拓扑指数都存在简并度较高或者对杂原子处理结果较差等缺陷.为了使拓扑指数在分子性质预测上更适用,本文以系列脂肪酮分子为例,对含杂原子的分子进行修饰.建立一种新的拓扑指数M,通过与脂肪酮分子的辛醇/水分配系数(反映了该化合物的脂溶性大小)及溶解度进行关联,取得了较好的研究结果.
1 拓扑指数的构建
以丙酮分子为例,将分子中的氢原子及与氢原子相连接的化学键隐去,保留碳的骨架写出分子的距离矩阵及其分子的邻接矩阵.
将距离矩阵D与邻接矩阵A相乘得到新的矩阵F,定义矩阵F的最大本征值的对数与分子中碳原子个数的乘积作为新的拓扑指数M:
M=N×lgA1.
对于丙酮,矩阵F本征值为A1=2.75,A2=2.75,A3=0,A4=0,则M=3×lg 2.75=1.318 0,按此方法计算了16种脂肪酮的M值(见表1).表中N为脂肪酮碳原子数目,P2是支化度为2的数目的一半,P3是支化度为3的数目的一半.
表1 脂肪酮的有关性质
2 结果与讨论
2.1 回归模型的建立
运用SPSS13.0将M,P2,P3与脂肪酮的辛醇/水分配系数Ko/w及其溶解度S进行逐步回归分析得到如下结果:
lgKo/w=-0.408+0.237M-0.054P2
(F=2 163.511,R=0.999, S.D.=0.047 07,P=0.000,n=16),
-lgS=-1.456+0.233M+0.090P2
(F=334.642,R=0.992, S.D.=0.108 213,P=0.000,n=14).
2.2 回归模型的评价
2.2.2 外部评价-残差分析 根据残差分布图可见,辛醇/水分配系数和溶解度的残差值以0为中心,成左右对称分布,基本符合正态性(如图1及图2).由辛醇/水分配系数与溶解度的P-P图(如图3~图4)可以发现,实验值与理论计算累加值基本处于一条直线上,而且各个理论计算值均匀地分布在直线两侧,近似满足正态分布,从而更好地说明建立的回归方程能很好地估计脂肪酮的有关性质.由表2可见实验值与理论计算值相差非常小,故可以推测建立的模型能较好地推测脂肪酮的溶解度和辛醇/水分配系数.由此,可以得出回归模型比较稳定,能用于这两种性质的预测.
图1 lg Ko/w残差分布图
图2 lg S残差分布图
图3 lg Ko/w标准残差的P-P图
图4 lg S标准残差的P-P图
2.2.3 方法比较 用杂原子与相邻碳原子价层电子数比值的一半作为两顶点的距离,更能突显出分子结构中羰基的重要性.而且能够很好地反映脂肪酮的结构性质.由于图论本身就具有简约性及模糊性,故而可以不用原子之间的实际键长值来定量表示距离.那样反而会增加计算难度,也混淆了分子结构微观和宏观的描述.本文构建的拓扑指数方法,与文献[13]对杂原子中的拓扑距离及顶点度的修正方法相比,具有计算简便、选择性好等优点,因而具有一定的实用价值.
表2 实验值与计算值比较
备注:Exp为实验值; Cal为理论计算值; Err为实验值与理论计算值的误差.
总之,通过拓扑指数M能比较好地描述分子的有关性质,因为分子的化学性质实质上是通过价层电子表现的,而分子间距离又把分子结构单元给刻画出来,本文建立的拓扑指数M恰好具备了这两方面的特点,因而它与脂肪酮的性质相关性高.
3 结论
本文建立的新拓扑指数M可以较好地反映脂肪酮分子的结构信息,而且具有较低的兼并性和良好的选择性,能较好地预测脂肪酮化合物的辛醇/水分配系数和溶解度.新拓扑指数M有望在杂原子双键化合物性质研究中推广,在一定程度上能对杂原子化合物性质进行预测研究.显然,由于拓扑指数意义的模糊性[14]及本文数据量较少的原因,也存在不足之处,毕竟预测脂肪酮的性质有限.因此,应用广泛的拓扑指数研究工作有待进一步深入.
参考文献:
[1] HOSOYA H, KAWASAKI K, MIZUTANI K. Topological index and thermodynamic properties I.Empirical rules on the boiling point of saturated hydrocarbons [J]. Bull Chem Soc Jpn, 1972,45(11):3415-3421.
[2] RANDIC M .On characterization of molecular branching [J].J Am Chem Soc, 1975,97(23): 6609-6615.
[3] BALABAN A T. Topological indices based on topological distances in molecular graphs [J]. Pure Appl Chem, 1983,55(2):199-206.
[4] KARELSON M, LOBANOV V S, KATRITZKY A R,etal. Quantum-chemical descriptors in QSAR/QSPR studies[J].Chem Rev, 1996,96(2):1027-1043.
[5] 魏长明. P2P网络中基于信任的拓扑结构与搜索机制[J]. 湖南师范大学自然科学学报, 2010,33(3):32-36
[6] 徐梅芳. 距离矩阵的本征值用于硫醇/硫醚的QSPR研究[J]. 唐山师范学院学报, 2010,32(2):11-15.
[7] 刘凤萍,曹晨忠,吴湘江,等. 用分子拓扑指数预测饱和酯类化合物的气相色谱保留指数[J].计算机与应用化学, 2008,25(6):711-716.
[8] 乔 华,寇建仁,张生万,等. 脂肪烃类化合物气相色谱保留指数的预测[J].计算机与应用化学, 2007,24(5):709-712.
[9] 刘凤萍,曹晨忠,程 彬.脂肪族醛酮的定量构效关系研究[J].湖南科技大学学报:自然科学版, 2010,25(2):102-105.
[10] 吴义平,开小明. 基于LM-BP神经网络算法饱和醇结构拓扑指数与保留指数相关性的研究[J].光谱实验室, 2011,28(2):610-613.
[11] 肖方竹,彭国文,聂长明,等. 量子拓扑指数法预测多氯联苯醚的热力学性质[J].化工学报, 2011,62(7): 1808-1816.
[12] 陈 艳,冯长君.连接性指数对脂肪醇的QSPR/QSAR研究[J].环境化学, 2000,19(6):538-543.
[13] 罗北平,任碧野,邓超群. 有机物溶解度和辛醇/水分配系数的QSPR研究[J].湘潭大学自然科学学报, 2000,22(2):63-67.
[14] 任永丽,吴启勋,董海峰. 量子化学参数用于脂肪族化合物分配系数的QSPR研究[J]. 计算机与应用化学, 2009,26(1): 83-85.