基于蚁群算法对有机物热容的预测研究
2016-03-14白帆时静洁江苏富淼科技股份有限公司江苏张家港215613
白帆 时静洁(江苏富淼科技股份有限公司,江苏 张家港 215613)
基于蚁群算法对有机物热容的预测研究
白帆时静洁(江苏富淼科技股份有限公司,江苏张家港215613)
根据定量构效关系(QSPR)原理,研究有机物热容与其分子结构间的内在定量关系。以650种有机化合物作为样本集,随机选择520种作为训练集,130种作为测试集,采用蚁群算法(ACO)进行变量选择,得到5个特征描述符作为模型的输入变量,结合多元线性回归(MLR)方法建立了蚁群-多元线性回归(ACO-MLR)预测模型。研究结果表明:ACO-MLR模型的训练集和测试集的复相关系数分别为0.9430和0.9344,预测效果令人满意。该研究提供了一种新的预测有机化合物热容的方法。
热容;蚁群算法;多元线性回归;预测
热容表示系统升高单位热力学温度时所吸收的热[1],是化合物的基本热学性质之一。热容的变化提供了化合物相变信息以及化合物分子结构的变化,获悉该方面信息是非常重要的。液体的热容值在工程应用中是一个非常重要的性质,在能量转移以及热动力学的计算中也是必需的参数[2]。热容性质涉及到很多领域,其中包括石油化工行业、制药和食品工业等。在这些行业的很多过程都涉及到了热容,如蒸馏过程、蒸发过程、提取过程和加热过程[3]。比如在某个温度范围内进行热交换,离子液体会呈现出某些性质而使物质更稳定,其中就包括热容。热容的实验测定有很多方法,但测定比较复杂,例如差示扫描量热仪法[4]、热线式方法[5]、温度振荡量热法[6]等。考虑到获取热容的重要性以及实验测定的复杂性,发展方便可靠的理论预测热容方法迫在眉睫。目前,关于理论预测有机物热容的文献比比皆是,但有机物液体热容的QSPR预测模型却为数不多。因此,本章拟从分子结构角度出发,应用QSPR研究体系,系统研究有机物热容与其分子结构间的内在定量关系,建立相应的QSPR预测模型,并评价其模型的预测效果。
1 实验样本说明
可靠的预测模型必须建立在可靠的实验样本基础之上。在定量结构-性质关系研究中,数据的精确性对于最终的结果具有至关重要的影响。本文研究的样本集为650种有机化合物的热容,包括碳氢化合物、卤素化合物、醇、酯、醛、酮等。这些化合物涵盖了广泛的化学多样性空间,为建立健壮、有效的预测模型奠定了基础。此外,为了避免由于数据来源不统一造成的误差,所有化合物热容数据均来自于同一个数据库——《有机化合物实验物性数据手册:含碳、氢、氧、卤部分》。
2 分子描述符的计算与预筛选
分子描述符的计算首先是在HyperChem 7.5软件中对分子结构进行输入与优化,导入Dragon 2.1软件中计算分子描述符,获得18类共1481种分子描述符,其计算的描述符种类包括结构描述符,几何描述符,拓扑描述符等。大量的分子描述符中必然存在冗余信息,因此对常数或者近似常数的描述符以及描述符间相关系数达到0.95以上的描述符进行删除,减少至660个。如此庞大的分子描述符数量还是无法有效进行QSPR模型的建立,因此,本文采用ACO对分子描述符进行进一步筛选。
3 ACO-MLR热容预测模型
运用ACO对660个描述符进行进一步筛选,ACO是在VC++6.0中采用C语言编程,蚂蚁数量设为500,挥发率设为0.9,进行不断迭代直至收敛,最终获得5个特征描述符。随后,以ACO筛选的5个描述符作为输入参数,运用SPSS17.0统计软件中的多元线性回归模块,在95%的置信区间内,得到了MLR预测模型,结果如下:
Cp=21.594-10.970*ATS4m+8.598*HATS4u+0.787
*TIC4+20.824*S1K+1.605*C-024(5.2)
n=520,R2=0.943,SD=21.250,F=1697.199,p<0.001
式中,Cp为热容值,n为训练集样本数目,R2为决定系数,SD为模型标准误差,F为F
检验值,F实际=1697.199>F理论(5,514,0.05)=2.25,模型的显著性概率p远小于0.05,认为该回归方程及所筛选变量的影响均是显著的。
为检验模型的拟合能力和外部预测能力,应用该模型分别对训练集和测试集进行预测,其训练集和测试集的复相关系数分别为0.9430和0.9344。
4 结语
本文运用蚁群算法(ACO)作为分子描述符筛选方法,与多元线性回归(MLR)方法进行组合建立了ACO-MLR模型,对650种有机化合物的热容进行了QSPR研究。所建立的QSPR热容预测模型的预测值与实验值非常接近,其R2均在0.9以上,预测误差在可接受范围之内。因此,本文所建模型可用于对有机物热容的预测,为其提供了一种新的有效方法,对于化工安全设计和风险评价研究具有重要的意义。
[1]赵敏,强晓明,章韦芳.一种新型比热容测量仪[J].大学物理.2016(2).
[2]蒋华龙,周大伟,刘旭焱等.压力下MoS2的结构相变以及热动力学性质的第一原理研究[J].低温物理学.2014(5).
[3]陈永艳,田瑞,王亚辉等.膜蒸馏系统中热容腔结构参数优化的试验研究[J].工程热物理学报.2015(2).
[4]罗昭强,谭蓬.应用DSC法测量有机热载体比热容[J].锅炉制造.2016(1).
[5]郑明阳,王天为,张国锋.理想气体热力学过程吸放热情况的图像判断法[J].物理与工程.2014(3).
[6]张涛,孙冰.航天器再入全过程轴对称烧蚀热防护数值仿真研究[J].宇航学报.2011(5).