APP下载

酚类化合物臭氧氧化速率的神经网络研究

2017-10-13堵锡华吴琼陈艳冯惠

生态毒理学报 2017年3期
关键词:连接性决定系数预测值

堵锡华,吴琼,陈艳,冯惠

徐州工程学院 化学化工学院, 徐州 221018

酚类化合物臭氧氧化速率的神经网络研究

堵锡华*,吴琼,陈艳,冯惠

徐州工程学院 化学化工学院, 徐州 221018

酚类化合物(BP)是重要的工业原料或中间体,但工业废水含有的酚类化合物会对环境造成污染。为建立酚类化合物臭氧氧化速率的QSPR(quantitative structure-property relationship)预测模型,分析了23种酚的分子结构与臭氧氧化速率之间的相关关系,计算了这些酚的分子连接性指数和分子形状指数,优化筛选了连接性指数的1χ和2χ、分子形状指数的K1和K2共4种参数,将其作为BP神经网络的输入层变量,臭氧氧化速率作为输出层变量,采用4:2:1的网络结构,获得了令人满意的QSPR神经网络预测模型,模型总相关系数r为0.976,计算得到的臭氧氧化速率的预测值与实验值较为吻合,平均残差仅为0.05;为检验结构参数建立模型的普适性,同样方法建立对酚类化合物的辛醇-水分配系数的预测模型,模型总相关系数r达到0.993,辛醇-水分配系数的预测值与实验值吻合度较为理想,结果表明,本法建构的神经网络模型具有良好的稳健性和预测能力。

酚类化合物;臭氧氧化;分子连接性指数;分子形状指数;神经网络

Received6 January 2017accepted20 February 2017

Abstract: Phenolic compounds were important industrial raw materials or intermediates, but industrial wastewater containing phenolic compounds was polluted to the environment. In order to establish QSPR (quantitative structure-property relationship) model of ozonation rate of phenolic compounds, the relationship between molecular structure and the ozonation rate of 23 kinds of phenolic compounds was analyzed. Moreover, the molecular connectivity indices and molecule shape indices of these compounds were calculated.1χand2χ of the molecular connectivity indices, K1and K2of the molecule shape indices were optimized. The four parameters were used as input variables of neural network and the ozonation rate was used as output variable, and the 4:2:1 network structure was adopted and BP neural network method was used to establish a satisfying QSPR prediction model. The total correlation coefficient r was 0.976. The predicted values and experimental values were very close, and the mean error was 0.05. In order to test the generality of our method, a QSPR model of octanol-water partition coefficient lgp of phenolic compounds was established using the same method. The total correlation coefficient r was 0.993. The predicted values of lgp agree with the experimental values. The results showed that the neural network model had good stability and predictive ability.

Keywords: phenolic compound;ozonation;molecular connectivity index;molecule shape index;neural network

酚类化合物在工业上被广泛用作酚醛树脂、高分子材料、合成纤维、防腐剂、杀虫剂、香料、染料等生产原料或中间体[1],工业生产产生的废水由于含有酚类污染物,容易造成对环境的破坏[2-3],因此世界上许多国家将部分酚类化合物列为优先控制的环境污染物[4],越来越多的研究工作者对其对环境的影响也越发关注,开展了卓有成效的研究[5-7]。在这些研究中,对酚类化合物的生物毒性[8-9]、电化学腐蚀性[10]、色谱保留特性[11]等较为常见,对水体中酚类化合物臭氧氧化降解研究虽然较少,但已逐渐引起科研人员的重视[12]。为此,在前人研究[13-14]工作基础上,本文采用人工神经网络(Artificial Neural Network,ANN)方法建立了酚类化合物臭氧氧化降解的QSPR构效关系模型,通过酚类化合物分子结构参数与其臭氧氧化速率之间的关系,分析了对臭氧氧化速率的影响因素。本研究可为酚类化合物的环境降解处理提供理论上的指导。

1 分子连接性和形状指数的计算和优化筛选(Calculation and optimization of molecular connectivity index and shape index)

表1 lgk与结构参数的最佳变量子集回归结果Table 1 The results of structure parameters and lgk with best subsets regression

表2 酚类化合物的结构参数Table 2 Structural parameters of phenolic compound

优化筛选的分子连接性指数1χ和2χ揭示分子中原子的连接特性,分别代表分子二价和三价的路径指数;分子形状指数K1和K2揭示形状特征,K1反映分子的环性,K2反映原子的空间密度。

2 多元回归模型的构建(Construction of multiple regression model)

考察文献[15]中列出的23种酚类化合物的臭氧氧化速率lgk,与优化筛选出的分子连接性指数和分子形状指数中的4种1χ、2χ、K1、K2进行相关性分析,得到回归方程为:

lgk =1.6101χ-1.7482χ+0.899 K1-1.598 K2+3.993

(1)

式(1)中n为样本数。可以看出,该方程的决定系数r2为0.807,相关性并不理想,根据式(1)得到的lgk预测值与实验值的平均残差为0.09。

3 神经网络模型的构建(Construction of neural network model)

为建立准确预测酚类化合物臭氧氧化降解的QSPR模型,在多元回归分析基础上,采用人工神经网络(ANN)方法对酚类化合物的臭氧氧化速率lgk进一步进行研究,以筛选得到的4种结构参数作为神经网络法的输入层神经元数,酚类化合物臭氧氧化速率lgk作为输出层神经元数,按照许禄等[19]建议的规则:

2.2> n/M ≥1.4

(2)

式(2)中:n为样本数,M为神经网络的总权重。M的计算式为:

M =(I+1)H+(H+1)Q

(3)

式(3)中:I、H、Q分别为神经网络中输入层、隐含层和输出层的神经元数(即变量数)。这里的输入层变量(即结构参数)I = 4;输出层变量(即酚臭氧氧化速率lgk)Q = 1;按式(3)计算H只能取2,故神经网络结构采用4:2:1方式。为避免过拟合、过训练,将23个酚类化合物分子样本分为3组: 训练集(在每5个数据组中取第1、3、5个数据,依次类推)、测试集(数据组的第2个)和验证集(数据组的第4个),由此构建得到神经网络模型的总相关系数r=0.976,决定系数R2=0.9526,其他分别为: 训练集决定系数R2=0.9506、测试集决定系数R2=0.9643、验证集决定系数R2=0.9545;利用该神经网络预测模型计算得到的酚类化合物臭氧氧化速率的预测值(Pre.)列于表3中,该预测值(Pre.)与实验值(Exp.)吻合度较为理想,两者的平均残差(Err.)为0.05,与多元回归方法所得残差0.09的结果相比,神经网络法预测臭氧氧化速率的误差明显要小。杨静等[15]分别用遗传-偏最小二乘算法(GA-PLS)、遗传-人工神经网络法(GA-ANN)2种方法,也采用4个变量建模,得到的23个酚类化合物臭氧氧化速率预测值与实验值的平均残差分别为0.28和0.15,显然本法的预测能力优于文献,预测精度明显高于文献。本法预测值与实验值的关系见图1。

表3 酚类化合物臭氧氧化速率的预测Table 3 Prediction of ozonation rates of phenolic compound

从表3可以看出,利用训练集分子建构的模型对另外的测试集分子(标记有*的分子)进行预测,得到的平均残差为0.054,与所有分子预测结果的平均残差吻合,说明本法建构的预测模型有良好的鲁棒性和预测能力。预测模型的权重和偏置见表4。对臭氧氧化速率lgk研究中,测试集的预测值与实验值平均误差为0.05,验证集的预测值与实验值平均误差为0.03,与训练集的平均误差0.06及总平均误差0.05基本吻合,说明不存在过训练、过拟合现象。

4 普适性检验(Test of universality)

为检验利用结构参数构建模型的普适性,将上述4种结构参数与文献[15]列出的辛醇-水分配系数(取对数值lgp)进行神经网络建模,网络结构、样本分组等条件均与对lgk分析相同,所得模型的总相关系数r=0.993,各组相关系数为: 训练集r=0.989、测试集r=0.999、验证集r=0.997,可以看出结构参数与辛醇-水分配系数之间呈优级的非线性相关关系,利用模型得到的预测值Pre.与文献值Exp.的平均残差为0.10,吻合度较好,相关数据也列入表3中,预测值与实验值的关系见图2。

图1 lgk的实验值与预测值关系Fig. 1 Relationship between literal and calculated lgk

表4 BP-ANN模型的权重和偏置Table 4 Weights and bias of BP-ANN model

图2 lgp的实验值与预测值关系Fig. 2 Relationship between literal and calculated lgp

5 Jackknifed法检验(Jackknifed test)

为检验模型中分子的离域性,这里用Jackknifed法对模型(1)采用逐一剔除法检验,从23个酚类化合物分子中依次剔除1个,用余下的酚类化合物分子进行回归分析,这样就有23个决定系数值,对这些值作控制图(见图3)。

图3 Jackknifed决定系数的检验Fig. 3 Inspection of Jackknifed determination coefficient

从检验的决定系数控制图可以看出,只有去除17号分子时,模型的决定系数低至0.737,游离于可控区域之外,说明该分子的存在对模型的影响较大。

图4 Jackknifed决定系数R2的雷达图Fig. 4 Radar map of determination coefficient R2 of Jackknifed

6 结果与讨论(Results and discussion)

考察酚类化合物的分子结构与其臭氧氧化速率的大小可以看出,当酚的苯环上连接的基团数越多时,分子体积越大,被臭氧氧化的速率也越大;当取代基数目相同时,基团的性质对速率有一定的影响,基团的吸电子能力越强,氧化速率越慢;分子连接性指数和分子形状指数蕴含了分子的连接特性和空间密度等特性,在一定程度上与氧化速率的变化规律一致,通过与神经网络方法结合,可进一步提高所建模型的预测能力:

(1)神经网络对多元回归分析具有一定的纠错能力,能很好地反映出分子连接性指数结合分子形状指数与酚类化合物臭氧氧化速率之间具有良好的非线性关系,模型具有良好的稳健性和较强的预测能力,预测平均残差仅为0.05。

(2)优化筛选的指数与酚类化合物的其他性质也具有良好的非线性关系,具有普适性。将几种指数与辛醇-水分配系数建立模型的预测平均残差只有0.10,故可用于辛醇-水分配系数的数据挖掘。一般而言,辛醇-水分配系数值越大,进入生物体体内的有机物分子数目会越多,毒性会越强,故通过预测酚类化合物的辛醇-水分配系数,可揭示该类化合物对环境生物毒性的影响,评价其对环境的危险性。

[1] 崔秀君, 王志欣, 袁星, 等. 支持向量机用于酚类化合物毒性的QSAR研究[J]. 计算机与应用化学, 2008, 25(3): 298-302

Cui X J,Wang Z X,Yuan X,et al. Application support vector machine to QSAR study of toxicity of substituted phenols [J]. Computers and Applied Chemistry, 2008, 25(3): 298-302 (in Chinese)

[2] 廖立敏,卿东红,李建凤,等. 烃基酚类化合物结构与毒性关系研究[J]. 环境化学, 2011, 30(2): 495-499

Liao L M,Qing D H,Li J F,et al. Quantitative structure-toxicity relationship study of alkylphenols[J]. Environmental Chemistry, 2011, 30(2): 495-499 (in Chinese)

[3] Altenburger R, Backhaus T, Boedeker W, et al. Predictability of the toxicity of multiple chemical mixtures to Vibrio fischeri: Mixtures composed of similarly acting chemicals [J]. Environmental Toxicology and Chemistry, 2000, 19(9): 2341-2347

[4] 周文明,傅德黔,孙宗光. 中国水中优先控制污染物黑名单的确定[J]. 环境科学研究, 1991, 4(6): 9-12

Zhou W M, Fu D Q, Sun Z G. Determination of black list of China’s priority pollutants in water [J]. Research of Environmental Sciences, 1991, 4(6): 9-12 (in Chinese)

[5] 邓金锋, 黄占斌, 郭相坤. 酚类化合物分子连接性指数与毒性[J]. 环境污染与防治, 2007, 29(5): 340-342

Deng J F, Huang Z B, Guo X K. Correlation of toxicity and molecular connectivity index of hydroxybenzenes [J]. Environmental Pollution and Control, 2007, 29(5): 340-342 (in Chinese)

[6] Suksomtip M,Ukrisdawithid S,Bhusawang P,et al. Phenolic compound content, antioxidant and radical-scavenging properties of methanplic extracts from the seed coat of certain thai tamarind cultivars [J]. Journal of Food Biochemistry, 2010, 34(5): 916-931

[7] Kamalraj S, Ramesh S, Muthumary J. A novel antibacterial and antifungal phenolic compound from the endophytic fungus Pestalotiopsis mangiferae [J]. Natural Product Research, 2013, 27(16): 1445-1453

[8] 莫凌云,刘树深,刘海玲. 苯酚与苯胺衍生物对发光菌的联合毒性[J]. 中国环境科学, 2008, 28(4): 334-339

Mo L Y,Liu S S,Liu H L. Joint toxicity of selected phenolic and aniline derivatives to photobacterium [J]. China Environmental Science, 2008, 28(4): 334-339 (in Chinese)

[9] 于瑞莲, 林喜燕, 胡恭任. 酚类化合物对发光菌的联合毒性[J]. 华侨大学学报:自然科学版, 2009, 30(5): 549-552

Yu R L, Lin X Y, Hu G R. The joint toxicity of phenols to Photobacterium phosphoreum [J]. Journal of Huaqiao University: Natural Science, 2009, 30(5): 549-552 (in Chinese)

[10] 沈艺程, 龚翠然, 王飞, 等. 苯酚及其衍生物的电化学聚合及耐蚀性能[J]. 腐蚀与防护, 2006, 27(12): 637-639

Shen Y C, Gong C R, Wang F, et al. Electropolymerizationg and corrosion resistance of phenol and its derivatives [J]. Corrosion & Protection, 2006, 27(12): 637-639 (in Chinese)

[11] 王岳松, 张军, 林乐明. 苯酚和苯胺类衍生物的结构与薄层色谱保留值关系的研究[J]. 色谱, 1999, 17(1): 18-20

Wang Y S, Zhang J, Lin L M. The relationship between thin-layer chromatographic retention values and molecular structures of phenol and aniline derivatives[J]. Chinese Journal of Chromatography, 1999, 17(1): 18-20 (in Chinese)

[12] Liu H, Tan J, Yu H X, et al. Determination of the apparent reaction rate constants for ozone degradation of substituted phenols and QSPR/QSAR analysis[J]. International Journal of Environmental Research, 2010, 4(3): 507-512

[13] 堵锡华. 用新的路径定位指数和神经网络研究多溴联苯醚理化性质[J]. 化工学报, 2014, 65(4): 1169-1178

Du X H. Physicochemical property of polybrominated diphenyl ethers by new path location index and neural network [J]. CIESC Journal,2014,65(4): 1169-1178 (in Chinese)

[14] Du X H,Zhuang W C,Shi X Q,et al. Research on thermodynamic properties of polybrominated diphenylamine by neural network [J]. Chinese Journal of Chemical Physics, 2015, 28(1): 59-64

[15] 杨静, 王建兵, 王亚华, 等. 酚类物质臭氧氧化降解的定量构效关系[J]. 环境化学, 2015, 34(10): 1932-1939

Yang J, Wang J B, Wang Y H, et al. Quantitative structure-activity relationship for the ozonation of phenols [J]. Environmental Chemistry, 2015, 34(10): 1932-1939 (in Chinese)

[16] 张婷, 梁逸曾, 赵晨曦, 等. 基于分子结构预测气相色谱程序升温保留指数[J]. 分析化学, 2006, 34(11): 1607-1610

Zhang T, Liang Y Z, Zhao C X, et al. Prediction of temperature-programmed retention indices from molecule structures [J]. Chinese Journal of Analytical Chemistry, 2006, 34(11): 1607-1610 (in Chinese)

[17] Kier L B, Hall L H. Molecular Connectivity in Structure-Activity Analysis[M]. England: Research Studies Press, 1986: 69-75

[18] Kier L B. A shape index from molecular graphs [J]. Quantitative Structure-Activity Relationships, 1985, 4(3): 109-116

[19] 许禄,邵学广. 化学计量学方法[M]. 北京:科学出版社,2004: 441

Xu L,Shao X G. Methods of Chemometrics [M]. Beijing: Science Press, 2004: 441 (in Chinese)

ResearchonOzonationRatesofPhenolicCompoundbyNeuralNetworkMethod

Du Xihua*,Wu Qiong,Chen Yan, Feng Hui

School of Chemistry and Chemical Engineering, Xuzhou Institute of Technology, Xuzhou 221018,China

10.7524/AJE.1673-5897.20170106003

2017-01-06录用日期2017-02-20

1673-5897(2017)3-675-06

X132

A

国家自然科学基金项目(No.21472071)

堵锡华(1963—),男,教授,研究方向为环境污染物构效学研究,E-mail: 12dxh@sina.com

堵锡华, 吴琼, 陈艳, 等. 酚类化合物臭氧氧化速率的神经网络研究[J]. 生态毒理学报,2017, 12(3): 675-680

Du X H,Wu Q,Chen Y, et al. Research on ozonation rates of phenolic compound by neural network method [J]. Asian Journal of Ecotoxicology, 2017, 12(3): 675-680 (in Chinese)

猜你喜欢

连接性决定系数预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
基于Python语言路径分析矩阵算法运演
不同规格香港牡蛎壳形态性状对重量性状的影响
法电再次修订2020年核发电量预测值
2种贝龄合浦珠母贝数量性状的相关与通径分析
基于颜色读数识别物质浓度的数学模型研究
亚洲航运港口网络连接性分析
Imagination的Ensigma Whisper核:适用于可穿戴设备与物联网的业界最低功耗连接性IP
Whisper架构为物联网和可穿戴设备连接性IP设立新标准