基于人工神经网络研究小鼠抗搏击能力
2021-05-18朱利兰冯长君
朱利兰,冯长君
1)广东轻工职业技术学院体育部,广东广州 510300;2)徐州工程学院材料与化学工程学院,江苏徐州 221018
抗搏击训练就是增粗肌肉纤维,强化肌肉腱结构,通过强大的腹肌和腹部外侧肌保护腹内脏器,使运动员表现出优异的抗搏击能力. 但是研究发现,给小鼠服用某些药物也能提高其抗搏击能力,即通过服用药物可以提高运动员的抗搏击能力,这种行为势必给拳击等身体接触类比赛带来不公正. 因此,研究药物分子微观结构和药物对抗搏击能力的影响机理也是国际反兴奋剂斗争的一项新内容.
物质定量构效关系(quantitative structure-activity relationship, QSAR)[1-11]是依据表征分子结构的描述符,运用各种数学统计方法建立定量描述物质生物活性的数学模型,进而探讨影响生物活性的结构因素,并推测发挥生物作用的微观机理.本研究基于QSAR方法建立小鼠抗搏击能力[12]的回归模型,将此模型中的自变量作为输入层,并建立逆传播(back-propagation, BP)算法[13-18]模型,以揭示影响抗搏击活性的微观结构,探讨其抗搏击作用的微观机理,为兴奋剂检测技术提供理论依据.
1 材料与方法
1.1 实验对象及抗搏击活性数据
实验选用体质量为20~25 g的雄性小鼠,所用30种苯二氮艹卓恶唑衍生物分子[12]的基本结构见图1,其中,R1、R2、R3、R4、R5和R6为取代基. 30种衍生物分子结构与抗搏击活性见表1,其中,tr、va和te分别为训练集、验证集和测试集.
图1 苯二氮艹卓恶唑类药物分子的基本结构Fig.1 Basic structure of benzodiazepinooxazole derivative molecules
1.2 抗搏击能力实验
将上述30种化合物分别以悬浮液形式溶于含有0.5 %(质量分数)黄蓍胶的0.85 %(质量分数)盐水中,口服给药后,对小鼠的脚实施电击1 h后,测量没有战斗行为能力的小鼠所需苯二氮艹卓恶唑的浓度. ED50为半数小鼠丧失搏击能力所需苯二氮艹卓恶唑的浓度(单位:mol/L). 根据物理化学的平衡原理,化学反应的自由能改变(ΔGr)与浓度为对数关系. 因此,对ED50取负对数即E=-lg(ED50)用于建模,称为抗搏击活性[12].
1.3 电性距离矢量
QSAR的关键是对抽象的分子结构数值化表征,即建立描述分子结构的变量,常用方法是拓扑指数和量化参数等. LIU等[19-21]基于几种著名拓扑的局限,提出能全面显示拓扑、几何和电学特性的电性距离矢量的模(MD,D=1,2,…,91)的计算方法. 利用Matlab程序计算30种苯二氮艹卓恶唑类药物分子的MD, 其中,M10、M16和M59分别为第10、16和59个电性距离矢量的模.
1.4 统计回归分析方法
通过Akaike的信息准则(AIC, 产生最小AIC值的模型被认为可能是最有用的)和Kubinyi函数(FIT, 最佳模型将呈现该函数的最高值)确定是否应该在模型中包含某个变量. 也就是说,如果增加一个变量时Akaike的信息准则的值降低,而Kubinyi函数的值增加,则认为这个新变量的引入是合理的[24-25].
目前,应用最为广泛的人工神经网络(artificial neural network, ANN)是基于BP算法[13-18]的3层神经网络. 其中,输入层接受外界数据输入,隐含层对输入数据进行处理和转换,输出层则产生输出(即预测)结果. 网络中的每层都包含若干神经元,输入层和输出层的神经元数由模型中的变量数决定,隐含层神经元数则可通过试算或规则确定.
表1 苯二氮艹卓恶唑衍生物分子结构与抗搏击活性
2 结果与讨论
2.1 E的多元线性QSAR模型
表2显示,随着模型自变量数的增加,所有衡量模型质量的统计指标均有规律变化,没有出现转折点,因此,不能根据这些指标确定最佳QSAR模型. 但是,模型中各个自变量的方差变异因子(VIF)存在转折点:三元模型中M59、M16和M10的VIF依次为1.181、1.133和1.074,四元模型中M59、M16、M10和M36的VIF依次为1.378、11.384、1.413和10.515. 在四元模型中出现VIF>5.0, 说明该回归方程存在严重的共线性,模型不稳定. 而三元模型的VIF非常接近1,说明这3个自变量之间几乎不相关,具有良好的稳定性,故建立三元方程为
(1)
表2 电性距离矢量(MD)和抗搏击活性(E)的逐步回归结果
2.2 人工神经网络模型
模型(1)虽然符合一般建模要求,但与YOSHIMOTO等[12]给出五元回归方程的R=0.934(R2=0.872,S=0.170)比较,相关性稍差. 因此,本研究在线性模型(1)的基础上采用BP神经网络方法建立非线性方程,以提高拟合水平.
为避免所建神经网络模型过拟合、过训练,根据许禄等[18]的建议规则寻找最佳隐含层的单元数(H), 即N/M≥1, 其中,N和M分别是样本数和网络总权重.
M=(I+1)H+(H+1)Q
(2)
2.3 QSAR方程结构分析
3 结 论
2) 以M59、M16和M10为输入变量建立BP-E模型的相关性(R2=0.984,S=0.054)明显优于YOSHIMOTO等[12]的五元回归方程的相关性(R2=0.872,S=0.170). 模型中的M59、M16、M10与E之间存在良好的非线性关系,而非简单的线性关系.
4) 根据影响E的药物分子微观结构可知,苯二氮艹卓恶唑类药物分子与小鼠体内靶标酶的作用力主要是氢键、配位及疏水作用.
研究揭示了影响小鼠抗搏击能力的微观分子结构及作用机理,可为世界兴奋剂检测技术提供理论参考.