基于神经网络的阿尔兹海默症预测模型研究
2020-11-10刘运,丁文婷,卢丹,方可
刘运,丁文婷,卢丹,方可
【摘要】阿尔兹海默症已成为全球范围内亟待解决的医学问题和社会问题,神经网络模型将阿尔兹海默症疾病进展预测问题转化为非线性问题,为复杂的阿尔兹海默症疾病进展预测提供了新思路。本文以神经网络的基本理论为基础,运用PCA技术对数据进行特征选择和特征提取,再使用BP神经网络和RBF神经网络建立预测模型,对预测效果进行对比分析。
【关键词】BP神经网络;RBF神经网络;数据预测;特征提取
【中图分类号】R749.1 【文献标识码】A 【DOI】10.12332/j.issn.2095-6525.2020.13.256
1研究背景
阿尔兹海默症,即为人熟知的老年痴呆症,也是全球老年人群最常见的痴呆形式之一,是一种慢性神经退行性疾病。据《世界阿尔茨海默病报告》显示,随着人类预期寿命的增加,全球每3秒就约有一人患阿尔兹海默症,预计到2050年全球阿尔兹海默症患者人群将以每20年递增一倍的速度增长至1.52亿,成为全球范围内亟待解决的医学问题和社会问题。如今網络和数据库技术的迅速发展,数据预测方法及应用研究已经越来越为人们所重视。目前,对于数据的预测方法有很多。由于神经网络能够对大量复杂的非线性数据进行分析,可以完成极为复杂的趋势分析,特别适用于构造数据预测模型,使得基于神经网络的预测方法具有比其他预测方法更多的优点。
人工神经网络是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型,它的构筑理念是受到生物(人或其他动物)神经网络功能的运作启发而产生的。人工神经网络是并行分布式系统,采用了与传统人工智能和信息处理技术完全不同的机理,克服了传统的基于逻辑符号的人工智能在处理直觉、非结构化信息方面的缺陷,具有自适应、自组织和实时学习的特点,同时具有自学习功能、联想存储功能及高速寻找优化解的能力,其自学习功能对于预测有特别重要的意义,预期未来的人工神经网络计算机将为人类提供各方面的预测,应用前途远大。
2神经网络的基本原理
2.1神经网络
人工神经网络(artificial neural network,ANN),简称神经网络(neural network,NN),是一种模仿生物神经网络的结构和功能的数学模型或计算模型,是人工智能对生物学中的神经系统结构进行的模拟。神经网络是由大量的节点(或称“神经元”)和之间相互的连接构成。人工神经元包括输入层、加权和、阈值函数(激活函数)和输出层。在学习或训练过程中改变突触权重值,以适应周围环境的要求。通常,它的学习训练方式可分为两种,一种是有监督或称有导师的学习,利用给定的样本标准进行分类或模仿,如:BP、RBF在预测、分类中的应用,PNN在分类中的应用等;另一种是无监督学习或称无导师学习,这时只规定学习方式或某些规则,具体的学习内容随系统所处环境而异,如:竞争神经网络、SOFM在分类、聚类中的应用等。
2.2 两种常见神经网络理论基础
BP(反向传播)神经网络的结构为多层前馈网络,其前、后层之间各神经元实现全联接,同一层的神经元之间无连接。激活函数通常采用S形函数,如logsig,tansig函数;输出层激活函数多采用purelin函数。理论上,具有一个隐含层的BP网络可以以任意精度逼近任意非线性函数。BP网络的学习算法是典型的有导师学习算法:将样本输入神经网络,得到网络的实际输出,若输出值与期望输出之间的误差不满足精度要求,则从输出层反向传播该误差,从而调整权值及阈值,使得网络的输出和期望输出间的误差逐渐减小,直至满足精度要求。BP网络学习过程即为信号前向传播和误差反向传播。
RBF网络的基本思想为是用RBF作为隐单元的“基”构成隐含层空间,这样就可以将输入矢量直接映射到隐空间,而不需要通过权连接。当RBF的中心点确定以后,这种映射关系也就确定了。而隐含层空间到输出空间的映射是线性的,即网络的输出是隐单元输出的线性加权和,此处的权即为网络可调参数。其中,隐含层的作用是把向量从低维度的p映射到高维度的h,这样低维度线性不可分的情况到高维度就可以变得线性可分了,主要就是核函数的思想。这样,网络由输入到输出的映射是非线性的,而网络输出对可调参数而言却又是线性的。网络的权就可由线性方程组直接解出,从而大大加快学习速度并避免局部极小问题。
3 神经网络模型预测分析
首先,基于PCA技术完成数据特征提取,PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。在实际情况中我们的数据会存在特征过多或者特征累赘的问题,所以用PCA算法来解决这种问题是很有必要的。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征,而不是简单地从n维特征中取出其余n-k维特征。
其次,在进行训练之前,需要先初始化网络结构,其次给出权值和阈值的初始化值。从3000*751数据中获取五分之三的数据当作训练数据,设置网络参数,确定最大迭代次数、学习率及学习目标,再进行网络训练。该网络有1个隐含层,神经元个数为100个。Algorithms部分展示了该网络所使用的训练算法,该网络采用Levenberg-Marquardt算法进行训练,采用均方误差算法计算误差,保存为mex格式;Progress部分展示了该网络允许的迭代次数最大为2000,实际迭代2000次,训练时长为14分20秒;该网络的最大误差为0.239,目标误查为0.001,实际误差为0.0613;Gradient一栏表示该网络的最大梯度为1.99,阈值梯度为1.00e-07,实际梯度为0.00196;由Mu一栏可得该网络使用Levenberg-Marquardt算法中的阻尼因子最小值为0.001,阈值为1.00e+10,实际值为1.00e-06,Mu值越大意味着算法收敛效果越好。具体训练状况图如下:
由上图可知迭代次数达到200次达到最佳结果,目标误差为0.001,实际误差为0.0754109,RBF神经网络与BP神经网络相比误差偏大。
4 总结
本研究将数据分为训练数据、测试数据和验证数据三类;然后选取样本输入输出数据进行PCA特征提取,在网络训练之前初始化网络结构,随后进行网络训练,创建BP神经网络和RBF神经网络;进行数据的预测,生成测试数据后,对数据再进行输出反归一化;最后对预测结果进行分析和性能评价。基于BP神经网络的数据预测具有更低的误差,实际输出与预测值有更好的拟合度,能够较为精准的预测。这些结果说明了对于数据预测来说,神经网络的使用还是很有必要的,在生活中具有较大实用价值。
参考文献:
[1]彭彬彬,闫献国,杜娟.基于BP和RBF神经网络的表面质量预测研究[J].表面技术,2020,49(10).
[2]王晓颖.改进BP神经网络模型的地基变形预测[J].测绘与空间地理信息,2017,40(03):215-217.
[3]隋明辉.基于BP人工神经网络的混凝土强度预测模型[J].建材与装饰,2016(13): 137-138.
[4]荀海潞.基于改进的BP神经网络在自相关过程控制中的应用[D].长安大学,2016: 258-263.
项目信息:
2018年安徽省大学生创新创业训练项目“基于基因数据与人工神经网络智能优化算法的人类疾病预测研究”(编号AH201810380012)
作者简介:
刘运(1981-),男,汉族,安徽合肥人,软件工程硕士,副教授,研究方向:智能计算与模式识别、高等工程教育教学研究。