应用BP神经网络预测西非三国埃博拉出血热疫情
2015-03-24杨佳琦张银娟承德医学院河北承德067000
杨佳琦 张银娟(承德医学院 河北 承德 067000)
应用BP神经网络预测西非三国埃博拉出血热疫情
杨佳琦张银娟
(承德医学院河北承德067000)
摘要目的:为研究BP( Back Propagation)神经网络模型在疾病预测中的应用价值,并为埃博拉出血热的防治工作提供理论依据。方法:应用BP神经网络模型对2014年至今西非三国埃博拉出血热流行趋势进行预测。以西非三国2014年3月至12月埃博拉出血热疫情资料建立预测模型,预测2015年1月西非三国埃博拉出血热疫情水平。结果:外推预测平均误差率为0. 05998,预测准确度为94. 00%。结论: BP神经网络模型可用于西非三国此次埃博拉出血热疫情的预测。
关键词疾病预测; BP神经网络;埃博拉
埃博拉出血热是由埃博拉病毒( Ebola virus,EBOV)所引起的一种急性出血性传染病,主要通过患者的血液和排泄物传播,临床表现主要为急性起病、发热、肌痛、出血、皮疹和肝肾功能损害,病死率极高,对人类健康危害巨大。2014年该病于非洲地区爆发,感染及死亡人数均创历史新高,其防治成为重要课题。近年来,BP神经网络在医药卫生研究领域中得到越来越多的重视和应用。本文将BP神经网络应用于非洲埃博拉出血热流行趋势的预测,以建立埃博拉出血热的神经网络预测模型,为埃博拉出血热的防治工作提供理论依据。
1. 材料与方法
1. 1资料来源世界卫生组织官方网站、中国疾病控制中心官方网站、美国疾病控制中心官方网站2014年3月至今为止埃博拉出血热流行资料。神经网络的实现选用MATLAB软件。
1. 2预测内容及方法以西非三国2014年3月至12月埃博拉出血热疫情资料建立预测模型,预测2015年1月西非三国埃博拉出血热疫情水平。
1. 3BP神经网络模型原理及方法
1. 3. 1原理神经网络是一种运用类似生物神经系统工作原理进行信息处理的数学模型。BP( Back Propagation)神经网络是近年来应用较多的神经网络之一,是一种按误差逆向传播算法进行学习的多层前馈网络,通过误差的反向传播不断调整各层神经元连接权值,以保证网络输出误差达到最小或小到可接受的范围内[1]。其预测过程的工作原理大致为:将历史数据或已知数据作为网络的训练数据对网络进行训练,训练数据一般应分为网络输入数据和期望输出数据两部分,神经网络在训练过程中通过学习拟合网络输入数据与期望输出数据之间的映射关系或规律,训练结束后(即输出误差达到要求),神经网络将最优的连接方式和连接权值保存下来,当再次输入符合该规律的新的数据时,神经网络将按保存下来的连接方式和连接权值对其予以处理、运算,并最终推测出预测值,完成预测工作[2]。
1. 3. 2结构本文采取3层的BP神经网络,分别为输入层、隐层、输出层,每层设神经元若干。
1. 3. 3网络输入、期望输出数据以西非三国(几内亚、利比里亚、塞拉利昂) 2014年3月至11月埃博拉出血热累积报告病例数作为网络输入数据,以2014年12月累积报告病例数作为期望输出数据,对网络进行训练。网络训练好后对西非三国2015年1月埃博拉出血热累积报告病例数进行预测。
1. 4精度检验为了检验模型的预测效果。采用绝对误差,平均误差率以及预测准确度检验其拟合和预测效果。
平均误差率=平均绝对误差/实际值的均值预测准确度= ( 1-平均误差率)×100%
2. 结果
2. 1西非三国埃博拉出血热疫情资料整理将西非三国2014年3月至今为止埃博拉出血热流行资料按月统计累积报告病例数,结果见表1。
2. 2BP神经网络模型经过大量实验,最终确定输入层神经元数为3,隐层神经元数为8,输出层神经元数为1;以线性函数为功能函数。此时网络输入数据为2014年3月至11月数据,输入数据P为P =[112 8 0; 221 13 0; 281 12 16; 390 51 158; 460 329 533; 648 1378 1026; 1074 3458 2021; 1667 6535 5338; 2155 7635 7109],期望输出数据为2014年12月数据,期望输出数据T为T =[2707 8018 9446],并对数据进行归一化处理,归一化处理后进行网络的训练,训练误差达到要求,网络训练完成。以训练好的网络预测西非三国2015年1月埃博拉出血热累积报告病例数,此时以2014年4月至12月数据为输入数据,此时输入数据命名为P2,P2 = [221 13 0; 281 12 16; 390 51 158; 460 329 533; 648 1378 1026; 1074 3458 2021; 1667 6535 5338; 2155 7635 7109; 2707 8018 9446],经归一化处理后输入网络,运行网络得到预测结果,将结果反归一化,得到最终预测结果}:西非三国2015年1月埃博拉出血热累积报告病例数预测值为几内亚3260例、利比里亚8390例、塞拉利昂9770例。
2. 3预测效果经计算,本文针对西非三国2015年1月埃博拉出血热累积报告病例数的预测,
平均误差率为0. 05998,预测准确度为94. 00%,具体指标见表2。
3. 讨论
3. 1埃博拉出血热属于接触性传播疾病,2014年于西非爆发,给非洲人民带来重大生命健康危害,其防治工作成为关注重点,目前针对该病的特效药物及疫苗两方面的研究进展并不喜人,预防工作困难重重,如能对其病例出现的数量进行预判,对合理分配医疗力量与资源,及时展开治疗、隔离等工作均有积极意义。本文立意于此,进行研究,建立了西非三国埃博拉出血热累积报告病例数的BP神经网络预测模型,预测准确度较高,达94%,预测效果较好,表明BP神经网络可用于西非三国埃博拉出血热疫情的预测。今后研究应致力于完善预测方法、提高外推预测能力及对爆发情况的预测等方面,以达到更好的预测效果[5]。
3. 2BP神经网络在医学研究中的应用日渐增多,因其具有拟合非线性映射的能力,故具有更广的应用范围,在疾病预测方面已取得较多应用成果。本文所建立的BP神经网络仍以时间序列模型为基础,通过历史数据的处理来掌握其发生规律,在网络学习过程中对网络结构的不断调整,逐步完善网络模型的建立。针对网络结构的选择,目前尚无绝对规律可循,一般都需研究者自行探索,针对不同问题或同一问题的不同期数据都需重新调整网络。网络的拟合效果与数据质量的优劣紧密相关,欲取得较好的预测效果,数据的选择、整理至关重要[6]。本文所用数据来自世界卫生组织、中国疾控中心、美国疾控中心官方网站,真实性有所保证。
参考文献
[1]Bing Wang,Steve Valentine,Manolo Plasencia,et al. Artificial neural networks for the prediction of peptide drift time in ion mobility mass spectrometry[J]. BMC Bioinformatics,2010,( 182) : 1-11.
[2]Haykin S.神经网络原理(叶世伟等译)[M].第2版.机械工业出版社,2004:59.
[3]欧阳玉梅,马志强,方若森.基于MATLAB的遗传神经网络的设计于实现[J].信息技术,2008,( 6) :73-80.
[4]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].第1版.电子工业出版社,2005:83.
[5]段琼红,聂绍发,仇成轩,等.应用BP神经网络预测前列腺癌流行趋势[J].中国公共卫生,2010,16( 3) :193-195.
[6]王俊杰,陈景武. BP神经网络在疾病预测中的应用[J].数理医药学杂志,2008,21( 3) :259-262.
【中图分类号】R183
【文献标识码】B
【文章编号】1009-6019( 2015) 12-0031-01
作者简介:杨佳琦,男,承德医学院预防医学教研室,硕士学历。