APP下载

基于回归分析的埃博拉疫情研究

2015-09-12童易成等

对外经贸 2015年8期
关键词:线性回归

童易成等

[摘要]针对埃博拉病毒的影响程度,利用线性回归、非线性回归、函数变换等分析方法,分别建立疫情较为严重的几个国家的埃博拉病毒感染人数规模变动、新药研制期限模型,运用Matlab7、Excel等软件计算得出埃博拉疫情爆发与时间的关系及研制对抗埃博拉病毒新药的最终期限。

[关键词]埃博拉疫情;线性回归;非线性回归

[中图分类号]R1818+1[文献标识码]A[文章编号]

2095-3283(2015)08-0140-03

[作者简介]童易成(1993-),女,安徽安庆人,本科生,研究方向:经济统计。

[通讯作者]朱家明(1973-),男,安徽泗县人,数学建模实验室主任,副教授,硕士,研究方向:应用数学与数学建模。

[基金项目]国家自然科学基金(项目编号:11301001);安徽财经大学教研项目(项目编号:acjyzd201429)。

埃博拉(Ebola virus)是一种能够引发人类和灵长类动物产生埃博拉出血热的烈性传染病病毒,十分罕见,死亡率也相当高。1976年这种病毒在苏丹南部和刚果(金)(旧称扎伊尔)的埃博拉河地区被发现后,引发了医学界的广泛关注和重视,该病毒也因此得名。本文根据从世界卫生组织获得的埃博拉病毒在非洲各国爆发的感染和死亡数据,按照当年感染人数规模,选取疫情较为严重的国家进行研究,并分析研制出治疗这种疾病的新药的最终期限。

一、埃博拉病毒感染人数规模变动趋势

(一)研究思路

根据从世界卫生组织获得的关于埃博拉病毒在非洲各国爆发的感染和死亡数据,按照当年感染人数规模,选取疫情较为严重的国家搜集相关数据,大致拟合出这些国家的感染人数的趋势方程,并根据方程判断埃博拉病毒感染人数规模变动情况,做出正确预测。

(二)数据处理

根据世界卫生组织的相关数据,选取刚果民主共和国、苏丹、加蓬、乌达干四个疫情较为严重的国家(见表1)。

根据表1数据分别绘出埃博拉感染和死亡人数与年份的折线图(见图1)。由图1可知,1976年、1995年、2000年、2003年、2007年埃博拉病毒疫情爆发规模较大,感染人数在(178,602)范围内,时间间隔分别为19、5、3、4年,爆发周期缩短,可见埃博拉疫情爆发趋于频繁。

图11970—2010年埃博拉病毒感染人数与死亡人数

由于不同年份感染人数存在较大差别,故将因埃博拉病毒导致的年感染人数超过150人的年份定为一级疫情年份,年感染人数在150人以下的定为二级疫情年份。一级疫情的年份周期浮动在3—5年,由此推断2006—2025年期间一级疫情爆发的年份将在区间[2003+3i,2005+3i]之内。

通过线性拟合的方法处理1979年以来的埃博拉病毒一级疫情年份的感染人数数据,用于模拟疫情感染人数的趋势:y=a+bx,通过软件Matlab7计算得到a=10921,b=5548,即:y=-10921+5548x。该公式表示自1976年首次爆发疫情后的第x年感染人数为y。

然而,由于一级疫情年份与二级疫情年份是呈周期性变化的,并非单纯直线增长,所以实际中每次埃博拉疫情出现时的感染人数y与此处拟合值偏差很大。从拟合的直线得到b=5548>0,可知埃博拉一级疫情爆发呈周期性增长趋势。由图1也可知二级疫情年份的爆发也呈周期性增长趋势。可以建立方程式如下:

y=a1(n-1975)+b1,n为一级疫情年份a2(n-1975)+b2,n为二级疫情年份

n∈[2003+3i,2005+3i],i=1,2,3,4,5,6,7

通过计算得到a1=75321,b1=19101,a2=26042,b2=21471,即

y=

75321(n-1975)+19101,n为一级疫情年份26042(n-1975)+21471,n为二级疫情年份,

一级疫情年份n∈[2003+3i,2005+3i],i=1,2,3,4,5,6,7

由此可以得到2006—2025年的疫情情况(见表2)。由于一级疫情爆发具有周期性,但这种周期只是一个范围,并不能具体到特定的数字,所以选取其中的一种情况,即周期是3年时,预测2006—2025年间埃博拉病毒感染人数。

(三)结果分析

由表2可知,在埃博拉疫情爆发后,没有药物介入治疗的情况下,2006年的感染人数为103人;2007年出现一级疫情时,感染人数为433人;到了2010年,感染人数达到568人。基于埃博拉疫情规模逐年递增的特点,疫情如果得不到有效的药物控制,死亡人数将是相当可观的,这不仅对非洲人民甚至对全世界来说都将是巨大的灾难。

二、治疗埃博拉感染新药研制最终期限的研究

(一)研究思路

在埃博拉疫情爆发初期,由于得不到社会的足够重视,所以疫情处于自由蔓延时期,感染和死亡人数都会不断增长。但在到达高峰期后,感染和死亡人数会逐渐减少,然后保持平稳。因此,从疫情初发期到高峰期不妨设定每位感染者平均每天可传染的人数是固定不变的。

(二)数据处理

埃博拉病毒在感染者体内的侵染过程可分为三个阶段。第一阶段:假如一个人不幸感染埃博拉病毒,在感染初期埃博拉病毒已经开始摧毁人体的免疫系统,这类病毒的潜伏期一般是5—10天;第二阶段:埃博拉病毒进一步侵染感染者的身体,几天后便达到感染者身体承受极限,一些幸运的感染者通过有效治疗病情没有进一步恶化并慢慢痊愈,而其他一些感染者则会发展到致命阶段;第三阶段:绝大多数感染者将因为多个器官衰竭、出血不止或者是休克而死亡,这种情况一般发生在第一次发病后的8—17天之间。endprint

关于这类问题的研究,可以通过建立阻滞增长模型来解决。阻滞作用体现在对感染病人的增长率r的影响上,使得r随着感染人数y的增加而下降。若将r表示为y的函数ry,那么可以看出该函数是一个减函数。因此有:

dxdt=ryy,y0=y0(1)

对ry的一个最简单的假定是,设ry为y的线性函数。即:

ry=r-sy r>0,s>0 (2)

设自然资源和社会环境条件中的最大人口数量为ym,当y=ym时感染人数不再增长,即增长率rym=0,代入式②得: ry=r1-yym (3)

将式(3)代入方程(1)得: dydt=ry1-yymy0=y0 (4)

解方程(4)可得: yt=ym1+ymy0-1e-rt (5)

从官方新闻媒体中收集整理数据,得到2014年埃博拉疫情较为严重的几内亚、利比里亚和塞拉利昂3个国家的感染和死亡人数数据(见表3)。

将2014年3月22日作为时刻t=1,则4月1日为t=11,以此类推,以11月7日为t=231作为终时刻,用函数(5)对表2中的数据进行非线性拟合,运用相关软件计算得到相关参数ym=14618,可决系数R2=09916。同时也可以利用公式:

r=∑ni=1xi-yi-∑ni=1xi-2∑ni=1yi-2

计算出相关系数r=0026。

由可决系数来看,拟合效果比较理想,所以得到2014年埃博拉感染和死亡人数变化趋势的拟合曲线为:

y(t)=146181+14618602-1e-0026t

(三)结果分析

由阻滞增长模型可以看出,对于整个社会而言,埃博拉病毒感染人数的增长速度与时间呈现以下趋势(见图2)。由图2可知,高峰期时增长速度达到最大,因此应最迟在ym/2时刻,即高峰期时刻研制出抑制病毒发展的新药并采取相应隔离措施控制疫情。

图2埃博拉病毒感染人数的增长速度与时间

对于感染者而言,根据埃博拉病毒的潜伏期、首次发病、死亡三个阶段,运用模糊集合的思想,利用函数变换方法,建立感染者从健康状态开始(第0天)到感染埃博拉病毒至死(第27天)的时间周期内健康指标隶属函数。K表示健康指标,t表示时间。

K=-008t+10≤t<5-002t+075≤t<10-215t+5610≤t<13(t-27)14013≤t≤27

在潜伏期前健康指标整体下降05,第二个阶段即潜伏期后健康指标下降速度加快。由第二阶段至第三阶段为病情蔓延的重要转折点,此时一些感染者病情好转,而也有一些感染者病情加快恶化,甚至死亡。因此,感染者应在转折点及第二阶段之前及时接受隔离及服用药品(见图3)。

三、结论

以上各模型通过相应的软件检验,具有一定的合理性。分析结果表明,埃博拉疫情规模呈逐年增长趋势;相关部门应在疫情爆发的高峰期研制出治疗病毒的新药;感染者在感染病情的第二阶段(5—10天后)接受药物治疗,将会达到最好的效果。

[参考文献]

[1]陆军,郭迎清等线性拟合法建立航空发动机状态变量模型[J]航空动力学报,2011(5):1174-1175

[2]李柏年,吴礼斌Matlab数据分析方法[M]北京:机械工业出版社,2012:44-47

[3]郑洲顺,曲选辉Logistic阻滞增长模型的稳定性与混沌[J]数学理论与应用,2003(1):57-58

[4]陈永胜基于MATLAB和SPSS的非线性回归分析[J]牡丹江师范学院学报,2009(5):101-102

[5]曾五一统计学简明教程[M]北京:中国人民大学出版社,2012:55-57

Abstract:Aiming at the influence level of the Ebola virus,using linear regression and nonlinear regression,the methods such as function transform,respectively established outbreak given infection people in the countiies epidemic is scale changes,the new drug development deadline model,calculate using Matlab7,Excel software such as Ebola outbreak and the relation between the time,the dealine that new drugs should be developed to fight the virus

Key words:Ebola epidemic;linear regression;nonlinear regression

(责任编辑:刘茜)endprint

猜你喜欢

线性回归
国道公路养护管理与规划研究
我国客运与城镇化关系研究
投资者情绪与股票市场收益的相互影响分析
基于差分隐私的线性回归分析
影响上市公司股票价格的微观因素分析
企业退休金收支平衡的研究
基于回归分析的马铃薯产值总量实证研究
企业退休金收支平衡的模型分析
中国服务业竞争力因素分析
房价与城镇化进程关系及影响研究