新疆某三甲医院死亡病例时间序列模型建立与应用
2016-03-10周美萍张甲详陈保林文国新
周美萍,张甲详,陈保林,文国新
(1.新疆自治区人民医院医务部预防保健科,新疆 乌鲁木齐 830001;2.乌鲁木齐市疾病预防控制中心,新疆 乌鲁木齐 830026)
新疆某三甲医院死亡病例时间序列模型建立与应用
周美萍1,张甲详1,陈保林2,文国新2
(1.新疆自治区人民医院医务部预防保健科,新疆 乌鲁木齐 830001;2.乌鲁木齐市疾病预防控制中心,新疆 乌鲁木齐 830026)
目的 探讨某三甲医院死亡病例的时间分布情况,从大体上了解该院死亡病例周期性变化趋势,为后期工作开展及应对提供参考。方法本次研究收集2011年1月至2015年12月该三甲医院的所有死亡患者的数据,包括患者的死亡时间,使用SPSS 21.0对死亡时间的分布进行分析,并加以预测,以2015年实际观察值验证模型的预测效果。结果2011-2014年的数据变化中存在明显的季节因子,周期性变化明显,其中加法模型R2最高,因此选择加法模型进行拟合,模型拟合效果判定指标,RMSE值=8.776;MAPE值=8.368;MAE值=6.552;标化后的BIC值=4.586。本次研究结果中预测误差值在20%以内,且实测值均落在95%CI的范围内,经配对t检验发现实测值与预测值之间差异无统计学意义(t=0.448,P=0.663),实测值与预测值之间相关系数r=0.780(P=0.003)。结论新疆某三甲医院的死亡病例的时间分布符合指数平滑相加模型,存在明显的季节变化周期,可能与选择性就医有关。本结果显示该院在1、5、9月份的死亡数上升,应在工作中做好应对,做好死者家属的安抚及处理工作。
新疆;三甲医院;死亡;时间序列模型
新疆地处我国西北边疆,地广人稀,医疗资源配给相对不足,经乡镇医院转县级医院之后再转至三甲医院的流程时间相对较长,进入医院时病情相对较重,因此三甲医院病例死亡发生情况相对内地而言较高[1]。新疆某三甲医院作为新疆重点医院,面向各族群众开放,其死亡病例的逐年变化趋势及规律可以为政策制定及后期服务提供数据支持,为此,本文探讨了某三甲医院死亡病例的时间分布情况,以了解该院死亡个案发生的时间周期性及变化趋势[2]。
1 资料与方法
1.1 资料来源 本次研究收集2011年1月至2015年12月该三甲医院的所有死亡的病例的数据,收集患者的死亡时间数据。
1.2 数据整理 死亡病例纳入标准:(1)已登记入院病例;(2)在治愈或好转出院前死亡。排除标准:(1)死于院前急救病例;(2)出院后死亡病例。2011年1月至2014年12月的每月死亡病例数用于建立该院死亡随时间变化的时间序列模型,2015年1~12月份的死亡观测值(实际死亡数)用于验证时间序列模型的预测效果。
1.3 时间序列模型简介 时间序列(time series)是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列。时间序列法是一种定量预测方法,亦称简单外延方法[3]。时间序列分析(time series analysis)是一种动态数据处理的统计方法。该方法基于随机过程理论和数理统计学方法,研究随机数据序列所遵从的统计规律,以用于解决实际问题[4]。
1.4 统计学方法 本次研究使用SPSS21.0进行统计分析,预测值与实际值之间的相关分析使用Perason相关分析,预测值与实种数之间的比较使用配对t检验,检验水准α=0.05,P<0.05时认为差异有统计学意义。模型检验标准α=0.05,P<0.05时认为模型显著,足以解释变异来源。
2 结 果
2.1 模型筛选 由于此次所选数据年份仅为3年,以12月为一周期,仅使用了3个周期的数据,即可以定为短期预测模型建立,期于数据已有的周期性,考虑使用指数平滑法进行模型拟合。指数平滑法是即根据历史资料的上期实际数和预测值,用指数加权的办法进行预测。此法实质是由内加权移动平均法演变而来的一种方法,优点是只要有上期实际数和上期预测值,就可计算下期的预测值,是国内外广泛使用的一种短期预测方法。根据指数平滑中数据是否有周期性,平滑模型又可以分为周期性指数平滑与简单指数平滑模型两大类。进行模型筛选前对数据进行判定,分析数据变化的长期趋势、季节变动、循环变动、不规则变动;因此使用SPSS进行季节分解。2011-2014年的数据变化中存在明显的季节因子,周期性变化明显。见图1~图4。因此选择指数平滑模型中的周期变化类模型。
图1 死亡数不规则变动图
图2 死亡数的季性性周期变化规律
图3 死亡数的循环变动序列图
图4 死亡数长期变化趋势变动图
2.2 模型拟合 在已确定的周期性指数平滑模型中,还存在三种模型可以选择:(1)简单季节(simple seasonal);(2)相加模型(winter's additive);(3)相乘模型(winter's multiplicative);为选择较好的模型,拟使用R2作为选择标准,即R2较大者为优质模型。从表1的结果中可以看出,三种模型均有较好地拟合(P<0.05说明模型显著),其中加法模型R2最高,因此选择指数平滑模型中的加法模型进行拟合,见表1。
表1 三种指数平滑模型拟合结果比较
2.3 模型参数及序列图 模型拟合效果判定指标,RMSE值=8.776,MAPE值=8.368,MAE值=6.552;标化后的BIC值=4.586;均符合要求,拟合后模型的序列图见图5。
图5 模型序列图
2.4 预测结果验证 本次研究结果中预测误差值在20%以内,且实测值均落在95%CI的范围内,经配对t检验发现实测值与预测值之间差异无统计学意义(t=0.448,P=0.663)。实测值与预测值之间相关系数r=0.780,P=0.003,见表2。
表2 预测结果与实际数值间比较
3 讨 论
死亡对个体而言是生命的结束,对家庭而言均是最为承重的打击,如何避免死亡、了解死亡发生规律是国内外学者一直以来的研究热点。导致死亡的原因众多,环境、个体、社会等因素都有可能导致死亡,一般而言是受到社会、环境、自身等多重因素的相互作用导致的死亡,就某一城市而言、地域而言是有自身一定的人群死亡规律的,如胡梦珏等[5]研究就显示,社会经济经济与环境温度的变化就对南方城市人群的死亡有重要影响。新疆地处祖国西部,生活环境、习惯、气候变化等均与内地城市不同,人群的死亡特点是否会存在不同尚不得知,为了解新疆某三甲医院死亡病例的时间分布情况,为更进一步了解死亡个案发生的周期性因素及变化趋势,给死亡预测及预防提供方法学及数据参考。
此次研究结果显示,新疆某三甲医院的死亡病例的时间分布符合指数平滑相加模型,均存在明显的季节变化周期,结果显示,每年1月、5月、9月份存在季节性死亡上升,而在2月份与12月份存在两个死亡低谷,笔者认为,出现此结果的原因主要有:(1)与12月份及2月份的相应节假日有关,即低等级医院向该三甲医院转院患者数量下降而导致该医院在12月份及2月份的死亡病例数下降,具体原因可以在后期的研究中做进一步调查。(2)就医选择性因素,医院的接诊为被动接诊,因此,就医选择可能是死亡时间变化的误差项;(3)季节及气候等因素导致死亡病例的变化,研究显示,冬季空气污染严重,导致呼吸系统疾病致死占比增加[6-7],夏季高热与循环系统病致死增加有关[8-9]。此结果给医院工作的提示是,1、5、9月份的死亡数上升,应在工作中加以提前应对,做好死者家属的安抚及处理工作。
本研究的不足:(1)此次研究选择了时间序列对单个医院的所有病种的死亡病例的时间分布进行分析,未对不同性别、不同民族、不同年龄段的死亡的时间规律进行分析,后期可以加以补充;(2)此研究为单一中心的研究,后期可以考虑联合多家三甲医院,或者对比多家基层医院死亡规律,为探讨死亡病例的就医选择规律提供参考;(3)此次研究所选的死亡病例未按死因进行分类,后期研究中可以针对该医院的不同类型的死亡进行时间序列分解,从而更有实际意义。
本研究结果显示,新疆某三甲医院的死亡病例的时间分布符合指数平滑相加模型,具有明显的季节变化周期,可能与就医选择和气候、节假日等因素共同作用有关,医院在1、5、9月份的死亡数上升时,建议应在工作中加以提前应对,做好死者家属的安抚及处理工作。
[1]Astell-Burt T,Liu Y,Feng X,et al.Health reform and mortality in China:Multilevel time-series analysis of regional and socioeconomic inequities in a sample of 73 million[J].Sci Rep,2015,5:15038.
[2]夏兰芳,孟郁洁,李迎迎,等.ARMA模型在非意外死亡率动态预测中的应用[J].中国数字医学,2014,4:35-37,46.
[3]Chang HH,Fuentes M,Frey HC.Time series analysis of personal exposure to ambient air pollution and mortality using an exposure simulator[J].J Expo Sci Environ Epidemiol,2012,22(5):483-488.
[4]杨晓明,沈冰,王妍敏,等.上海市静安区居民意外跌落死亡率时间序列分析与预测[J].中国公共卫生,2015,31(11):1450-1452.
[5]胡梦珏,马文军,张永慧,等.社会经济因素对南方城市温度-死亡暴露反应关系的影响分析[J].中华预防医学杂志,2014,48(5): 401-405.
[6]Lopez-Villarrubia E,Ballester F,Iniguez C,et al.Air pollution and mortality in the Canary Islands:a time-series analysis[J].Environ Health,2010,9:8.
[7]Daumas RP,Mendonca GA,Ponce DLA.Air pollution and mortality in the elderly in Rio de Janeiro:a time-series analysis[J].Cad Saude Publica,2004,20(1):311-319.
[8]Linares C,Martinez-Martin P,Rodriguez-Blazquez C,et al.Effect of heat waves on morbidity and mortality due to Parkinson's disease in Madrid:Atime-series analysis[J].Environ Int,2016,89-90:1-6.
[9]Lin H,Zhang Y,Xu Y,et al.Temperature changes between neighboring days and mortality in summer:a distributed lag non-linear time series analysis[J].PLoS One,2013,8(6):e66403.
Establishment and application of time series model of deaths in a tertiary Hospital in Xinjiang.
ZHOU Mei-ping1, ZHANG Jia-xiang1,CHEN Bao-lin2,WEN Guo-xin2.1.Department of Prevention and Health,Division of Medical Affairs, People's Hospital of Xinjiang Autonomous Region,Urumqi 830001,Xinjiang,CHINA;2.Urumqi Center for Disease Control and Prevention,Urumqi 830026,Xinjiang,CHINA
ObjectiveTo explore time distribution of deaths in tertiary hospital for a better understanding of cyclical factors and trends of hospital deaths occurred,and to provide reference for the further development of targeted policies.MethodsThe data of the death of patients in a tertiary hospital from January 2011 to December 2015 were collected.SPSS21.0 was used to analyze the distribution of the time of death.The effect of forecast model was verified by actual observed value in 2015.ResultsThere were obvious seasonal factors in the change of data from 2011to 2014,and there was significant periodic change.Among them,the additive model R2was the highest,which was chosen for fitting,with the effect determination indexes,of RMSE=8.776,MAPE=8.368,MAE=6.552,BIC after standardization=4.586.The predicted error values were within 20%,and the measured values were within the range of 95%CI. There was no significant difference between the measured and the predicted values by the paired t test(r=0.448,P= 0.663).Correlation coefficient between measured value and predicted value was r=0.780(P=0.003).ConclusionTime distribution of deaths of tertiary hospital in Xinjiang is in line with the exponential smoothing additive model,with obvious seasonal change,which may be related to selective treatment.The results show that the number of deaths risen in the January,May,September,and it is suggested that corresponding measures should be taken to deal with the deceased and to appease their families.
Xinjiang;Tertiary hospital;Deaths;Time series model
R339.3+9
A
1003—6350(2016)18—2981—03
10.3969/j.issn.1003-6350.2016.18.019
2016-03-22)
新疆维吾尔自治区人民医院院内科研项目(编号:20140301)
文国新。E-mail:wgxxjbc@sina.com