基于六种回归模型对门急诊量的预测
2016-02-27高洪达陈荷冯启明
高洪达+陈荷+冯启明
[摘要] 目的 比较直线回归模型、对数曲线模型、二次曲线模型、三次曲线模型、幂函数曲线模型、指数曲线模型六种模型在预测广西全区医院门急诊人次数上的准确性,为决策者提供科学的参考依据。 方法 依据2004~2011年广西全区医院门急诊人次数数据,分别采用直线回归模型、二次曲线模型、三次曲线模型、对数曲线模型、幂函数曲线模型、指数曲线模型对2012年门急诊人次数进行预测,并选用决定系数R2、绝对误差、相对误差等指标评价模型。 结果 直线、二次曲线、三次曲线、对数曲线、幂函数曲线、指数曲线模型的R2分别为0.999、0.999、0.999、0.998、0.997、0.997;相对误差分别为5.5%、4.8%、5.1%、13.1%、12.2%、3.0%。 结论 六种模型R2均在0.99以上,拟合效果较好,从预测误差来看,指数曲线模型误差相对最小,本案宜选用指数函数曲线模型。
[关键词] 回归模型;门急诊人次数;预测
[中图分类号] R197.3 [文献标识码] B [文章编号] 1673-9701(2015)25-0119-03
Forecasting the number of outpatient by six regression models
GAO Hongda CHEN He FENG Qiming
Guangxi Medical University School of Information Management Health Service Management, Nanning 530021, China
[Abstract] Objective To compare the effects on forecasting the number of outpatient and emergency patients in total hospitals of Guangxi by the regression of Linear, Quadratic, Cubic, Logarithmic, Power and Exponential. Methods The regression of Linear, Quadratic, Cubic, Logarithmic, Power and Exponential were used to predict the number of outpatient and emergency patients in 2012, and R2, relative error and absolute error were used to evaluate the regression. Results The R2 of the Linear, Quadratic, Cubic, Logarithmic, Power and Exponential regression were 0.999, 0.999, 0.999, 0.998, 0.997 and 0.997 respectively; the relative errors were 5.5%, 4.8%, 5.1%, 13.1%, 12.2%, 3.0% respectively. Conclusions The R2 of these six models was all higher than 0.99 which means the six models have good fit. Exponential regression has fewer errors than others, so it is a more suitable model than others in forecasting the number of outpatient and emergency patients in total hospitals.
[Key words] Regression model; The number of outpatient and emergency patients; Predicting
现代的医院管理实践中,统计预测的方法经常被管理者运用到医院发展趋势的评估中,而预测的结果能否符合实际情况,能否真实反映医院的发展态势,是医院统计预测的关键[1]。而且门急诊量也在一定程度上影响着医患关系的好坏,直接影响医院形象和声誉,医院如果未能分配足够的医护资源满足患者需求,可能会耽误患者就诊,进而导致医患关系紧张[2,3]。因此预测就显得尤为重要,目前常用的预测模型和方法有很多,主要有灰色预测模型[4]、线性回归模型、神经网络模型及马尔代夫链模型等[5,6]。本文利用2004~2011年广西卫生统计年鉴中全区医院门急诊总人次数进行回归分析,建立回归方程,并对2012年门急诊人次数进行预测,所选用的模型分别是:直线、二次曲线、三次曲线、对数曲线、幂函数曲线、指数曲线。通过对预测结果的测算,选择与门急诊人次发展趋势相适应的回归模型,现报道如下。
1 资料与方法
1.1 资料来源
广西卫生统计年鉴2004~2011年广西全区所有医院年门急诊人次数总和分别为:4061.710万人次、4341.100万人次、4645.480万人次、5039.678万人次、5304.530万人次、5684.790万人次、5979.410万人次、6362.000万人次。2012年的年门急诊人次数用来预测,实际值为7050.800万人次。
1.2 方法
1.2.1 回归模型 选取时间X为自变量,取1~8分别代指2004~2011;以急诊人次数实测值为因变量Y,对Y建立关于X的回归方程。选取下列六种回归模型的方程进行分析:
①直线(Linear):Y=b0+(b1×X)
②二次函数(Quadratic):Y=b0+(b1×X)+(b2×X2)
③三次函数(Cubic):Y=b0+(b1×X)+(b2×X2)+(b3×X3)
④对数函数(Logarithmic):Y=b0+(b1×log(X))
⑤幂函数(Power):Y=b0×(X^b1)
⑥指数函数(Exponential):Y=b0×(e^(b1×X))
1.2.2 评价指标 对回归模型方程评价,采用决定系数R2来反映回归的实际效果,R2取值介于0~1之间,越接近1,模型的回归效果越好,越接近0,模型的回归效果越低,并对其进行F方差分析以求得显著性水平。通过测算预测的误差大小,评价各模型预测的准确性,采用相对误差ê和绝对误差e进行评价(对预测误差取绝对值以消除正负号的影响),计算公式如下[1]:
绝对误差:|e|=|Yi-■i|
相对误差:|ê|=|(Yi-■i)/Yi|
1.3 统计学方法
文章中数据的分析处理通过SPSS13.0完成,并通过列表式和图表法进行数据表示。
2 结果
2.1 回归方程及其评价
由门急诊人次数和年份的数据散点图可看出门急诊量与年份呈现线性变化趋势,根据2004~2011年门急诊人次数资料分别建立六种模型的回归方程,并用R2对方程进行评价,见表1和图1。从结果可以看出,六种回归模型均有统计学意义(P<0.01),决定系数R2均在99%以上,表明门急诊人次数Y的总变异中时间X对门急诊人次数Y的回归关系所能解释的比例在99%以上,回归效果较好。
2.2 回归预测结果及其评价
用各模型的方程预测2012年的门急诊人次数,然后将2012年门急诊预测值与实际人次数相比较,分别对六种回归模型在预测2012年广西全区医院门急诊人次数上的准确度进行评价。通过比较六种回归模型预测结果误差发现,指数函数曲线模型的相对误差(绝对值)最小,为3.0%,绝对误差211万人次,其次为二次曲线函数模型,而对数曲线模型和幂函数曲线模型相对误差较大(分别为13.1%和12.2%),见表2。对于本案例资料预测模型的选择,宜选用指数函数曲线模型。
3 讨论
对于医院来讲,门急诊是医院的重要组成部分,在很大程度反映出医院的管理水平、医疗质量以及医疗技术等[7]。准确预测医院门急诊人次的变化趋势可以提高医务人员的工作效率,医院管理者可以根据门急诊人次数的预测提前对医院的各项资源进行合理分配,为医院的科学化管理提供保证。从本文案例来看,广西全区医院门急诊人次数呈指数曲线模型增长,可能由于随着经济的发展,医院规模的不断扩大,医疗技术水平的提高,居民医保的逐渐铺开以及广西全区所实行的一系列医改政策,使得患者更倾向于到医院就诊,有资料显示:广西2012年城镇居民医保、城镇职工医保以及新农合人数是4986万人,高于96%的参保率,城乡居民人人均享有基本医疗保障的目标基本实现,并且2012年政府对城镇居民医保和新农合的补助也提高到240元每人,报销范围也开始由大病延伸到小病[8],进而使得医院患者迅速增长,也就出现了我们所看到的指数增长趋势。
为应对不断增长的门急诊患者,作为医院需采取一定的措施来满足患者的就诊需求。可从以下几个方面着手:①建立有序的门急诊秩序,优化就诊流程,进而提升就诊的效率[9]。②合理地配置各种医疗资源,对门诊实行动态管理[10]。③抓好医院的质量管理,并做好门急诊的统计和预测,保证医院又好又快地发展[11]。
随着社会的发展,决策的科学化越来越受到重视,而决策的科学化又需要科学的预测,特别在卫生领域,科学的预测并付诸相应的措施,可以很大程度上减轻损失,满足人们与日俱增的卫生需求。医院卫生统计预测是医院管理的重要手段,它是在统计的基础上,根据医院的历史资料及事物的发展规律,可有助于针对问题做出科学决策,并检验所作出决策是否正确,同时预测也是计划和决策的前提,医院根据预测来制定中长期发展规划,并与时俱进地推动设备、技术及人才的更新[12]。
在统计预测方法上,本文为避免单独采用一种回归预测模型存在较大误差,应用多种回归预测模型进行预测,以求与实际情况相符。在统计预测结果上,本文为提高结果的可靠性,在给出点预测值的同时进行区间估计,即求出预测值可能的取值范围(95%的可信区间)以及在这一范围内取值的可信程度(显著性),力求可靠性与准确性相统一。本文不足之处在于仅考虑门急诊人次数随时间序列的变化,未考虑其他因素的影响,在以后的研究中将不断扩展研究的视角,提高研究层次。
[参考文献]
[1] 韩纪连,尹世耐. 应用最小二乘法预测出院人次[J]. 统计与咨询,2012,(4):60.
[2] 马春柳,刘海霞,李小升,等. 灰色预测模型GM(1,1)在医院门诊量预测中的应用[J]. 中国病案,2012,13(12):23-25.
[3] 李海燕,张徐龙. 2000年-2009年门诊量变化趋势分析[J].中国病案,2011,12(6):60-61.
[4] 张喜红,刘雁灵,杜中强,等. 灰色预测模型GM(1,1)在猩红热发病率预测中的应用[J]. 数理医药学杂志,2011, 24(3):347-349.
[5] 易静,胡代玉,杨德香,等. 三种预测模型在肺结核发病预测中的应用[J]. 中国全科医学,2012,15(13):1495-1497.
[6] Martinez EZ,Silva EA,Fabbro AL. A SARIMA forecasting model to predict the number of cases of dengue in Campinas,State of S?觔o Paulo,Brazil[J]. Revistada Sociedade Brasileirade Medicina Tropical,2011,44(4):436-440.
[7] 王姗姗.数字化医院门急诊医疗质量管控方法研究[D].南方医科大学,2013.
[8] 郑敦林,黄菊铃,朱平华,等. 2012年广西医改进展及述评[J]. 卫生经济研究,2013,(12):17-19.
[9] 孙婕. 我院门诊量季节变动趋势分析[J]. 中国卫生统计,2009,26(2):177-178.
[10] 刘莉. 门诊量季节变动分析[J]. 中国病案,2009,10(4):40-41.
[11] 胡蓉. 某医院门诊量动态分析及预测[J]. 中国卫生事业管理,2010,(12):39-41.
[12] 阿布都沙拉木·依米提,阿里木江·艾山. 利用回归曲线对肿瘤医院出院人数的预测[J]. 中国病案,2008,9(8):46-48.
(收稿日期:2014-12-10)