基于神经网络和SARIMA模型的旅游需求探讨
2013-09-30尹杰杰王浩华
黄 浩,尹杰杰,王浩华
(海南大学信息科学技术学院,海南海口570228)
随着《国务院关于推进海南国际旅游岛建设发展的若干意见》的正式颁布,海南省正在全面启动国际旅游岛建设各项工作,其目标是逐步将海南建成旅游国际化程度高、生态环境优美、文化魅力独特、社会文明祥和的开放之岛、绿色之岛、文明之岛、和谐之岛.海南国际旅游岛建设,不仅描绘出海南未来发展的蓝图,而且也为国内外有志之士投资海南旅游建设创造了前所未有的良好契机.海南的旅游资源极其丰富,如合理规划、正确地预测预报旅游需求,对促进本地区的经济发展和文化交流有着重要意义.旅游需求很大程度上由旅游人数来度量,如何准确地预测旅游人数已成为决策部门的重要依据.袁柳[2]、柏宏斌[3]等利用灰色理论对旅游人数进行了预测,但是在灰色模型中没有考虑季节性和周期性等相关因素的影响.涂雄苓[6]在结合季节性等相关因素影响下以桂林市为样本,运用时间序列分析方式对桂林市的旅游人口进行了预测.本文在收集相关部门数据的基础上,综合考虑了旅游资源、环境、交通、费用和服务质量因素对旅游需求的影响,运用时间序列分析法,建立了SARIMA(3,1,2)(1,1,1)12模型,并通过神经网络算法预测了海南省年旅游人数,结果表明,预测值符合实际人数.
1 模型建立
1.1 建立多元线性回归模型 在考虑旅游资源、环境、交通、费用和服务质量因素的影响时,笔者对其影响因素进行了量化.在某一地区旅游资源一般变化不大,可以设为常数k.环境可用森林覆盖率来表示;交通用旅客周转量来表示;费用用在海南旅游平均消费来表示;服务质量用第三产业来表示.在进行年预测时,不用考虑季节对其影响,可建立多元线性回归模型.通过数据的收集和整理得到表1(来源:海南省统计局[1]).
旅游资源是在对旅游需求进行预测的决定性因素,但是由于每个地方的旅游资源在短期内变化不大,因此,可以看作是常量.旅游资源用k来表示,建立的模型如下所示
其中,旅游人数为y,人均消费为x1,第三产业为x2,旅客周转量为x3,森林覆盖率为x4.可建立一个多元线性回归模型,将式(1)表示出来,即为
表1 2002—2011年海南省旅游各种统计数据
于是,对于某年海南省的旅游总人数的计算式应为
根据Matlab计算,可得到该模型的回归系数估计值以及置信区间(置信水平取0.005),检验统计量为R2=0.998 4,F=780.233 1,P=0.000 0,结果如表2 所示 .
表2 统计量
于是,就得到多元线性回归模型
多元线性回归方程(2)反映了海南省的旅游资源、费用、交通和服务质量对当年的旅游人数的影响.从模型中可以看出,旅游资源作为k隐含在各因素中,当k发生变化时,每一项因素都会发生改变.
1.2 基于GM(1,1)和神经网络的旅游人数预测 由于来海南旅游的人数受到了旅游资源、费用、交通和服务质量等因素的影响,因此,在预测下一年的旅游人数时,就要考虑这些因素的影响.首先,根据已有的数据,以及 GM(1,1)模型[2-3],分别将各因素在 2012 年的值预测出来,然后再通过神经网络[4-5],预测出2012年海南省旅游人数.通过Matlab软件计算得到表3.
表3 2012年海南省旅游各因素的预测值
运用Matlab神经网络工具箱对2002—2011年海南省旅游的数据进行仿真,得到图1和图2的结果.
从图1和图2可以看出,原始数据与仿真数据非常接近,误差极小.借助Matlab求解程序,最后预测2012年海南省旅游人数为3 437.7万人.
图1 原始数据与仿真数据对比
图2 网络的学习曲线
1.3 建立SARIMA模型 多元线性回归模型以及神经网络算法,反映了海南省的年旅游人数与各因素之间的关系,并且做出了预测,但是并不能反映出每个月的旅游人数变化.因此,不仅要对年旅游人数进行预测,还要对月旅游人数进行预测,这样才能使得相关部门和单位为应对旅游人数的变化提前做好准备.本文通过建立SARIMA模型进行预测,通过数据的收集和整理得到表4(来源:海南省统计局[1]).
表4 月旅游人数 万人
图3 原始数据图
利用Matlab得到图3,4,5和6.
图4 取对数后的数据图
图5 对数、一阶差分
图6 对数、一阶差分再季节差分
由图3可知,数据呈明显的非平稳性和季节性,并伴随一定的周期性波动.为了消除趋势的影响,而且同时要求减少序列的波动,因此需对原序列y取对数,并命名为ly.由图4可见,序列依然不平稳,所以再将序列ly做一阶差分后命名为dly,然后做出图像.由图5可见,序列的趋势已经基本消除.图7是序列dly的自相关(AC)与偏自相关(PAC)分析图,其12倍数的滞后期,自相关系数与偏自相关系数的显著性均为0,说明序列存在显著的季节性,因此,需要再对序列dly做季节性差分,并得到序列sdly.由图7可知,序列sdly已经基本平稳,此时做出序列sdly的自相关(AC)与偏自相关(PAC)分析图.由图8可看出,序列sdly的自相关系数与偏自相关系数分别在3和2滞后数之后就迅速落入随机区域,表明序列dly的季节性已经基本消除[6].
图7 序列dly的自相关(AC)与偏自相关(PAC)
图8 序列sdly的自相关(AC)与偏自相关(PAC)
为了进一步检验序列是否平稳,对序列sdly进行ADF单位根检验,结果见表5.
从表5可以看出,t统计量的值为-7.963 990,比显著性水平为1%的临界值还要小,因此拒绝原假设,说明序列sdly不存在单位根,该序列是平稳的.sdly的样本平均数为 -0.000 693 087 1,均值标准误差为0.005 804 797 773,该序列均值与0无显著性差异,表明序列可以进行SARIMA模型.
由于序列经过一阶差分后,趋势才基本消除,因此d=1,再经过一阶季节差分后,季节性才基本消除,D=1,所以选用的模型为 SARIMA(p,d,q)(P,D,Q)12模型.由图8中的偏自相关(PAC)图可知,p=4或3比较适合;自相关(AC)图显示 q=2,3或4比较适合,因此可供选择的(p,q)组合有(3,1),(3,2),(3,3),(4,1),(4,2),(4,3),(4,4).将这些模型分别检验,再根据 AIC,SC 和 MAPE 对模型的阶数进行判定[6],结果如表6 所示 .
表5 序列sdly的ADF单位根检
表6 各模型的检验结果
由表6可知,SARIMA(3,1,2)(1,1,1)12模型的 AIC,SC 和 MAPE 值最小,因此最终选择该模型作为最理想的旅游需求预测模型,估计该模型的参数,并对模型进行相关检验.结果如表7所示.
表7 模型的参数估计
表7结果表明,模型SARIMA(3,1,2)(1,1,1)12的参数估计值具有统计意义,其模型的表达式为
2 检验并预测
SARIMA(3,1,2)(1,1,1)12是最理想的模型,但是该模型进行预测时,还要考虑其残差是否满足白噪声,因此,要对该模型的残差序列进行相关检验.如果残差序列是白噪声,表明所建立的模型已经包含了原始序列y的所有趋势,信息已经提取完全,所以,模型应用于海南省旅游预测是合适的.如果残差序列不是白噪声,说明信息还未提取完全,需要对模型做改进.对SARIMA(3,1,2)(1,1,1)12模型进行残差序列的ADF单位根检验(如表8所示),并做出残差序列的自相关(AC)与偏自相关(PAC)分析图,如图9所示.
由表8可以看出,t统计量值为-9.649 184,比显著性水平为1%的临界值还要小,说明残差序列是平稳序列.
表8 残差序列的ADF单位根检验
图9 残差序列的自相关(AC)与偏自相关(PAC)
由图9可见,残差序列的自相关系数(AC)和偏自相关系数(PAC)迅速落进了随机区域,因此,该序列平稳,这与上述结果相吻合.综合考虑,残差序列是服从正态分布的,即SARIMA(3,1,2)(1,1,1)12模型可以较好地模拟时间序列的变化趋势.
利用SARIMA(3,1,2)(1,1,1)12模型对2012年8月至12月海南旅游人数进行预测,结果如图10所示.从图10中可以看出,预测值与实际值基本吻合,这表明模型选择是正确的,且拟合效果比较好.
图10 2002—2012年海南省月旅游人数预测结果
表9 2012年8月至12月海南旅游人数预测结果 万人
利用SARIMA(3,1,2)(1,1,1)12模型,给出了2012年8月至12月海南省旅游人数预测值(见表9).这一模型对海南省旅游人数的预测和分析具有显著的参考价值.笔者选取了2003年1月到2012年7月的数据进行预测,大量的数据保证了模型的精度.本文建立的SARIMA(3,1,2)(1,1,1)12能较好地反映海南省月旅游人数的发展规律,对海南省旅游的相关部门提供了可靠的参考依据.
3 结束语
海南省是我国惟一的热带岛屿省份,是旅游爱好者最受欢迎的热带海滨度假胜地.海南建省办经济特区24年来,旅游业取得了长足的发展,现已经成为国民经济的支柱产业和龙头产业,也是最具特色与潜力的外向型产业.本文利用旅游人数来刻画旅游需求,并对此进行了分析和预测,同时探讨了各因素对旅游需求的影响,为海南省的旅游需求提供了参考依据.
[1]海南省统计局,海南省旅游数据统计[EB/OL].[2012 -08 -10]http://www.hi.stats.gov.cn/hnstjj/index.html.
[2]袁柳,贾博儒,许松林,等.基于灰色理论的旅游需求预测算法分析[J].科技创新导报,2010(17):232-233.
[3]柏宏斌,李川江.基于灰色系统理论的旅游需求预测[J].旅游教育管理,2011(11):232-233.
[4]陈俊,陈兆雄,幸林,等.基于BP神经网络的云南国际旅游需求预测[J].昆明师范高等专科学校学报,2005,27(4):89-91.
[5]张郴,张捷.中国入境旅游需求预测的神经网络集成模型研究[J].地理科学,2011,31(10):1208-1213.
[6]涂雄苓,黄月玲.旅游需求预测的ARIMA乘积季节模型构建及实证分析—以桂林市为例[J].广西财经学院学报,2011,24(1):112 -117.