基于深度卷积长短记忆神经网络的辽宁省滑雪旅游经济预测
2021-08-31贺佃忱
摘要:目前,中国滑雪人口已超过了一千万,滑雪市场给我国旅游业带来了一个新经济增长点,旅游经济也得到了迅速的发展。尤其辽宁省滑雪旅游产业的已初具规模,滑雪旅游也成为带动辽宁省发展经济的重要经济增长点。但是对于未来滑雪旅游经济预测研究甚少,而且人们对更先进的预测方法也越来越感兴趣。因此,本文提出了基于深度卷积长短记忆神经网络对旅游需求进行预测。首先利用季节性趋势自回归综合移动平均模型剔除长期线性趋势,然后利用深度卷积长短记忆神经网络训练残差数据进行短期预测。结果表明,提出的模型具有较好的预测性能。
关键词:滑雪旅游经济;深度卷积长短记忆神经网络;自回归综合移动平均模型;短期预测
1.引言
随着全球国际化的影响,滑雪旅游业也处于快速发展的状态。众所周知,滑雪旅游业对一个国家的经济和社会发展的影响是巨大的。它不仅可以商业、贸易和资本投资,而且也为员工创造就业和创业精神和保护文化遗产和文化价值观[1]。因此,一个可靠的经济预测模型是必要的,并在旅游规划中发挥重要作用。准确的预测为更好的旅游规划和管理奠定了基础。因此,需要在旅游需求研究中采用更有效的预测技术。
近年来,统计学被广泛应用于正在研究的滑雪旅游经济中。在统计方法中,时间序列预测是预测的一个重要领域。它可以分为两类:线性方法和非线性方法。最常用的线性方法是朴素模型、指数平滑(ES)模型和自回归综合移动平均(ARIMA)模型。神经元网络被许多专家认为是一种很有前途的时间序列预测技术。因此,在过去的几十年里,已经发表了2000多篇关于神经网络预测的文章,涵盖了广泛的应用[2]。
由于神经网络的广为人知,许多作者转向使用神经网络来预测时间序列数据。随着科学的进步,越来越多的方法被使用。组合模型是其中最常用的方法。此外,还提出了支持向量回归和新型混合系统[3]等方法。他们在优化问题和预测问题上取得了很大的成就,但数据预处理和后期参数选择问题相对复杂。
在本文中,将最先进的线性模型和深度卷积长短记忆神经网络结合在一起。比较结果表明,在滑雪旅游需求预测方面,新模型比其他DNN模型表现得更好。
2.提出的滑雪旅游经济预测模型
时间序列模型解释了一个变量关于它自己的过去和一个随机干扰项。近四十年来,时间序列模型被广泛应用于旅游需求预测。
2.1 ARIMA模型
在将ARIMA模型拟合到原始数据时,ARIMA模型涉及以下四个步骤:
1)识别ARIMA (p, q, d)结构;
2)未知参数的估计;
3)估计残差的拟合优度检验;
4)基于已知数据预测未来结果。
应与正态随机变量独立同分布,均值为0,常方差为 。 和 的根都在单位圆之外。根据相关经验ARIMA模型[14-15]至少应使用50或100个观测值。
2.2 深度卷积长短记忆神经网络
在深度卷积长短记忆神经网络中[4],我们采用预测编码网络(PredNet)作为基准骨干架构。PredNet架构由四个主要模块组成:输入卷积层、递归层、预测层和错误表示层。图1展示了这个体系结构。
RNN允许像存储内存一样存储前一个输入的效果,并影响下一个步骤的输出输入数据必须从预测数据中减去,以在网络的每一层产生输出。网络每一级的减法值作为预测误差计算,并用反向传播方法更新网络的权值。这些误差值被认为是同一级别卷积LSTM层的输入,并作为当前级别的输出或后续级别的网络输入。卷积LSTM层由其输出、卷积LSTM层的下一层输出和网络各层的误差值提供。这个卷积LSTM层将其输出给卷积层,在网络的每一层生成预测数据。最后对网络进行训练,以减少计算误差。网络各层关系的数学公式如式3-6所示。
网络中所有卷积层、最大池化层和卷积LSTM层的内核大小为3×3。卷积层的步长是1,而max-pooling层的步长是2。每个交叉网络训练在150个epoch完成。epoch<75的学习率是0.001,当epoch>75,下降到0.0001。网络的权值采用Adam算法进行优化。所有实验都是在Python中使用Keras进行的,硬件平台是一台配备了英特尔Core i-7-6700、16GB RAM和NVIDIA GeForce GTX TITAN X GPU的计算机。
3结果及分析
由于经济的快速增长和滑雪旅游的促进,冬季来辽宁滑雪旅游的人数逐年大幅增加。这里选取2010年11月至2014年11月入境游客。数据集的处理过程:输入旅游时间序列,描述一个序列图表,检查自相关和偏相关,本文网络模型,给出结果。采集的数据分为两组:训练数据和测试数据。
3.1 评价方法
一些定量统计指标如归一化均方误差(NMSE)、绝对误差百分比(APE)、相关系数(R)等。用NMSE和APE来衡量预测值与实际值之间的偏差。NMSE和APE值越小,表示预测值与实际值越接近。采用度量R来测量实际值与预测值的相关性[5]。
3.2 实验结果
对于具有显著季节性周期性变化的数据,本文采用SARIMA模型消除线性趋势。并使用AIC来测试哪一代是最好的。通过SARIMA模型得到没有线性趋势的数據,分别用DNN模型和提出的模型对数据进行训练。我们可以得到DNN模型和提出的模型的结果如下。
如表1所示,我们可以看到本文模型的结果比DNN模型的结果要好得多。为了深入评价DNN模型和SA-D模型的性能,我们计算了测试数据集的APE、NMSE和R,如表2所示。可以看到,本文模型的NMSE、APE和R都比DNN模型好得多。
4 结论
在本研究中,我们提出了一种新的深度卷积长短记忆神经网络模型,它结合了SARIMA模型。首先,利用辽宁省滑雪旅游组织收集的数据,比较了本文模型和DNN模型;结果表明,本文模型能较好地拟合和预测时间序列数据。并与其他作者的模型进行了对比,验证了模型的有效性,得到了预期的结果。
参考文献
[1]H. Song and G. Li, "Tourism demand modelling and forecasting-a review of recent research," Tourism Management,vol. 29, no. 2, pp. 203-220, 2008.
[2]Lin Teng, Hang Li and Shahid Karim. DMCNN: A Deep Multiscale Convolutional Neural Network Model for Medical Image Segmentation [J]. Journal of Healthcare Engineering, 2019.
[3]S. F. Crone and P. C. Graffeille, "An evaluation framework for publications on artificial neural networks in sales forecasting," in Proceedings of the International Conference on Artificial Intelligence (IC-AI '04), pp. 221-227, Las Vegas, Nev, USA, June 2004.
[4]J. Teixeira and P. Fernandes, "Tourism time series forecast with artificial neural networks," Tekhne, vol. 12, no. 1-2, pp. 26-36,2014.
[5]张永安,颜斌斌. 一种股票市场的深度学习复合预测模型[J]. 计算机科学, 2020, v.47(11):263-275.
项目编号:省社科联2021年度辽宁省经济社会发展研究课题(2021lslwzzkt-055).
作者简介:贺佃忱,男(1981—),辽宁沈阳人,沈阳师范大学体育科学学院,讲师,博士,研究方向,体育教学。