基于支持向量机与时间序列组合模型的我国旅游市场预测研究
2021-05-12高孝成范英兵肖钧莹
高孝成 范英兵 肖钧莹
(黑河学院,黑龙江 黑河 164300)
随着我国的综合国力和经济水平的提升,人民的经济水平也有了很大的提高,人均可支配收入也在随之增加,因此,促进了我国国内旅游人次的飞速增长,在旅游方面的花费越来越高,旅游行业的收入在不断持续增长,促进了旅游行业的持续发展。国内旅游行业的展开,带动了我国经济的飞速发展。目前,旅游业的发展为我国经济的增长作出了具大贡献,并且成为我国消费人口最多、收入最高、发展最快的产业。因此,在发展旅游业时,各个国家、各地区都需根据该地旅游市场的预测,合理的规划旅游行业的发展路线及开拓市场的速度,以实现利益最大化。
1 模型构建方法及理论
1.1 ARIMA模型
1.2 支持向量机模型
2 国内旅游需求预测
2.1 国内旅游人次数据来源
本文选取了1994—2019年我国国内旅游人次的数据为样本进行分析,数据都来源于中国统计年鉴,样本总数为26。根据这些样本,构建时间序列模型,预测2020年国内旅游人次。
2.2 国内旅游人次时间序列模型建立
2.2.1 数据平稳性检验平稳化处理
我国国内旅游人次数据整体有持续上升的趋势,并不具有零均值的特点,方差也是不断变化的,能够初步断定国内旅游人数的时间序列是不平稳的,有一定的趋势性不平稳。二阶差分后序列记为DDX,由图1可知,原始数据进过二阶差分后,序列趋于稳定。同时根据单位根的检验结果可知,ADF的相伴概率值为0.000,在0.05水平以内,统计量的值为-8.021,在0.05置信水平以下,因而初步能够判断二阶差分后的国内旅游人次时间序列数据是稳定的。
图1 二阶差分序列图
2.2.2 时间序列模型识别与定阶
图 2 自相关与偏自相关序列图
由图2可知,自相关序列呈现出拖尾状态,偏自相关序列呈现出截尾状态,由此可初步判断为AR(1)。为得到最优的模型,可将模型假设为这样MA(q)、AR(p)、ARIMA(p,d,q),p=1,2,3;q=1,2,3,之后对模型进行拟合。
表1 AIC和BIC值
从表1可知,模型MA(1)的AIC、BIC值最小,所以,ARMA(1,3)模型是最优的,可以根据此模型进行我国国内旅游人次的预测,此时的数据是经过对原始数据二阶差分得到的,d=2,此时ARIMA(1,2,3)为最优模型。
2.2.3 时间序列模型的参数估计
ARIMA(1,2,3)模型参数估计结果,如表2所示。
表2 参数估计值
2.2.4 时间序列模型精确度检验
将最终确定下来的最优模型进行适应性的检验,残差自相关函数满足 ,残差自相关检验表明ARMA(1,2,3)模型是合适的。同理 检验表明ARIMA(1,2,3)模型是合适的。如图3可知,2005年、2011年预测的误差较大,整体的拟合效果较好。
图3 真实值与拟合值图
2.3 SVM模型
2.3.1 单因素支持向量机模型
本文选取1994—2019年国内旅游人数数据,利用python软件构建SVM模型进行预测,1994—2000年国内旅游人数数据为训练样本,详细的运行过程是采用前五年的样本数据,预测下一年的国内旅游人数的方法;以1999—2003年的样本数据来预测2004年的国内旅游人数。罚常数、核函数参数及不敏感损失函数参数,即:C=10 000, =10。用优化参数后的模型,拟合原始数据,python输出结果整理见表3和图4。
由下页表3可知,SVM预测的误差较小,均在0.1%上下浮动,说明单因素SVM模型达到了高精度的标准,模型拟合效果较好。
图4 拟合效果图
由图4拟合效果图,红色线代表预测值,绿色线代表真实值,达到了很好地拟合效果。
2.3.2 组合模型预测
其中eit——第i各模型第t个样本的误差,N——模型个数为N[3]。
由(1)计算可得出最优加权系数k1=0.00850,k2=0.99149因此可得到组合模型如下:
y1代表ARIMA模型的预测值,y2代表SVM模型的预测值,ARIMA模型预测2020年国内旅游人次为6 496.251万,SVM模型预测的结果为6 605.324万。将ARIMA模型和SVM模型的预测结果带入上式可得到组合模型的预测值,如下页表3所示。
将三种模型的预测效果进行对比,下页表3为三种模型预测的相对误差值,由相对误差值的大小可以看出,组合模型的预测效果最好精度最高。预测精度较低的模型是ARMA模型,误差较大。
表3 模型预测相对误差对比
3 结论
根据本文研究得出以下结论:
支持向量机与时间序列组合模型预测2020年国内旅游人次为6 604.396 6万。
组合模型是国内旅游人次预测的最好模型。组合模型结合了ARIMA模型的短期预测和SVM 模型能解决各个影响因素实际存在的时间累积效应,组合模型的精度是最高的,能够很好的应用于国内旅游人次的预测。
SVM模型的预测效果要优于ARIMA模型,由于国内旅游人数时间序列数据是非平稳的,有一定的趋势性,因此SVM模型更加适合研究此问题,得出的误差较小。
ARMA模型以传统时间序列自相关分析为基础的,以现在值和过去值推测未来的值,短期的预测结果精确度较高,但随着时间的推移,误差就会逐渐变大,难以达到很好的模拟效果,因此,在对国内旅游人数进行预测时不适合使用ARMA模型。
根据国内旅游人次数据可以得出,我国国内旅游人次数据是非平稳的,呈现出持续增长的状态,因此我国国内旅游市场的规模也会被不断壮大,人均旅游消费以及我国旅游行业的收入都将会有大幅度的提升,正符合了我国对旅游行业的支持及经济结构的调整,预测结果较为可靠。