APP下载

基于SARIMA-BP神经网络方法的汽车销量预测研究①

2017-05-30范庆科

中国商论 2017年22期
关键词:时间序列

摘 要:对汽车销量时间序列的预测方法进行了研究,针对汽车销量影响因素表现出的多样性,应用灰色关联分析法对其进行筛选。针对汽车销量时间序列表现出的线性特征和环境动态变化导致的非线性规律,单一的线性预测方法和非线性预测方法都无法满足时间序列的预测要求。提出了一种SARIMA-BP神经网络预测方法,利用SARIMA方法对时间序列的线性部分进行建模,利用BP神经网络方法对时间序列的非线性部分进行建模。仿真结果表明,SARIMA-BP神经网络方法比单一模型的预测准确率更高。

关键词:时间序列 灰色关联分析法 SARIMA-BP神经网络方法

中图分类号:F714 文献标识码:A 文章编号:2096-0298(2017)08(a)-170-03

随着经济供给侧改革力度的持续加大和宏观政策效应的不断释放,汽车销量逐年稳步增高。 如何根据市场需求来准确预测汽车销量成为当前中国汽车产业经济的研究热点。

当前应用于汽车销量的预测方法归纳起来主要有两类:(1)单模型预测,如BP神经网络、SARIMA方法、灰色模型等;(2)基于融合模型的预测,如神经网络和粒子群算法的融合、主成分分析和神经网络的融合等。张健[1]利用SARIMA模型提取了通货膨胀中的月度频率波动特征,有效降低了预测误差。针对GDP表现出的季节性波动,赵喜仓和周作杰应用SARIMA方法建立季节时间序列模型,提高了预测准确性[2]。SARIMA方法在样本数据特征提取、序列周期波动抑制、季节性干扰消除等方面得到了广泛应用[3]。但由于其本质为线性控制,不能较好的拟合数据中的非线性的特征。神经网络控制不依赖所建的模型精度,具有较强的自学习能力和任意非线性函数逼近能力,能较好的抑制环境干扰和非线性引起的误差。曾纳等人利用BP神经网络模型对草地生物量信息和分布格局进行模拟和空间估算,仿真结果与实测值拟合度较高[4]。皮进修等人提出了一种基于SARIMA-GMDH组合预测方法[5],应用该方法对我国CPI月度序列进行预测,结果表明对具备优势互补的两种单一模型进行有效组合,大大提高了预测的误差。

针对汽车销量数据中包含的线性特征和非线性特征,本文提出了一种基于SARIMA-BP神经网络的预测方法,利用BP神经网络自学习能力强的特征实现对非线性动态变化的自适应调控,通过神经网络的非线性函数逼近和收敛优势保证了预测的精度和稳定性。

1 汽车销量影响因素的选取

当前影响汽车销量的因素[6]归纳起来大体有以下几种:(1)社会因素,如人均可支配收入、道路基础设施建设;(2)国家政策,如购置税补贴、限购政策等;(3)价格因素,如燃油价格、汽车售价等;(4)技术因素,如汽车用料质量、制造工艺等。

灰色关联分析法[7]主要通过对系统特征序列进行数据分析,得出相关因素的曲线形状相似度,依据灰色关联度的大小判断因素的影响程度。针对汽车销量影响因素呈现出多样化且关联性较强的特点,应用灰色关联分析法对其进行筛选。

汽车销量序列为,影响因素的特征序列为,汽车销量与影响因素的灰色关联度计算步骤为:

SARIMA模型的构建与预测步骤为:(1) 通过季节差分变化将季节性时间序列转化为稳定序列,满足模型的平稳观测要求;(2)提取稳定序列的趋势特征,采用AIC或SBC方法来确定模型的阶数();(3)参数的估算(有效值、标准误差和统计值)和显著性检验(白噪声值);(4)序列未来值的预估。

2.2 BP神经网络模型

BP神经网络是一种基于神经单元的多层前馈网络,包含输入层、输出层和隐含层,其核心是逆向传播学习过程(输入信号的正向传播和输出信号的反向传播)。BP神经网络原理采用梯度下降法调整权值并更新网络,使误差函数满足迭代要求,完成对样本数据的训练和学习过程。结合汽车销量选取的6个汽车销量影响因素,建立的BP神经网络模型如图1所示。

BP神经网络模型中,定义各层神经元节点为节点数分别为、、,即输入层输入为,隐含层神经元输入为,输出为,输出层神经元输入为,输出为,其表达式分别为:

3 模型比较与结果分析

以2014年~2016年度的汽车月销量构成时间序列,共计36组实验样本。随机从样本数据中筛选出30组数据,分别使用SARIMA模型、BP神经网络模型对其进行模拟。表1给出了实验样本数据(单位:万辆),图2给出了各模型对采用数据的预测效果。

由图2可知,SARIMA模型和BP神经网络模型对样本数据的预测值整体高于样本实际值,SARIMA模型预测精度比BP神经网络模型高,这是由于SARIMA模型对带有季节性的时间序列具有较高的辨识能力。SARIMA-BP神经网络模型具备较高的样本数据拟合能力,SARIMA模型和BP神经网络模型对样本数据的预测效果总体低于SARIMA-BP神经网络模型。SARIMA模型、BP神经网络模型和SARIMA-BP神经网络模型的线性拟合度分别为0.9539、0.9527和0.9557,SARIMA-BP神经网络方法的预测误差最小。由表3可知,构建的预测方法的RMSE误差、MAPE误差和MAE误差均大幅度低于SARIMA方法和BP神经网络方法,证明所構建的SARIMA-BP神经网络方法的预测效果较好。

4 结语

在汽车销量预测中,由于汽车销量时间序列表现出的影响因素多样性、非线性和线性规律,本文通过灰色关联分析法提取关联度较高的销量影响因素,融合SARIMA模型和BP神经网络模型,提出一种SARIMA-BP神经网络预测方法,应用该方法对汽车销量时间序列数据进行建模及预测。试验结果表明,所建模型比单一模型的预测准确率更高,验证了所提出预测方法的可行性。

参考文献

[1] 张健.SARIMA模型在预测中国CPI中的应用[J].统计与决策,2011(05).

[2] 赵喜仓,周作杰.基于SARIMA模型的我国季度GDP时间序列分析与预测[J].统计与决策,2010(22).

[3] 姜春雷,张树清,张策,等.基于SARIMA-BP神经网络组合方法的MODIS叶面积指数时间序列建模与预测[J].光谱学与光谱分析,2017(01).

[4] 曾纳,任小丽,何洪林,等.基于神经网络的三江源区草地地上生物量估算[J].环境科学研究,2017(01).

[5] 皮进修,赵清俊,彭建文.基于SARIMA-GMDH的CPI组合预测模型[J].统计与决策,2016(17).

[6] 尹小平,王艳秀.中国汽车销量影响因素的实证分析[J].统计与决策,2011(08).

[7] 董少阳,夏清国,李宁.基于灰色关联分析法的软件缺陷类型预测[J].计算机工程与应用,2013(02).

[8] 杨峰,薛斌,刘剑. 基于非平稳时序ARIMA模型的W频段雨衰预测[J].电子与信息学报,2015(10).

①基金项目:浙江省教育厅一般科研项目(Y201635219)。

作者简介:范庆科(1991-),男,浙江江山人,助教,硕士,主要从事非线性控制方面的研究。

猜你喜欢

时间序列
基于分布式架构的时间序列局部相似检测算法
基于嵌入式向量和循环神经网络的用户行为预测方法
医学时间序列中混沌现象的初步研究
基于时间序列分析南京市二手房的定价模型
基于Eviews上证综合指数预测
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测