基于ARIMA 模型的欧拉黑猫新能源汽车销量预测
2022-05-08陈科秀
陈科秀,刘 娟
(广东财经大学统计与数学学院,广东 广州 510320)
引言
为了保护我们共同生存的家园和人类生存的长远发展,新能源和可再生能源的利用和开发成为当下世界的各国能源发展的必然趋势。近年来从环保、技术和能源安全等角度出发,全球汽车技术呈现出“低碳化、信息化、智能化”的发展趋势,全球范围内掀起了新能源汽车研发制造的浪潮。新能源汽车的发展能够有效缓解能源和环境压力,推动汽车产业转型升级,从而成为新的经济增长点。美国、日本等发达国家均将新能源汽车作为经济发展的战略制高点,并通过税收减免、财政补贴、政府采购等多种方式积极推动其发展[1]。
我国的《“十四五”工业绿色发展规划》指出,到2025 年,国内绿色环保产业产值计划达到11 万亿元,新能源、新材料、新能源汽车等产业将获重点扶持。最新数据显示我国新能源汽车成交量连续5 年位居全球第一,累计推广量超过了480 万辆,约占汽车总保有量的1.7%,这一汽车销售数量占全世界的新能源汽车销售数量的一半以上。不论是国家还是各级地方政府,都出台政策积极支撑我国新能源汽车行业的发展。目前,我国新能源汽车市场正处于成长期的早期阶段,根据中国汽车工业协会的数据调查,在过去的五年中,我国新能源汽车保有量年均增加180 万辆,市场新能源汽车销量在2020 年达到了136.7 万辆,表现出加快增长的趋势。欧拉黑猫作为一款新能源汽车,是长城汽车旗下作为一款专为年轻车主打造的品牌系列,整辆车采用极简可爱的设计元素,传达出干净利落的欧拉设计准则,致力于打造新能源汽车界的文艺小清新,受到广泛年轻消费者的青睐。2020 年12 月,欧拉黑猫新能源汽车销量达到10 010 辆,同比增长了334.7%,单月销量突破1 万辆,成为欧拉品牌销量贡献最大的单一产品。突出的销售业绩也使得欧拉黑猫再次夺得7~8 万元纯电力细分市场销售冠军,位居新能源行业第一阵营,彰显了“新力领军品牌”的先锋实力。研究产品的销售数据,能为管理和经营决策提供重要支撑,针对欧拉黑猫新能源汽车销量进行预测,能够反映该品牌发展的趋势,帮助汽车厂商和经销商快速、高效进行决策,有利于企业把握行业发展态势,从而制定合理的生产计划缓解潜在的未知风险[2]。
1 ARIMA 时间序列模型
1.1 时间序列模型的形式
时间序列是研究随时间变化的一列数据,在经典的时间序列模型中,数据通常是相关的,时间序列分析的目的之一就是利用这种序列相关性去帮助我们建立更好的模型。为了将非平稳时间序列转化为平稳时间序列,通过模型设定,模型识别和模型的检查及诊断来完成数据建模。常见的时间序列概率模型有以下这四种:自回归(AR)模型、移动平均(MA)模型、自回归移动平均(ARMA)模型以及差分自回归移动平均(ARIMA)。
1.2 时间序列模型的分析方法
1.2.1 考查观测值序列的特征
对于搜集到的时间序列数据,第一步骤是要验证序列的平稳性。如果序列为平稳性序列,通过了白噪声检验,那么需要进一步考察序列是否为纯随机序列。否则,需要对序列进行k 阶差分序列运算后再进行平稳性检验。
1.2.2 针对模型拟合识别
根据之前提到的4 种模型来确定拟合ARMA模型的具体阶数,在判断拟合模型具体形式的同时,需要模型数据序列的自相关系数和偏相关系数的取值特点来相应选择。
1.2.3 对建立模型进行白噪声检验
对于拟合模型所得到的残差序列,需要对其进行白噪声检验,以确定函数关系的正确性。如果结果显示残差序列为白噪声,则认为拟合后得到模型结果是合适的;如果不是,则可能是因为序列数据的信息量提取不足,导致序列无法呈现为正态分布,需要重新进行测试。
1.2.4 检验误差及模型预测
根据序列的观测数据确定模型,通过平均绝对百分误差来检验拟合模型的精确值,以及通过拟合模型对序列将来的发展进行预测[3]。
2 实证分析
本文基于在车主之家、搜狐汽车及汽车排名网等网站中,通过Python 软件爬取欧拉黑猫新能源汽车月度销量数据,共搜集了2019 年1 月至2021 年2 月连续26 个月的销量数据,并通过Excel 对数据进行预处理。将2019—2020 年共24 个月的数据作为样本建立ARIMA 模型,对2021 年1~2 月份的销量数据进行模型预测验证。
2.1 数据描述性统计
图1 为2019—2020 年欧拉黑猫新能源汽车月度销量数据折线图,表1 为选用数据对数序列的基本描述性统计。由图1 可知,欧拉黑猫新能源汽车月度销量时间序列曲线直观上有持续上升的趋势,存在时间趋势性,简单判断样本序列是非平稳的;将样本序列记为{xi},为避免潜在的异方差影响,对原始数据做对数变换,得到对数序列{yi}。从表1 数据可以看到,对数序列{yi}的均值和中位数大致相当,说明数据分布基本呈对称分布,没有左偏或者右偏的现象;极差为3.908,最大值和最小值相差比较大,对数序列标准差为0.837,总体波动比较稳定。为了更具有说服力,对序列{yi}进行单位根检验,由结果得到未经处理的序列没有通过ADF 单位根检验,因此验证了该序列的不平稳性。
图1 欧拉黑猫2019—2020 年月度销量折线图
表1 变量统计分析
2.2 平稳化处理
为了通过计算时间序列的一阶差分序列和二阶差分序列分别来进行ADF 平稳性检验,再观察差分序列图,如果二阶差分序列图围绕0 值上下波动,ADF 检验后通过。记二阶差分序列为{zi},来找到时间序列的对数序列的平稳阶数。
2.3 ARIMA(p,d,q)模型的建立
下面利用EViews 软件绘制二阶差分序列{zi}的ACF 和PACF 函数图,模型的滞后阶数为12 阶,P检验值都在0.5 以内,那么大概率就认为序列为非噪声序列。
当模型的自相关系数在1 阶时落在虚线以外,而其他阶数的自相关系数落在虚线以内,通过上面图2 中的二阶差分序列{zi}的自相关函数图。而自相关系数在1 阶后剧烈减少,因此判断自相关系数在1 阶截尾。
图2 自相关和偏相关函数图
类似的通过上面图2 中的数据展示模型的二阶差分序列{zi}的偏自相关函数图,偏自相关系数在1阶和5 阶时落在虚线以外,而自相关系数在7 阶后突然衰减为小值,因此我们可以判断出这一模型的截尾的偏相关系数是7 阶。综上,确定拟合模型为ARIMA(7,2,1)。
最后,综合上述的建模分析流程来进行最小二乘法的拟合,各参数P 值小于0.05,得到以下模型拟合程度为0.624,表明模型能较好地拟合数据。
当P 检验值不小于0.05,绘制拟合模型残差自相关检验和偏相关检验图,序列数据都在两倍方差以内即虚线以内,那么在显著水平0.05 以下可以接受原假设,认为该残差序列为白噪声序列。
2.4 模型的诊断
使用得到的逐步回归模型,对序列值进行拟合。基于平均绝对百分误差来衡量预测性能。
通过得到的逐步回归模型预测2021 年1 月份和2 月份的欧拉黑猫新能源汽车销量,计算与实际销量的平均绝对百分误差,取对数结果进行比较,结果如表2。
表2 ARIMA 模型预测及误差
3 模型评价
本文通过搜集2019 年1 月份至2021 年2 月份共26 个月的欧拉黑猫新能源汽车销量数据来建立ARIMA 模型。通过平稳性检验、自相关和偏自相关等检验确定模型为ARIMA(7,2,1)。通过模型预测2021 年1~2 月份的销量数据,与实际值进行比较,计算平均绝对百分误差为2.23%。因此,证明了本文建立的销量预测模型是有效果的,在短期内预测欧拉黑猫新能源汽车月度销量,能为相关部门的决策提供数据理论支持[4]。
4 结语
随着绿色发展理念的不断深入,新能源汽车已经成为汽车行业发展的重要方向,新能源汽车也被越来越被更多的人关注,欧拉黑猫新能源汽车作为一款专为年轻人打造的品牌系列,在市场上有着亮眼的销售成绩。本文通过搜集最新的欧拉黑猫新能源汽车销量数据来建立ARIMA 模型,利用EViews软件建立模型预测未来的销售。在面对竞争激烈的市场,汽车生产商和管理者需要通过借助大数据的优势,通过定量的分析相应数据,可为自己经营决策提供更多的数据理论支持[5]。
新能源汽车是我国战略性新兴产业,当前政府对新能源产业支持政策的逐渐完善,投入更多经费用于基础充电配套装置的建设,利用公众号、短视频、直播平台等各类的新媒体,加大对新能源汽车的营销宣传,将会有更多的消费者更加愿意购买新能源品牌的汽车。最后我们要打造自己的新能源车品牌,掌握自己的核心技术,提高国有品牌的市场占有率,在“碳达峰、碳中和”的背景下,消费者将会越来越认同新能源汽车,在我们生活中也会日益普及,未来我国新能源汽车市场的发展潜力巨大。