岭回归和主成分回归下的芜湖市社会消费品零售总额实证研究
2020-09-28尤游刘苏兵
尤游,刘苏兵
(安徽机电职业技术学院 公共基础教学部,安徽 芜湖 241000)
在各类与消费有关的统计数据中,社会消费品零售总额是表现国内消费需求最直接的数据。作为社会消费需求系统中反映消费需求的一个重要指标,一个城市的社会消费品零售总额直接反映了该地区的经济发展状况和景气程度[1]。芜湖市作为安徽省第二大城市,在政治、经济、文化等方面都占有重要的地位。长三角一体化上升为国家战略之后,芜湖作为长三角城市群的一颗新星,也迎来了全新的发展和机遇。因此,研究芜湖市社会消费品零售总额,分析其主要影响因素和增长幅度,对芜湖市经济发展战略的实施具有重要的借鉴价值,从政府层面也为刺激城乡居民消费、促进区域经济发展提供一定的政策依据。
1 变量的选取和分析
近几年不少专家学者对社会消费品零售总额的影响因素进行了深入的探讨。其中,大多数主要从宏观角度分析问题,并未结合地区特点量化分析,或进行回归分析建立模型时,所采用的普通最小二乘法往往因为数据的病态特征不能反映实际情况。舒服华和王艳分别针对合肥市和江苏省的社会消费品零售额展开岭回归模型讨论,并给出针对性的建议[2-3]。本文在此基础上针对芜湖市的消费情况展开研究,刻画其社会消费品零售额运行规律,以促进城乡经济的高质量发展。
首先,结合芜湖市2008-2018年的政府统计公报和统计年鉴,选取如下指标影响因素:
(1)城镇、农村常住居民人均可支配收入。在经济理论中,消费是随着收入水平的变化而变化的,随着收入的增加,居民的购买力会得到提高,进而人们的消费意愿会更加活跃。
(2)年末总人口。城市居民人口越多,消费支出也越多,消费需求更大,因此社会消费品零售总额与人口数应成正相关的关系。
(3)城镇化率。城镇化发展有利于扩大内需,提高生产效率,增强城市经济的辐射带动作用。芜湖市近年来不断推进区县规划,使得城镇化率不断提升,同时也拉动了周边地区的消费水平。
(4)居民消费价格指数(CPI)。它是度量居民生活消费品和服务价格水平随着时间变动的相对数,是反映居民家庭购买消费品和服务项目价格水平变动情况的宏观经济指标[4]。
(5)地区生产总值。国内生产总值是反映一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为是衡量国家经济状况的最佳指标[5],是国民经济的核心部分,所以它的增幅程度也直接影响了社会消费品零售总额的变化。
以上6个影响因素一般具有同向性,因此建立模型前需要考虑变量间的多重共线性。我们首先运用普通最小二乘法来估计模型参数,然后在考虑多重共线性的情况下,对经典回归分析进行修正,分别建立岭回归模型和主成分回归模型,同时将两种方法的预测结果进行类比分析,通过相对误差来比较两种修正模型的优劣性。
2 相关理论介绍
2.1 多重共线性诊断
在进行回归分析时,若变量间存在多重共线性,往往会出现回归系数估计方差增大,估计参数通过不了显著性检验,参数估计值的正负号往往和实际不符等现象,使得模型不再具有稳定性,所以需要在建立模型之前对变量间的多重共线性进行诊断。
解决解释变量的多重共线性最常用的方法是主成分回归、岭回归和偏最小二乘法。这里主要研究岭回归和主成分回归的改进过程。下面重点介绍岭回归的理论步骤。
2.2 岭回归
设多元线性模型Y=Xβ+ε,其中X为设计矩阵,当(X'X)-1存在时,β的最小二乘估计为:
(1)
针对多重共线性问题,1962年,霍尔(A.E.Hoerl)首先提出改进最小二乘估计的方法,称为岭估计。1970年,霍尔与肯纳德(Kennard)合作,又进一步对岭估计做了系统的发展[7]。岭估计是对最小二乘估计方法进行修正的一种有偏估计,通过岭参数k的不同取值获得回归参数的估计值,当k=0时就是普通最小二乘估计。
岭估计损失部分信息,并降低精度,放弃了最小二乘法的无偏性,以此为代价得到更加稳定的估计结果,具有更小的均方误差,它对病态数据的拟合要优于最小二乘法,专用于共线性数据分析[8]。当变量存在多重共线性,即数学描述为|X'X|≈0,那么我们在原本的相关矩阵X'X基础上加上一个正常数矩阵kI(k>0),使得X'X+kI接近奇异的程度将会大大降低,即X'X+kI=0的可能性比X'X=0的可能性小很多,从而使岭估计具有更小的均方误差,设岭估计为:
(2)
3 芜湖市社会消费品零售额影响因素分析
2018年芜湖市零售总额首次突破千亿,芜湖市成为安徽省第二个跨过千亿关口的城市。表1选取了2008-2018年的社会消费品零售总额、城镇常住居民人均可支配收入、农村常住居民人均可支配收入、年末总人口、城镇化率、居民消费价格指数和地区生产总值统计数据。近11年间,社会消费品零售总额从2008年的203.2亿元上升到2018年的1028.26亿元,增幅达到406.03%,地区生产总值从2008年的914.97亿元上升到2018年的3278.53亿元,增幅达到258.32%,芜湖市作为安徽省第二大城市,为安徽省的经济腾飞和发展贡献了重要力量。
表1 芜湖市社会消费品零售总额统计指标数据
设城镇常住居民人均可支配收入、农村常住居民人均可支配收入、年末总人口、城镇化率、居民消费价格指数和地区生产总值分别为x1,x2,x3,x4,x5,x6,社会消费品零售总额为y,下面进行回归分析。
3.1 最小二乘法回归和多重共线性诊断
以表1数据为样本,利用R软件做最小二乘回归,得到显著性检验结果,相关系数为R2=0.9981,F值为891.4,P值为3.34×10-6,回归方程为:
y=-31.7957+0.02554x1+0.0172x2+0.03426x3-2.21x4-1.2665x5-0.0037x6
(3)
这里社会消费品零售总额与城镇化率、居民消费价格指数和地区生产总值都成负相关,显然不符合事实,且x3,x5,x6的t检验统计量所对应的P值较大,说明变量x3,x5,x6的系数检验的显著性水平不理想,综合考虑解释变量可能存在多重共线性,因为变量间的多重共线性会使回归系数的估计方差增大,以致模型不再具有稳定性。
下面对样本数据进行多重共线性诊断,这里采用特征根判定法,通过程序运行得条件数K=3684.187>1000,说明变量之间存在严重的多重共线性。进一步通过比较相关矩阵X'X的特征值和相应的特征向量为:
λmin=0.00112
φ=(0.6225,0.088,0.0699,0.0299,0.0191,-0.7737)
图1 岭迹图
下面分别采用岭回归和主成分回归这两种方法对经典回归分析进行修正。
3.2 岭回归
首先,我们利用R软件对样本数据进行岭回归分析,由于各指标数据的量纲不同,所以先对数据进行标准化。设置岭参数k的取值范围为0~1,间隔为0.05,共记录21个岭参数取值做岭迹图。结果如下:
由图1可知,随着k的逐渐增加,各个指标变量系数趋于稳定。通过综合比较,得到最佳岭回归系数k=0.5,对应的岭估
计为:
所以样本数据标准化后的岭回归方程为:
(4)
为了方便计算和类比分析,我们代入未标准化方程:
(5)
化简得未标准化的岭回归方程为:
y=0.01183x1+0.01763x2+0.2023x3+0.1461x4+0.4215x5+0.104x6-283.7
(6)
3.3 主成分回归
主成分分析是通过降维技术,在不损失太多信息的情况下利用正交旋转变换把多个指标重新组合,得出少数几个综合指标,称为主成分。各个主成分之间互不相关,并保留了原始变量的大部分信息,所以主成分回归就很好地消除了多重共线性带来的影响[9]。
通过计算相关矩阵的顺序特征值和对应的特征向量,可知自变量的主成分相互独立,克服了多重共线性,然后根据累积贡献率选择保留了原始信息的主成分。进一步对主成分进行回归分析,为了对应于原变量,可以还原成原始数据对应的回归方程。
首先主成分分析得到的累计贡献率见表2:
表2 主成分的累计贡献率
这里前三个主成分累积贡献率已达到98%,所以另外三个可以舍去,达到降维的目的。设前三个主成分依次为Z1,Z2,Z3,则
Z1=0.48x1+0.475x2+0.393x3+0.29x4-0.272x5+0.48x6
(7)
Z2=-0.14x1-0.118x2-0.396x3+0.633x4-0.621x5-0.153x6
(8)
Z3=-0.183x1-0.225x2+0.545x3-0.416x4-0.65x5-0.156x6
(9)
进一步回归分析得到相关系数R2为0.9885,F统计量值为288.7,P值为1.071×10-7,且主成分的t检验统计量P值均小于0.01,说明回归系数和回归方程均通过检验,模型拟合效果较好,得到主成分回归方程如下:
y=579.713+128.223Z1-41.422Z2-46.475Z3
(10)
还原为原始数据的主成分回归方程为:
y=0.0093x1+0.0128x2+1.1075x3+2.4349x4-4.5761x5+0.0911x6-48.99
(11)
为了比较岭回归和主成分回归的拟合效果,通过计算其相对误差如下表3,得到岭回归的平均相对误差为2.52%,主成分回归的平均相对误差为9.94%,岭回归预测效果更好。
表3 两种方法的预测结果及相对误差
续表
4 结语
近年来,芜湖市认真贯彻执行调结构、促发展、稳增长政策,积极落实扩大内需、促进消费的各项措施,全市消费品市场运行稳中有进,继续保持平稳较快发展态势。通过回归模型的建立和分析,我们能看出农村居民的消费影响力正在逐年提升,其购买力随着城市交通和网络购物的发展,已经成为影响社会消费品零售总额的第一大要素。同时,进一步研究芜湖市发布的统计公报也能看出一些潜在问题,如超市等传统消费市场销售形势不佳,住宿业面临较大下行压力,出口走势低迷等[10]。针对这些问题,结合上文对芜湖市社会消费品零售总额的实证研究结果,笔者提出如下建议:(1)增加城乡居民可支配收入。政府应大力促进劳动力市场的自由流动,扩大就业面,深化收入分配制度改革,缩小城乡收入差距,均衡城乡和区域发展。(2)健全社会保障体系,扩大社保覆盖范围。政府应为居民提供便捷有效的社会福利,使得绝大部分居民病有所医、居有所住、老有所养,消除居民的后顾之忧,降低储蓄意愿,从而释放出巨大消费潜力,以便增长现时消费,增加内需。(3)促进实体经济与虚拟经济均衡发展。在如今网络电商高速发展的背景下,实体经济应打破传统局限,树立协调发展意识,推进线上线下融合。同时要完善市场体系和制度建设,坚持对两种经济一视同仁、统筹兼顾。