基于岭回归的合肥市社会消费品零售额影响因素分析
2019-04-04舒服华
舒服华
基于岭回归的合肥市社会消费品零售额影响因素分析
舒服华
(武汉理工大学 继续教育学院,湖北 武汉 430070)
运用岭回归原理和方法分析合肥市社会消费品零售额与农村居民收入、城镇居民收入、城镇化率、人口数量的关系。研究表明:对合肥市社会消费品零售额影响最大的是农村居民收入,最小的是城镇化率。这主要是因为农村居民收入增幅大于城镇居民收入增幅,农村消费基础薄弱,农民对社会消费品的刚性需求量大。城镇居民已有较好的消费基础,目前主要是以改善型、享受型消费为主,对社会消费品零售额影响没有农村居民大。
合肥市;社会消费品零售额;影响因素;岭回归
消费是生产的重要环节,既是生产的目的,也是生产的动力。我国社会主义现代化建设的根本目的就是满足人民群众日益增长的物质文化生活的需要,不断提高人民群众的物质文化生活水平。在现代社会消费不仅是满足人们生存所需的必要手段,更是人们提升生活品质的需要。消费是生产的推进器。一个新的消费热点的出现往往能带动一个产业的出现和成长。在当前我国经济新常态下,合理的消费是经济社会繁荣发展的催化剂,是保持国民经济高速和高质量发展的关键。国内社会消费品零售总额是判断一个国家和地区内需与消费能力和经济运行状况的一个重要指标。分析社会消费品零售额影响因素对制定宏观经济政策、保持市场供需平衡、维护经济平稳发展等具有重要意义。合肥地处长江三角洲城市群,是安徽的政治、经济、文化、交通中心。十二五以来,合肥主要经济指标继续保持两位数增长,位居全国省会城市前列,领跑长三角城市。人民收入稳步提高,消费能力增强,生活幸福。
吴龙(2017)研究了CPI、人口数量、价格指数等8个指标,运用主成分分析法对影响社会消费品零售总额因素进行分析。[1]任彩霞(2016)研究了货币供应量对社会消费品零售总额的影响。[2]丁伊丽(2015)分析了居民收入水平对社会消费品零售量的影响。[3]邹洋(2012)选择国内增值税和商品房屋销售面积为影响因素,对社会消费品零售总额的影响进行了研究。[4]高迪(2015)研究了储蓄存款、固定资产投资、国民总收入对社会消费品零售的影响。[5]郑小玲(2012)分析了人口数量、人均可支配收入对社会消费品零售的影响。[6]虽然他们都取得了一些成果,但选择的指标要么与社会消费品零售总额不紧,要么选择的指标太少或太多,难以客观揭示社会消费品零售总额运行的规律。故本研究选择城镇居民可支配收入、农村居民纯收入、城镇人口数量、城镇化率为影响因素,分析它们对合肥市社会消费品零售总额的影响。这些因素与之联系紧密,能准确反映合肥市社会消费品零售总额及其变化规律。由于一般情况下这4个因素的发展具有同向性,因而它们的数据大多存在多重共线性问题,如果运用最小二乘法(OLS)估计模型的参数,所得到的参数恐难以客观真实反映实际情况。岭回归是解决数据共线性这种病态特征的有效方法,是最小二乘法的改进,估计的参数能真正反映客观实际,在一些领域获得了成功应用。[7-10]
一、岭回归基本原理
岭回归是一种专用于共线性数据分析的有偏估计回归方法,是对最小二乘估计法的改良。它通过放弃最小二乘法的无偏性优势,以损失部分信息、降低拟合精度为代价,换来回归系数的稳定性,回归系数更符合客观实际,更为有效可靠,对病态数据的拟合要优于最小二乘法。
多元回归线性回归模型可表示为:
式中,为因变量,为自变量,为回归系数,为误差。
回归系数按照最小二乘法的估计为:
若自变量存在多重共线,则矩阵XX为奇异矩阵,特征值很小,从而引起矩阵(XX)-1对角线上的元素很大,造成参数估计极不稳定,如果数据发生微小变化就可能导致参数估计发生很大的变化,并且,回归系数往往不能客观反映自变量对因变量的影响,对预测结果有时也会产生较大的影响。
岭回归就是给矩阵XX加上一个对角阵,使矩阵的特征值变大,将奇异矩阵尽可能转化为非奇异矩阵,提高参数估计的稳定性,得到的参数更能真实反映客观实际。岭回归求解回归系数方法为:
式中,为岭回归参数,∈[0,1],越大,共线性对回归参数稳定性的影响越小,=0,则变为最小二乘法估计,此时为无偏估计,≠0,则为有偏估计,随着的增大,预测的方差也随之增大。因此,应既能足够消除共线对参数估计影响又尽可能要小,即一般在岭轨迹变化趋于稳定时,尽可能选取较小的值。
二、合肥市社会消费品零售额影响因素分析
影响地区社会消费品零售额因素较多。有政治因素,如社会保障体系、收入分配制度等。有经济因素,如居民收入、物价、利率等。有社会因素,如生活习惯、健康状况、对未来信心等。有些因素可以量化,有些因素不可以量化。如果从可操作、可量化角度出发,对社会消费品零售额影响比较密切的因素主要有居民收入和人口数量。居民收入越高,消费意愿越强,必然会推动社会消费品零售额增长。人口数量对社会消费品零售额有一定的影响。在其他条件不变的情况下,人口数量多,对商品的需求量就多,势必带动社会消费品零售额随之增加。城镇居民和农村居民现阶段仍有较大收入差距。城镇居民收入高,消费理念新,消费力强,而农村居民收入相对较低,消费观念落后,消费力弱,这又与城镇化率有关。因此,城镇化率对社会消费品零售额会间接产生影响。本研究分析城镇居民收入、农村居民收入、城镇化率、人口数量对合肥市社会消费品零售总额的影响。
从2007-2017年合肥市社会消费品零售额从469亿元增加到2728.51亿元,增幅达481.7292%,年平均增长48.1729%,为合肥市的经济可持续发展发挥了重要作用。
表1为合肥市2007-2017年常住人口数量、城镇化率、城镇居民可支配收入、农村居民纯收入统计数据。11年间,合肥市常住人口增加了62.1539%,城镇化率提高了22.5083%,城镇居民可支配收入增加了180.8033%,农村居民纯收入增加了417.4449%,农村居民纯收入增加最多,城镇化率提高最小。
表1 合肥市国民经济和社会发展主要指标统计数据
设合肥市常住人口数量、城镇化率、农村居民纯收入、城镇居民可支配收入分别为1、2、3、4,社会消费品零售额为,令=[1,2,3,4],对和进行线性回归,则:
=(4)
式中,为回归系数。
(一)最小二乘法回归
以表1中的数据为样本,运用最小二乘法估计回归系数,利用SPSS工具,对、进行线性回归,求得回归参数,结果如表2所示,模型的相关系数2=09888,统计量=206.2263,sigF3.43e-7,小于0.05显著水平,表明模型有效。从表2知,1、2的系数为负数,以此推断,合肥市社会消费品零售额与人口数量和城镇化率成负相关。这显然不符合实际。一般来说,人口数量越多,消耗的物质越多,城镇化率越高,高消费人群比例越高,社会消费品零售额会应该随之增大,人口数量和城镇化率与社会消费品零售额按理应成正相关。这表明运用最小二乘法估计回归参数解释因变量与自变量的关系不合适。
表2 回归系数
表3 共线性诊断
共线性诊断。共线性判断有以下几个方面:(1)自变量的容忍度小于0.1;(2)膨胀系数VIF大于10;(3)特征值接近0或大于10;(4)条件指数大于30;(5)方差比例大于0.5。上述条件存在至少一个,则说明存在多重共线性。从表2的共线性统计资料可知,自变量的容忍度均小于0.1,膨胀系数VIF均大于10,说明存在多重共线性。再看表3中的共线性诊断结果,4维、5维特征值接近于0;4至5维的条件指数大于30,自变量1、3、4在不同维度下的方差比例存在大于0.5的现象。以上5条都满足,证明自变量数据之间存在严重的多重共线性。因此,要准确分析自变量对因变量的影响关系,必须采用岭回归法加以解决。
(二)岭回归
运用岭回归算法估计回归系数。设定迭代步长取0.01,以确定最佳岭参数。运用MATLAB软件编程,通过运算得到岭回归迹线图,结果如图1所示。
图1 岭轨图
从图1可知,当逐渐增大时,各自变量系数趋于稳定,迭代寻优结果为=0.82,即最佳岭回归参数为=0.82。模型的相关系数2=0.77582,模型的统计量为12.6889,sigF0.0004,小于0.05显著水平,模型通过了显著性检验,说明模型是有效的。岭回归参数如表4所示,从表4可知, 4个自变量的标准回归系数分别为1=0.13964,2=0.22751,3=0.23078,4=0.22470,但相关系数有较大的下降,说明为了解决共线性,岭回归丢失了一些信息,预测精度有所下降。相关系数与岭回归参数的变化如图2所示。
图2 相关系数与岭回归参数的关系
表4 岭回归参数
岭回归估计的标准化系数值能客观反映各自变量对因变量的影响程度。在4个标准回归系数中,由于3>2>4>1,因此,影响合肥市社会消费品零售额4个因素的重要性从大到小排序依次是:农村居民收入、人口数量、城镇居民收入、城镇化率。农村居民收入影响最大,城镇化率影响最小。这与合肥市经济社会发展状况基本吻合。合肥市统筹城乡一体化发展,实施乡村振兴战略,有效提升了农业发展的质量,不仅改变了农村落后的面貌,而且使农民收入得到了大幅提高,增速超过城镇居民。富裕起来的农民迫切希望改变现有生活现状,消费观念也发生了改变,加之农村消费基础薄弱,对一般消费品的需求量增幅较大,因此,对合肥市社会消费品零售额推动最大。合肥市常住人口增长较快,11年间几乎翻番。人口的剧增和城镇化率的提升双重因素叠加作用使得消费品需求量增加迅猛。因此,对合肥市社会消费品零售额影响处于次席。虽然合肥市城镇居民收入高,但整体有了一定的消费基础,主要是个性化消费、享受型消费、消费换代升级,对社会消费品零售额的推动稍逊一筹。合肥市城镇化率提高最慢,所以对社会消费品零售额影响最小。
值得注意的是对社会消费品零售额影响是一个相对概念,是指相对过去而言的拉动作用,并不是指对社会消费品零售绝对贡献率。从社会消费品零售额绝对数据来说,城镇居民消费数额还是要大于农村居民的,城镇居民对社会消费品零售额的贡献毫无疑问比农村居民大。
根据表4岭回归参数,于是得到最终岭回归方程为:
=-2631.526+0.836791+39.03932+0.034643+0.020084(5)
考察岭回归拟合效果,根据方程(5)得到合肥市社会消费品零售总额拟合值和曲线,如表5和图3所示。平均预测误差5.3034%,虽然相关系数有所下降,但还是有一定的拟合精度。
表5 预测结果及误差
图3 预测曲线及比较
三、结语
当前,国际经济发生了深刻的变化。单边主义、贸易保护主义日益抬头,贸易霸权主义日益猖獗,贸易摩擦不断升级,对我国过去出口型导向经济带来严峻挑战。在新的国际经济形势下,中国经济必须转变经济发展方式,从过去主要依赖投资、出口刺激经济增长转向主要依靠扩大内需方向上来,实现新旧动能转换,把发展的立足点放到消费上来,积极发展消费经济,让消费成为中国经济增长新的引擎。发展消费经济关键在于配套政策措施的实施。第一,要确保居民收入随经济发展稳步增长,尽快使老百姓的钱袋子鼓起来。这样,民众才有消费的底气。第二,要建立和健全完善的社会保障体系,扩大保障覆盖面,提高保障水平,消除老百姓的后顾之忧,让他们敢于花钱,乐于花钱。第三,要认真研究老百姓的消费心理,提供适销对路的产品和服务,不断提高产品和服务质量,满足他们的需求,让他们信赖国货,爱上国货。第四,要畅通流通渠道,优化商业网点,积极搭建电商平台,方便百姓购物,吸引百姓购物。我国人口众多,消费潜力巨大。只要政策措施得当,必将带动消费蓬勃发展,换代升级,使消费成为我国经济腾飞的助推器,不断推动我国经济持久发展。研究地区社会商品零售额影响因素,能以此为参考,制定相应的政治、经济政策和措施,促进消费,为区域经济的可持续发展注入强劲的动力。
在多元线性回归中,回归系数是通过最小二乘法进行估计的,但如果变量数据之间存在多重共线性,运用最小二乘法估计的参数就难以真实反映客观实际。岭回归可以克服这一缺点,能有效解决变量数据多重共线性问题,使得到的参数更加稳定,更能够客观描述自变量与因变量的关系。本课题研究了合肥市社会消费品零售额与城镇居民收入、农村居民收入、城镇化率、人口数量之间的关系。研究表明,对合肥市社会消费品零售额影响最大的是农村居民收入,最小的是城镇化率。这主要是农村居民收入增幅高于城镇居民收入增幅,加上农村消费底子薄,城镇已有一定的消费基础,因此,合肥市农村居民收入对社会消费品零售额的影响要大。人口数量的增加,无论对基本物质还是特殊物质都要大量消耗,对社会消费品零售额影响也很显著。城镇居民收入虽高,主要属于改善型、享受型消费,对社会消费品零售额的影响略低。城镇化率使低收入群体转化为高收入群体,消费能力也随之增强,对社会消费品零售额的影响也不可小视。后三个因素差距不大,说明它们对合肥市社会消费品零售额的影响都很重要。
[1]吴龙.社会消费品零售总额影响因素的主成分回归分析[J].发展改革理论与实践,2017(10):49-51.
[2]任彩霞.货币供应量对社会消费品零售总额的影响分析[J].现代经济信息,2016(11):143-144.
[3]丁伊丽.我国居民收入水平对社会消费品零售量的影响分析[J].云南农业大学学报,2015(2):48-51.
[4]邹洋.社会消费品零售总额的影响因素简析[J].商场现代化,2016(7):18-19.
[5]高迪,余良昊,赵迪.社会消费品零售总额的影响因素分析[J].中外企业家,2015(10):64-65.
[6]郑小玲.人口相关因素对社会消费品零售总额影响的实证分析[J].统计与管理,2012(4):108-109.
[6]刘红勇,胡健,王鹏,等.基于岭回归法的四川省房地产价格影响因素研究[J].数学的实践与认识,2014(12):72-78.
[7]董力,刘艳玲.岭回归在我国工程保险需求影响因素分析中的应用[J].西安电子科技大学学报,2013(3):34-41.
[8]孔朝莉,李国徽,黄美婷,等.基于岭回归的海南人均GDP与三大产业关系研究[J].科技和产业,2016(6):42-46.
[9]朱述知.基于岭回归的我国农村居民消费实证研究[J].乐山师范学院学报,2014(6):87-91.
[10]杨秀丽,权晓超.基于岭回归的黑龙江省农村居民收入影响因素分析[J].统计与咨询,2015(4):24-26.
Analysis of the Factors Influencing the Retail Sales of Social Consumer Goods in Hefei based on Ridge Regression
SHU Fu-hua
In this paper, ridge regression method is used to analyze the relationship between retail sales of social consumer goods in Hefei and its rural residents’ income, urban resident’s income, urbanization rate and population. The results show that rural resident’s income has the largest influence on the retail sales of consumer goods in Hefei, while urbanization rate has the smallest influence. The main reasons are as follows: the increase of rural residents' income is greater than that of urban residents' income, the rural consumption base is weak, and the rigid demand of farmers for social consumer goods is large; while the urban residents have already had a good consumption base, and at present, their consumption mainly focus on goods that can help improve and enjoy their lives, so the influence of urban resident’s income on the retail sales of consumer goods is relatively small compared to the influence of rural residents’ income.
Hefei City; retail sales of social consumer goods; influencing factors; ridge regression
2018-09-19
湖北省自然科学基金项目(2017CFB177)
舒服华(1964- ),男,湖北武汉人,武汉理工大学继续教育学院教授,硕士生导师,博士,主要从事系统工程研究。
10.13685/j.cnki.abc. 000380
2019-01-17 17:03:29
F727
A
1671-9255(2019)01-0001-05