基于半参数回归的河南省城镇居民可支配收入影响因素实证分析
2021-11-17党鑫鑫周丽娟王康权
党鑫鑫 周丽娟 王康权
(广西科技大学 理学院,广西 柳州 545006)
一、引言
近年来,中国经济保持中高速发展,2018年全国GDP增长率达到了6.6%,河南省高出国家平均水平1个百分点,达到了7.6%。在中原崛起的背景下,河南省经济发展得到越来越多人的关心,在经济发展、工业化建设过程中,一些地区,如郑州、洛阳等得到非常优越的发展机会与条件,而一些经济水平相对较低的地区受到忽视,因此可能会导致省内各地区之间发展不平衡的现象,其中最为人们关注的是居民收入影响因素。因此,有必要对河南省城镇居民人均可支配收入的影响因素进行测度。本文实证分析了影响城镇居民人均可支配收入的主要因素,对河南省经济健康发展具有一定意义。
二、文献综述
(一)城镇居民人均可支配收入的文献综述
在已有的众多文献中,国内学者陈懋昕和邓霓冉[1]以苏州市城镇居民为例,搜集苏州市城镇常住居民人均可支配收入从1989年到2018年的时间序列数据,以苏州市城镇常住居民人均可支配收入为例,除了建立单个预测模型外,并与其他两个单一模型在MSE、SDE、MPAE三个指标上进行比较,选用组合预测模型作为苏州城镇常住居民人均可支配收入的预测工具,可以进一步推广到苏州以外城市的居民人均可支配收入的预测。肖枝洪和马泽巍等[2]针对1999—2018年中国31个省区市的城镇居民人均可支配收入,提出一种函数型数据聚类方法,聚类结果表明:中国城镇居民人均可支配收入呈不断增长的趋势。聂燕萍和张怿洵等[3]在互联网全面普及和迅猛发展的背景下,基于我国2013—2019年城镇居民人均可支配收入和天猫双十一销售额的数据,运用SPSS软件研究我国城镇居民人均可支配收入和天猫双十一销售额的关系,建立了二者之间的回归方程。结果表明城镇居民人均可支配收入和天猫双十一销售额具有显著的正相关关系。贺彦煜和王宇[4]以近17年来新疆居民消费为研究对象,通过多元线性回归模型的统计检验、经济意义检验和显著性检验,建立适合新疆城镇居民消费的模型,得出新疆居民消费现状和相关影响因素。
(二)半参数回归模型的文献综述
国内学者田玲和孙宁等[5]基于中国1990—2015年的地震损失数据,论证了当置信度不够高时,半参数分位数回归法的预测效果略好于单纯使用该方法选取节点并使用所选节点进行常规分位数回归法的预测效果。金林和刘洪[6]在介绍非参数回归方法的基础上,对1953—2010年中国财政收入增长速度和GDP名义增长率之间的关系进行了非参数回归。回归结果表明:GDP名义增长率取值在比较正常的范围(0%—20%)内时,财政收入增长速度和GDP名义增长率之间近似于线性关系;超出这个范围,二者之间的关系具有非线性关系。杨丽徙和张永锋等[7]为了融合参数模型和非参数模型的优点,对半参数回归模型在电力负荷预测中的应用进行了探究。在原始数据预处理的基础上,运用相关性分析理论确定了半参数模型中的参数与非参数变量,构建了半参数回归模型;利用两阶段最小二乘法和权重系数法对回归系数和回归参数进行了估计。结果表明:半参数回归分析法具有较高的负荷预测精度和较广泛的适用范围。
以往文献,很少有利用半参数回归模型探究影响城镇居民人均可支配收入因素的研究,本文首次将半参数模型运用于对城镇居民收入的研究,通过筛选对城镇居民人均可支配收入影响最大的因素,建立这些因素与城镇居民人均可支配收入的回归模型。
三、变量选取与模型构建
(一)数据来源
本文的相关数据来源于河南省统计局网站,相关缺失数据的处理方法为统计学中常用的均值填补方法。
(二)指标设计
本文中各个自变量的选择标准根据河南省城镇发展现状,以及笔者对相关文献[9]的总结、筛选得出。选取影响城镇居民人均可支配收入的指标为:河南地区生产总值、全社会固定资产投资总额、社会消费品零售总额、进出口总额、保险公司保费收入、产业结构、普通高等学校数、规模以上工业企业利润总额、发电量。被解释变量为河南省城镇居民人均可支配收入。
(三)变量因子的描述性统计
1.描述性统计
表1中x1表示河南地区生产总值,x2表示全社会总固定资产投资总额,x3表示社会消费品零售总额,x4表示进出口总额,x5保险公司保费收入,x6表示河南省产业结构,x7表示普通高等学校数,x8表示规模以上工业企业利润总额,x9表示发电量(详见表1)。
表1 各变量因子的描述性统计
2.LASSO算法变量选择过程分析
LASSO算法通过构造惩罚函数得到一个较为精炼的模型,并通过对变量赋予不同的权重值,体现各自变量对拟合目标影响程度的大小。根据模型赋予的自变量权重值的大小,可以实现变量选择功能。LASSO算法的优化目标函数可改写为:
其中t≥0为约束值,是回归系数的泛式惩罚。
以2个自变量的情况为例,设定系数为β1和β2,LASSO算法的优化目标函数可改写成:
从上式可以看出,优化目标函数为有关β1和β2的二元二次方程,在三维空间内为抛物面,惩罚函数为垂直于β1β2平面的无限长长方体。将图像平行于β1β2平面剖开,剖面图如图1所示。其中,横坐标为β1取值,纵坐标为β2取值。不加惩罚项时,目标函数取最小值的点。可以看出增加惩罚项后,最小值选取点落在了坐标轴上,此时β1取值为0,说明在建立的模型中,自变量维度从2维降至1维,完成了自变量选取。
图1 自变量为2时优化目标函数示意图
因此,当模型处在较高维度时,LASSO算法可以在高维空间内选取影响较大的自变量xij,并给出相应系数βj,同时,将对结果影响较小自变量压缩,甚至设为0,得到更为精炼准确的模型。
3.LASSO检验
利用R语言软件对各个变量因子进行LASSO降维,结果如表2。由结果可知,通过LASSO剔除了一个变量因子x4,即进出口额;通过观察影响程度表可知,影响程度最大的只有x6和x7,分别为产业结构和普通高等学校数,其他因子的影响程度很小,本文不再研究。
表2 影响程度表
各个指标的影响程度如图2所示,其中横坐标代表的是各个变量因子,纵坐标代表的是影响程度的相关系数,可以看出x6和x7的影响程度最为明显,其余变量因子的影响程度很小;因此,本文考虑对x6和x7建立半参数回归模型。
图2 各个变量影响程度图表
四、实证分析与讨论
半参数回归分析模型为:
Y=Xβ+g(T)+ε
为线性半参数回归模型。这里(X,T)为取值于Rp×[0,1]上的随机或非随机向量,β为I维未知参数向量,g为定义于[0,1]上的未知函数,ε是随机误差,E(ε)=0,E(ε2)=σ2,如果认为(X,T)随机,则需假定(X,T)与ε独立。模型任务是要以观测数据yi,Xi=(xi1,…,xip),Ti,i=1,…,n出发,估计未知函数g(Ti),未知参数β与σ2。模型的数据形式是:
Yi=Xiβ+g(Ti)+εi
其中 i=(1,2,…,n),yi是因变量;xi是参数部分自变量;Ti是非参数部分自变量;β是回归系数,即待求参数;g为定义于实数集上的未知函数;ε是随机误差,E(ε)=0,E(ε2)=δ2。xiβ反映了城镇居民人均可支配收入预测的部分规律,把握因变量y变化的趋势走向,为参数部分;g(Ti)+εi反映了城镇居民人均可支配收入的不确定因素的影响,为非参数部分。
用权函数法作出未知函数gn(Ti)的估计:
按照上述做法,参数部分与半参数部分的系数显著性如表3、表4;
表3 参数部分系数显著性
表4 非参部分系数显著性
其中输出R2为0.99,拟合效果很好,由上表结果也易看出,参数部分x7的P值为0.0001,通过显著性检验,经过平滑处理后的非参数部分x6也通过显著性检验,并且半参数回归模型的拟合程度较高,图3、图4分别为半参数回归与一般线性回归拟合曲线图。图中y代表1990年到2019年实际河南省城镇居民人均可支配收入,Y分别代表了半参数回归模型和一般线性回归模型预测的城镇居民人均可支配收入;由图可以看出半参数回归模型的拟合效果较好,几乎处处重合,但一般线性回归预测的模型一般,尤其是在第17年即2007年之后,真实值与预测值之间的差别越来越大,拟合效果越来越差。
图3 半参数回归拟合曲线
图4 一般线性回归拟合曲线
根据R语言软件绘制出半参数模型中产业结构因素的非参数效应如图5,x6所代表的河南省产业结构,由图可知,当第二、三产业的比重较小时,城镇居民人均可支配收入随着产业结构的增加变化不明显,当产业结构大于0.75、小于0.86时,收入随着产业结构的增大增加明显,产业结构大于0.86、小于0.89时,有减小趋势;大于0.89时,又有增加趋势。这也说明了当城镇居民人居可支配收入较小时,二、三产业的比重增加不会对居民收入产生显著性影响,当二、三产业的比重较小,即第一产业(农业)的比重相对较大时,城镇居民的人均可支配收入较小,所以提高二、三产业的比重对城镇居民人均可支配收入具有显著的促进作用。
图5 半参数模型中产业结构的非参数效应
五、结论与建议
(一)结论
本文对河南省1990—2019年城镇居民人均可支配收入的影响因素进行了分析,具体步骤为:首先通过LASSO降维筛选出对城镇居民人均可支配收入影响较大的因素,接着分别用普通最小二乘回归和半参数回归的实证结果对比分析了河南省城镇居民人均可支配收入与影响因素之间存在的关系,结果表明半参数回归模型的拟合效果良好。通过对全样本和子样本实证结果的分析,得出以下基本结论:
普通高等学校数显著正向影响河南省城镇居民人均可支配收入,说明普通高等学校数越多,人均受教育水平就越高,城镇居民的就业形势就越好,从而有利于人均可支配收入的提高。
产业结构对河南省城镇居民人均可支配收入也具有显著正向影响,由产业结构的非参数效应图也可以看出,随着二、三产业比重的不断增加,城镇居民人均可支配收入也是不断增加的,二、三产业比重的增加有助于城镇居民更好的就业,进而促进城镇居民人均可支配收入的增加。
(二)建议
通过对实证结果的分析与讨论,本文提出以下政策建议:首先,政府应不断提高河南省人均受教育水平,通过增加高等学校数量来提高学生的入学率,良好的教育水平有助于更好的就业。其次,政府应不断提高第二、三产业的比重,第二、三产业比重的增加有助于给城镇居民提供更多的就业机会,进而提高城镇居民的人均可支配收入。◆