APP下载

基于岭回归的四川省农村居民收入影响因素分析

2019-06-27

阿坝师范学院学报 2019年2期
关键词:共线性居民收入回归系数

王 艳

目前,我国已进入全面建成小康社会的决胜阶段。衡量小康社会的指标较多,其中城乡居民的收入水平是一个重要指标。在我国新确立的小康社会标准中,要求城镇居民人均年收入达到18000元,农村居民年均纯收入达到8000元。虽然目前我国大部分地区达到或超过了这一标准,但目前我国仍有8000多万贫困人口。小康社会是全体人民的小康,它覆盖的人群应该是全面的,不能出现有人掉队、落伍现象。全面建设小康社会的重点、难点在农村,增加农民收入是关键。改革开放以来,虽然农民的收入有了大幅提高,但与城市居民相比还有不小的差距。党和国家发动了总动员令,要在2020年之前使全部贫困人口脱贫,和全国人民一起携手迈入小康,夺取全面建成小康社会的伟大胜利。研究农村居民的收入,对总结小康社会建设的经验,坚决打赢脱贫攻坚战,加快农村发展,加速推进城乡一体化建设,早日实现全面建成小康社会的目标具有重要意义。关于农村居民收入问题,是个比较热门的研究课题,但大多着重在预测方面,预测方法主要有:自回归滑动平均模型[1],、移动指数平滑法[2]、灰色模型[3],神经网络[4]、卡尔曼滤波[5]、Logistic模型等[6],但对农民收入影响因素的研究还不多见。农村居民收入来源主要有三个途径:农业生产、进城务工、外出经商。农业生产收入与第一产业的增加值有关,进城务工收入与第二、三产业增加值有关,外出经商属于流通领域,与第三产业增加值有关。可见,农村居民的收入与三次产业发展之间存在密切的关系。因此,本课题主要研究三次产业的发展对农村居民收入的影响,即以第一、二、三次产业增加值为自变量,农村居民人均年收入为因变量,通过线性回归模型来分析自变量对因变量的影响。多元线性回归中,回归系数的估计方法主要有最小二乘法(OLS)、极大似然法,其中,最小二乘法运用最广泛,但当自变量数据存在高度相关性时,如果采用OLS估计回归参数可能会失真或不准确。由于一般情况下,三次产业的发展具有同向性,即同时随时间的增长而增长,因而,三次产业增加值数据序列之间具有相关性,也就是自变量存在多重共线性,此时,如果采用最小二乘法估计模型的参数,估计的参数就难以客观反映实际情况。岭回归是专用于解决数据序列共线性的有偏估计方法,是对最小二乘法的一种改进,对于相关性较高数据序列,估计的参数不仅稳定可靠,而且能真实反映客观实际。文献[7][8][9][10][11][12]成功利用岭回归解决了多元回归中的自变量数据共线性问题,为我们研究农民收入影响因素提供了借鉴。本文利用岭回归研究三次产业增加值对四川省农村居民收入的影响。

一、岭回归基本原理

岭回归是多元线性回归中用来解决自变量数据共线性的问题的一种回归参数估计方法,是OLS方法的改良和拓展,它属于一种有偏估计回归方法。以放弃OLS方法的无偏性估计为代价,以换取回归系数的稳定性和客观性,估计的回归系数能真实反映客观实际,能更准确描述解释变量与被解释变量的关系。

多元回归线性回归模型可表示为[7]:

Y=Xβ+ε

(1)

式中,Y为因变量;X为自变量;β为回归系数;ε为误差。

按照OLS估计回归系数,则β可表示为[9]:

β=(XTX)-1XTY

(2)

从式(2)知,如果自变量数据之间存在相关性,则矩阵XTX为奇异矩阵,从而引起矩阵(XTX)-1求解极不稳定,甚至不可逆。数据序列发生微小改变,就可能导致估计的参数发生巨大的变化,最综不仅严重影响到回归的结果,回归系数也可能严重失真或模型的解释性失效。

岭回归实质上就是给矩阵XTX加上一个很小值的对角阵,将奇异矩阵尽可能转化为非奇异矩阵,以便于矩阵XTX的求逆运算,使参数估计的受自变量变化的影响小,模型稳定性得以提高,并且,估计的参数能客观反映自变量与因变量的关系,使模型的解释意义增强。

岭回归求解回归系数β的具体方法为[10]:

β=(XTX+kI)-1XTY

(3)

式中,k称为岭回归参数,k<1,岭回归参数k选择十分关键,k取越大值,共线性对回归结果的影响越小,但回归的方差也随之增大,k取值过小,又不足以消除共线性对回归结果的影响。因此,k应既要能足够消除共线对参数估计的影响,又要使回归误差尽可能减小。k一般取岭轨迹变化趋于稳定时的最小的值。

二、四川省农村居民收入预测

表1为2000年-2017年四川省三次产业的增加值和农村居民收入统计数据(数据来自历年四川省国民经济和社会发展统计公报),从表1知,四川省三次产业增加值和农村居民收入都呈增长态势,本世纪初,第一产业绝对增幅为735.46671%,第二产业绝对增幅为1248.99575%,第三产业绝对增幅357.95552%,农村居民收入绝对增幅为538.48564%。三次产业中,第二产业增长速度最快,第三产业增长速度最慢,这反映了四川省目前还是农业大省,工业化进程有待加速,接近工业化中期,第三产业还有待发展。从数据分布情况看,第一、二、三产业增加值呈逐年增长态势,因此,它们可能存在相关性,也就是自变量存在多重共线。利用最小二乘法估计回归参数恐怕失真,运用岭回归求回归参数是最佳解决之道。

表1 四川省三次业增加值及农村居民收入统计数据

设四川省第一、二、三次产业增加值分别为X1、X2、X3,农村居民收入为Y, 令X=[X1,X2,X3],对X和Y进行线性回归,则:

Y=βX+ε

(4)

(一)最小二乘法回归

按最小二乘法求回归参数,可得到非标准化参数和标准化参数,非标准化参数含有常数项,标准化参数则不含,结果如表2所示。此时,相关系数R2=0.994,虽然有较高的拟合精度,但从表2知,X1的系数为负数,那么根据模型解释,四川省农村居民的收入与第一产业附加值成负相关,这显然不符合实际。四川是农业大省,农业生产是大部分四川农民的主要收入来源,按照常理,四川省农村居民人收入应该与第一产业增加值正相关。因此,证明了运用最小二乘法估计回归参数分析四川省农村居民收入与其相关因素的关系失效,这主要是由于自变量数据之间存在共线造成的。

表2 OLS回归系数

根据回归的非标准化参数,可得到四川省农村居民收入的回归方程如下:

Y1=954.817-0.266X1+0.237X2+0.514X3

(5)

进行共线性诊断。诊断自变量数据是否存在共线性,主要是考察膨胀系数VIF或容忍度(膨胀系数的倒数),考察膨胀系数VIF大于10或容忍度小于0.1,则说明自变量数据存在共线性,此外,还有其它指标作为佐证,比如特征值、条件指数、方差比例等,如果特征值大于10或等于0,条件指数大于30,方差比例大于0.5,则反映自变量数据存在共线性。

从表2的共线性统计资料可得知,3个自变量的膨胀系数VIF均大于10、容忍度均小于0.1,自变量数据存在共线性;再考察表3中的共线性诊断结果,3维、4维特征值接近于0;4维的条件指数大于30,3个自变量在不同维度都存在方差比例大于0.5的现象。这些都充分佐证了自变量数据存在严重的多重共线性。因此,若要客观分析自变量对因变量的影响关系,克服自变量数据共线性对模型的解释性影响,必须采用岭回归法估计回归系数。

表3 共线性诊断

(二)岭回归

按照岭回归方法,运用MATLAB软件编程,求回归系数的方法。迭代步长设定为0.01,迭代次数设定为500次,首先确定最佳岭参数k。经过计算机运算,我们得到岭回归迹线图,结果如图1所示。

图1 岭轨图

从图1可知,当岭回归参数k逐渐增大时,各自变量的回归系数渐渐趋于稳定,当k=0.91时,k继续增加,回归系数变化较小,因此,岭回归参数取最小值为0.91。此时,X1、X2、X3的标准化回归系数分别为a1=0.24090,a2=0.23270,a3=0.27511,相关系数R2=0.727205,显著性概率P=0.257640,大于0.05的显著性水平,表明模型是有效的,但相关系数有所下降,这主要是为了解决共线性问题,岭回归舍弃了无偏性估计,使拟合精度有所下降。岭回归参数k与相关系数R2与变化如图2所示。

表4 岭回归系数

岭回归参数如表4所示。

图2 相关系数与岭回归参数的关系

若要分析自变量与因变量关系,可以直接考察岭回归的标准化系数。自变量对应的标准化系数值,能客观反映其对因变量的影响程度。从表3中X1、X2、X3的标准回归系数可知,3个自变量的系数均为正,说明四川省第一、第二、第三产业增加值与农民人均年收入成正相关,这是符合实际情况的。又由于a3>a1>a2,因此,影响四川省农村居民收人的因素的重要程度从大到小排序依次是:第三产业增加值、第一产业增加值、第二产业增加值。说明新形势下,四川省农民收入结构发生了改变,从过去主要依赖农业生产开始向第三产业转变,如外出经商、从事农村第三产业,比如从事乡村旅游,发展观光农业和休闲农业,经营农产品等,由于农民文化水平不高,进行务工也主要是从事服务行业;农业生产和进城务工也是收入来源的重要途径之一。第二、第三个系数差距不大,表明四川省农民收入构成是多元化的,农民收入来源渠道广。这与四川省经济发展现状,以及农民生产、生活特点基本吻合,四川省正再大力发展现代服务业,特别是在农村,大力实施乡村振兴战略,发展农业产业,农业服务业,推动一二三产业融合发展。农业重心也发展了改变,从传统农业逐步转向现代农业、观光休闲农业,使农业生产效率不断提高,农民的收入稳步增加。坚持以工业强省战略,改造升级传统产业,积极发展现代新兴产业,工业发展势头强劲,用工量增加,吸引和转移了大批农村富裕劳动劳动力,农民通过务工增加收入。由于农民技能不高,进城务工从事服务业的较多,因此,虽然四川省第三产业绝对增幅最慢,但几个因素叠加使得它对农民收入的影响最大。

根据表3岭回归系数中非标准化系数,c=1280.9580,b1=0.73374,b2=0.15338,b3=0.18966,可最终得到四川省农村居民人均年收入的岭回归方程:

Y=1280.957995+0.733739X1+0.153380X2+0.189655X3

(6)

三、讨论

当前,我国正处在实现全面建成小康社会的冲刺阶段,要在既定的时间实现全面建成小康社会的目标,重点和难点在农村和农业,加快农村的发展,推进农业现代化,促进农民收入稳定较快增长,缩小城乡差距,是实现全面建成小康社会目标的关键。推进农村产业融合发展,促进农民收入持续快速增长,是实现全面小康最重要的途径之一。要实现农民收入增长,农民生活水平提高,农村早日迈入小康社会,应该着重从以下几个方面入手:(1)加强农田水利等基础设施建设。农村实行家庭联产责任承包制后,一些大型农业水利设施建设难以组织实施,已有灌溉设施也因无人管理,年久失修不能完全发挥功能,导致很多地区农业生产靠天吃饭,农业生产不稳定,要加大对农业的投入,创新投融资机制体制,开展农业基本设施建设,以改善农业生产条件,增强农业生产抵御自然灾害的能力,确保农业稳定丰收,农民致富。(2)加强农业人才队伍建设。目前,我国农业技术服务失位、缺位现象严重,人才断档,人员老化,导致农业生产技术落后,农民增收致富难,要加强先进农业生产技术的推广,提高农业技术服务水平,促进农民种植和养殖水平提高,确保粮食和农副产品高产稳产。以内涵式发展,推动农业高质量、高效发展,使农业成为有吸引力的产业,农民成为让人羡慕的职业。(3)加强农业现代化建设。农业的根本出路在于现代化。当前,我国农业机械化、自动化、现代化水平低,大部分地区农业生产经营仍以传统的农业方式。必须积极推进农业现代化,鼓励农业集约化经营,探索发展外向型农业,促进农业产业化、工业化,加快城镇化进程。规范土地的管理,实现高效化、机械化、规范化的生产,提高农业劳动生产率,提升农产品品质,提高农业生产效益。(4)加大对“三农”的扶持。“三农”事关国家发展全局,各方必须高度重视农村农业工作。工业要反哺农业,城市支持农村,发达地区要支持欠发达地区,夯实农业农村发展基础,要落实各项惠农政策,加大扶持农村发展力度,实现城乡基本公共服务均等化,加快发展农村基础设施建设,提高农民发展后劲。(5)加大财政资金对农村的倾斜。要继续实施对农业的补贴,逐步提高整体补贴力度,逐步上调种粮直补支出,要加大农业结构调整补贴力度,对农产品实行目标价格补贴制度,保持农资价格基本稳定,减小工农产品价格剪刀差,让农民种田有赚头,保护农民的农业生产积极性。(6)推进农村土地收益分配制度改革。要加快推进农村土地确权立法,维护好农民的土地承包经营权、宅基地使用权和集体收益分配权。增加农民财产性收入。(7)实施乡村振兴战略,延伸农业产业链条价值链,推进农村产业多元化融合发展,提升农业发展软实力,发展壮大集体经济,让农民就地就业,就地增收。(8)积极发展现代农业。以发展现代农业为依托,要加快新产业、新业态、新模式。形成农业产业、农业装备、农业科技、农产品质量和安全、农业市场和现代农业等主体。推进特色农业建设,加快农村第三产业发展,改造传统农业,积极发展假日农业、都市农业、旅游农业、观光农业、休闲农业、体验农业等现代农业生产模式。创建绿色、生态、高效农业新业态。(9)加快农村富裕劳动力转移。农村剩余劳动力转移对农村经济发展具有重要的意义。是农民增收致富的主要手段。要加强对农村富余劳动力的培训,提高农村劳动者素质和技能,提升农民就业能力,要积极引导农村劳动力有序、有组织转移,促进他们就近就业。要加强就业服务,因地制宜,吸收劳动力,使农村富余劳动力各尽其才。要扶持农民自主创业,引领劳动力由就业向创业转变。加快推进城镇化进程,促进农民向市民的顺利转化。

四、结语

要实现到本世纪中叶,把我国建设成具有中国特色的社会主义现代化强国的伟大目标,必须妥善解决好农业农村发展问题,大力推进农业农村现代化,彻底改变乡村落后面貌,稳步提高农民的收入,让农民过上富足幸福的生活。目前,农业是我国“四化同步”的短腿,农村是全面建成小康社会的短板。农业是支撑国民经济发展的基础,没有农业农村的高质量发展,国家经济就难以有高质量发展的良好局面。解决好“三农”问题,既是全面建成小康社的需要,也是事关国计民生的根本性问题。解决好“三农”的关键点是转变传统农业生产方式,加大对农业的投入,推进农业现代化,促进农业经济多元化,持续性增加农民的收入。要坚持工业反哺农业、城市支持农村、以及对农业多予少取的放活方针,不断加大强农惠农富农政策力度。要加快推进农民转移就业,增加工资性收入;要加快推进现代都市型农业建设,稳定家庭经营收入;要加快推进农村土地改革,赋予农民更多财产权利;要加大财政转移支付力度,提高农民保障水平。只有通过这样一系列的综合措施,才能使农民的收入稳步增加,加速农村小康社会建设,实现全面建设小康社会的宏伟目标。分析农村居民收入结构和影响因素,是制定三农政策的基础,对推进乡村振兴、促进我国农业农村现代化具有重要意义。在分析四川省农民收入与三次产业关系中,鉴于三次产业增加值数据存在相关性、共线性,传统的最小二乘法难以客观描述自变量与因变量的关系,岭回归很好地克服这一缺点,模型能较好解释自变量与因变量的关系。本课题运用岭回归分析了四川省农村居民收入与三次产业的内在关系,研究表明对四川省农村居民收入影响最大的是第三产业增加值,其次是第一产业增加值,最小的是第二产业增加值,后二个因素影响的差距不大,说明四川省农村居民收入来源存在多元性。

猜你喜欢

共线性居民收入回归系数
中国整体与区域居民收入周期的协同效应分析
新疆城镇化与农村居民收入实证分析
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
居民收入快速增长——“数说陕西70年”之居民收入
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
多元线性回归的估值漂移及其判定方法
2018年一季度居民收入和消费支出情况
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较