中国粮食产量影响因素的岭回归分析
2015-06-27梁雨薇倪萍王哲
梁雨薇 倪萍 王哲
云南大学发展研究院
中国粮食产量影响因素的岭回归分析
梁雨薇 倪萍 王哲
云南大学发展研究院
粮食对于一个国家的重要性,无论是在原始农耕时代还是在经济大发展的今天,始终是世界性的共识。我国人口众多,粮食问题更是关系国计民生的大问题。本文利用SPSS软件,通过岭回归的方法,对影响我国粮食生产水平的因素进行了实证分析,最后得出农业化肥施用量、粮食播种面积以及农业劳动力数量均对粮食总产量存在正向影响,而成灾面积对粮食总产量存在反向影响关系。
一、研究背景及意义
作为发展中国家,我国一直致力于促进经济的发展。然而,任何经济的发展,必须以农业的发展为基础。正所谓“大军未动,粮草先行”,粮食正是经济发展的保障,是农业的根本。
尽管改革开放以来,我国粮食总产量总体趋势是增长的,但这种增长并不稳定[1]。从市场经济的角度来看,影响粮食产量的是粮食的价格,尤其是粮食的收购价格;从生态学的角度来看,影响粮食产量的是包括气候、物种生存等等的环境因素,风调雨顺自然大丰收,而自然灾害频发只能导致大量减产。市场经济分析的方法,已有经济学家在为是否应当设定粮食收购的最低价及其影响进行研究。而环境因素是整个粮食生产的大环境,对粮食产量的影响是有目共睹、毋庸置疑的。同时,在对粮食产量所进行的研究中,灰色系统理论分析、最小二乘法、多元回归法都是常用的方法[2],而少有学者运用岭回归的方法来进行研究。本文尝试从中国统计年鉴查找有关粮食生产的数据,运用岭回归分析的方法找到影响粮食生产的主要因素以及影响方式,为中国粮食产量这个宏观问题给出另一种微观分析视角和尽量令人信服的解释。这也是本文研究意义所在。
二、模型的建立和变量的选择
对我国粮食产量问题进行的研究一直也是相关学者们的工作。王玉斌等人通过对1949-2004年和1978-2004年两个区间段内我国稻谷、小麦和玉米产量的波动进行分析后,选用了减税纯收益、成灾面积、劳动用工数量、物质投入情况等六个变量,运用最小二乘法进行了实证研究。2009年,吴英杰[3]通过建立柯布道格拉斯对数形式的生产函数,对1978-2005年的相关数据进行了回归分析。文章选用的指标包括劳动力数量、粮食作物播种面积、化肥用量、国家净支农支出,分析结果证实了她们对粮食产量的影响作用,并且化肥使用量的弹性系数最大。陈秧分和李先德[4]在2013年进行的研究中,建立了一个包含土地、劳动力、资本和宏观背景四个方面共11个指标的模型,对中国粮食产量变化进行了分析。模型中包含了耕地面积、受灾面积、农业劳动力、农业机械总动力等。综合相关研究,以及数据的可得性,本文选取了农业化肥施用量、粮食播种面积、农业机械总动力、农业劳动力以及成灾面积作为本文模型中的自变量。数据来源于1983-2012中国统计局官网的相关统计结果。
本文建立的模型如下:
Y=β0+β1X1+β2X2+β3X3+β4X4+β5X5+μ
在方程中,
Y代表粮食产量(单位:万吨);
X1代表农业化肥施用量(单位:万公斤);
X2粮食播种面积(单位:千公顷);
X3代表成灾面积(单位:公顷);
X4代表农业机械总动力(单位:万千瓦);
X5代表农业劳动力(单位:万人);
μ代表随即扰动项
μ指其他政策因素以及对因变量有影响的随机因素
三、统计分析及结果
应用SPSS软件对所收集的数据进行回归分析,结果如表一:
表一 5个因素对粮食产量影响的回归结果
查表可知,在0.05的置信水平下,F(5,24)=2.62,t0.025(24)=2.064,由以上结果可知,模型的整体拟合优度为0.987,并且F检验高度显著(F=359.416,P=0.000)说明模型对实际问题的拟合情况比较好。杜宾沃森值也比较接近于2,说明模型并不存在严重自相关问题。但是回归系数的显著性检验中,X4,X5的回归系数都无法通过,同时,X4和X5的回归系数为负值,显然与经济意义不符。说明用所有5个变量做回归并不是很好。
从VIF值可以看出,农业化肥施用量以及农业机械总动力这两个自变量的方差膨胀因子远远超过10,说明存在严重的共线性问题。另外,由方差比例表可以看到,第5行X1,X4,X5的方差比例值同时比较大,分别为0.59,0.54.0.52,第6行X2的方差比例值也较大,为0.91.也说明模型中这几个变量之间存在多重共线性。
以上5个自变量在实际问题中,肯定都对粮食产量有影响,因此不能简单剔除某些因素以消除或减少共线性问题。这里我们尝试使用岭回归的方法,其结果如表二至表四:
表二:5个因素岭回归分析R2与β系数和K值关系表
表三:5个因素的岭迹图
表四:5个因素岭回归分析R2和K值关系图
从岭迹图上可以看出,X4、的标准化岭回归系数比较稳定,并且绝对值很小,按照岭回归剔除变量的原则,可以予以剔除。而其他几个因素的标准化岭回归系数都是比较平滑地趋近于零,无法予以剔除。经过以上分析,模型中保留的自变量为X1,X2,X3,X5,再做岭回归,得岭迹图如表五和表六:
表五:4个因素岭回归分析R2与β系数和K值关系表
为了保证岭迹回归图上各回归系数的岭估计基本稳定,并且符号合理,取K=0.05,做岭回归估计,得结果如表七:此时,模型拟合优度为0.9794464,F=297.8330972,P=0.000高度显著。同时,岭回归的残差平方和为18294458,是原来的残差平方和11730433.58的1.56倍,相差不大。可以说,模型的拟合效果很好,各解释变量的经济含义也是符合的。
岭回归方程为:Y=-25204.16341+4.28843X1+0.52375X2-0.11790X3+0.03814X5
标准化岭回归方程为:Y=1.0 1 2 9 5 X1+0.3 5 2 11 X2-0.12237X3+0.02476X5
但是在回归系数的显著性检验中,在0.05的置信水平下,农业劳动力对粮食产量的影响不显著。这并不能说农业劳动力对粮食产量没有影响。出现这个统计分析结果,可能是由于农业机械化水平的提高导致的机械对劳动的替代,以及粮食品种的改良和种植技术的提高等因素造成的。
表六:4个因素的岭迹图
四、结论及建议
从以上岭回归结果可以看到,农业化肥施用量、粮食播种面积以及农业劳动力数量均对粮食总产量存在正向影响,也就是在一定条件下,可以通过提高农业化肥施用量、扩大粮食播种面积以及加大农业劳动力投入的方式来提高我国粮食产量。这需要我们做好农业化肥销售和定价工作,科学施肥,还需要在产业结构调整的同时,注意保障农业用地和农村劳动力的教育和扶持政策。另一方面,成灾面积对粮食总产量存在反向影响关系。这一点提醒我们要注重生态环境保护,减少二氧化碳和其他污染物的排放,尽量减少甚至避免认为因素引起的各种灾害,真正为粮食增产保驾护航。
表七:4个因素下岭回归结果
[1]王玉斌,蒋俊明,王晓志,陈慧萍.中国粮食产量波动影响因素实证分析[J].北京农学院学报,2007年10月.第22卷第4期 P38-41.
[2]高卫,张电学,雷利军,刘杰.中国粮食产量影响因素分析及研究方法综述[J].安徽农业科学,2014,42(33):11954-11955,11958
[3]吴英杰.中国粮食产量影响因素实证分析[J].经济研究导刊,2009年第7期:24-26.
[4]陈秧分,李先德.中国粮食产量变化的时空格局与影响因素[J].农业工程学报,2013年10月第29卷第20期:1-10.
梁雨薇.198708.女.汉.湖北红安.云南大学.管理科学与工程.项目管理方向.硕士研究生
倪萍.199011.女.汉.陕西咸阳.云南大学.管理科学与工程.项目管理方向.硕士研究生
王哲.199003.女.汉.山西晋城.云南大学.技术经济及管理.项目管理方向.硕士研究生