基于偏最小二乘回归的农产品种植评价研究
2019-10-16苗田恬刘思琦
苗田恬 刘思琦
摘 要:粮食是人类最基本的生活消费品,粮食问题是关系到国家国计民生的头等问题。本文通过分析影响粮食种植面积的指标,研究粮食最低收购价政策,以湖南省为例,建立关于水稻种植影响因素的数学模型。首先选取了农业劳动力人口、农民人均受教育程度、城乡收入差距、农民家庭负担、粮食的市场价格、粮食生产成本、粮食相对收益竞争力、农作物播种面积、受灾情况、我国粮食净出口量、城市化水平11个影响粮食种植面积的候选因素;然后,利用非参数Spearman相关检验法通过SAS软件对湖南省水稻的影响其种植面积的指标与其种植面积进行相关性检验,得到影响因素的指标体系;最后,以所选取的水稻种植面积相关的指标为自变量以水稻的种植面积为因变量运用偏最小二乘回归的方法建立模型。经检验,模型具有很好的拟合结果。本文研究对我国的粮食保护政策具有十分重要的作用和意义。
关键词:粮食;评价指标;偏最小二乘回归
众所周知,农业是国民经济发展的基础,粮食是基础的基础,因此粮食生产是关系到一个国家发展与生产的一个关键的主题。由于耕地减少、人口增加、水资源短缺、气候变化等问题日益凸显,加之国际粮食市场的冲击,我国粮食产业面临着潜在的风险。我国自2005年起开始对粮食主产区实行了最低收购价政策,粮食最低收购价政策,是为保护农民利益、保障粮食市场供应实施的粮食价格调控政策。最低收购价政策不仅可以促进农民种粮的积极性,稳定粮食生产,促进农民收入的提高还可以有效地抵御国际粮价的大幅上涨对我国粮食市场的冲击。但是,部分实行粮食最低收购价的地区,粮食品种种植面积、粮食总产量不增反降,导致部分学者质疑粮食最低收购价政策的效果。
一、评价指标选取
粮食的种植面积是决定粮食供给的关键因素,也是保障粮食安全的重要前提。衡量粮食最低收购价政策实施的效果,主要是比较政策实施前后粮食种植面积是否有显著性变化。可能影响粮食种植面积的因素有很多,根据国内外相关研究,本文选取了除粮食最低收购价政策外的11个可能对粮食种植面积有影响的因素。分别为农业劳动力人口、农民人均受教育程度、城鄉收入差距、农民家庭负担、粮食的市场价格、粮食生产成本、粮食相对收益竞争力、农作物播种面积、受灾情况、我国粮食净出口量、城市化水平。
由于影响粮食种植面积的因素比较多,它们之间的关系错综复杂,而且存在着粮食品种和区域差异。因此本文对粮食品种及其区域进行划分。
水稻种植区域化特征明显,不同区域品种和产量都差异较大。我国水稻种植主要集中在东北平原、长江流域和东南沿海三大区域,分别占全国水稻种植面积的12%、64%和22%。东北平原水稻种植区域一般全年只种一季水稻,生长周期长,水肥条件好,单产水平高出全国10%。长江流域种植面积最大,以籼稻为主,可以种植单季稻(中稻)或者双季稻(早晚稻),北部区域有少量粳稻,平均单产比全国高出4%;东南沿海种植的基本都是籼稻,可种植一到三季,由于生长周期较短,平均单产低于全国水平9%。
因此对水稻11个主产区根据其区域特征进行划分,结果如下:
我国自2005年起开始对粮食主产区实行了最低收购价政策,故选取1995年-2014年时间段内的数据,即实行政策前后共20年的数据进行研究。本文选取水稻为主要粮食,研究其在主产区影响其种植面积的农业劳动力人口、农民人均受教育程度等11个指标数据,以下数据为湖南省1995年-2014年时间段内影响水稻种植面积的12个因素的数据。
二、指标体系建立
水稻的11个主产省(区)被分为东北平原、长江流域和东南沿海三大区域。由于湖南省近几年的种植面积是最大的,约占长江流域地区水稻种植总面积的26%以上,故选取湖南省为代表省。本文主要选取长江流域地区的湖南省为研究对象,对其指标进行相关性检验后得到表3。
由以上斯皮尔曼检验的结果可以看出,湖南省农民受教育程度、家庭负担、受灾情况和城市化水平与水稻种植面积t检验的P值均大于显著性水平0.1,故它们之间没有关联。而水稻的市场价格、水稻的生产成本、水稻的相对收益竞争力和农作物播种面积与水稻种植面积t检验的P值均小于显著性水平0.1,故它们之间存在相关关系。且从rs的值可以看出,它们之间呈正向趋同关系。农业劳动力人口、城乡收入差距和水稻的净出口与水稻种植面积,故它们之间存在相关关系。且其rs的值为负,故它们之间呈负向趋同。
通过斯皮尔曼检验,本文剔除掉农民受教育程度、家庭负担、受灾情况和城市化水平四个无关联的指标。剩下的7个指标分别是农业劳动力人口、城乡收入差距、水稻的市场价格、水稻的生产成本、水稻的相对收益竞争力、农作物播种面积和水稻的净出口。
三、偏最小二乘回归模型
偏最小二乘回归法是一种新型的多元统计数据分析方法,它主要研究的是多自变量的回归建模,特别当各变量内部高度线性相关时,用偏最小二乘回归法更有效。另外,偏最小二乘法是集主成分分析、典型相关分析和多元线性回归分析3种分析方法的优点于一身。它与主成分分析法都试图提取出反映数据变异的最大信息,但主成分分析法只考虑一个自变量矩阵,而偏最小二乘法还有一个“响应”矩阵,因此具有预测功能。
运用偏最小二乘回归的方法通过R软件对湖南省水稻种植面积的指标与水稻种植面积的1995年-2014年时间段内的相关数据标准化后建立模型,令影响水稻种植面积的农业劳动力人口、农民人均受教育程度、城乡收入差距、农民家庭负担、水稻的市场价格、水稻生产成本、水稻相对收益竞争力、农作物播种面积、受灾情况、我国水稻净出口量、城市化水平11个指标数据分别为x1、x2、x3......x11。
首先,通过留一交叉验证法的结果及各主成分对因变量的贡献率,选取回归的主成分的个数。如下表所示:
其中CV即为不同主成分个数对应的PRESS,adjCV为调整后的PRESS,“variance explained”为主成分对各变量的累积贡献率。由结果可知,主成分个数为3个时,模型在经过留一交叉验证后求得的PRESS总和较小,随着主成分个数的增加,PRESS值也没有太大改变。且3个主成分对各因变量的累积贡献率达到了99%以上。因此选取回归的成分个数为3。进一步由R软件计算得出数据标准化后的回归系数,写出因变量对解释变量的回归方程。根据以上分析方法可得湖南省影响水稻种植面积的指标与水稻种植面积的偏最小二乘回归方程为:
其中,y2为湖南省水稻种植面积,以上方程为湖南省水稻种植面积与影响水稻种植面积的指标农业劳动力人口、城乡收入差距、水稻的市场价格、水稻的生产成本、水稻的相对收益竞争力、农作物播种面积和水稻净出口的回归方程。
最后运用R软件画出,湖南省份最终模型的拟合效果图,如下所示:
从上图可以看出,散点大致都分布在对角线上,说明最终模型的拟合效果较好。因此本文建立的模型可以用来描述水稻种植面积与影响水稻种植面积指标之间的关系是可靠的。
四、结论
粮食种植面积受多种因素的影响,并且粮食品种和粮食种植区域的不同对于粮食种植面积的影响因素也是不同的。因此,若想提高粮食种植面积扩大粮食产量,应该根据其粮食品种和地域的不同,找出对粮食种植面积具有显著性影响的因素,制定相应的政策措施。例如对于水稻来说,在其主产区湖南省与种植面积相关的因素有农业劳动力人口、农民受教育程度、家庭负担、水稻的市场价格、水稻的生产成本、水稻的相对收益竞争力、农作物播种面积和城市化水平,但是对其具有显著性影响为农业劳动人口及农作物播种面积,因此调控湖南省种植面积是注重调整这两个因素对种植面积的影响。国家和政府在以后制定关于粮食的相关政策时要对症下药,因地制宜。
参考文献:
[1]任军军,王文举.我国粮食最低收购价政策发展研究[J].湖北经济学院学报(人文社会科学版),2010,07(6):29-30.
[2]史常亮,金彦平.中国粮食供给与需求状况变迁:1978~2010[J].经济研究参考,2013(56):51-60.
[3]冷崇总.我国粮食价格波动问题研究[J].新疆农垦经济,2008(5):4-11.
[3]罗万纯,刘锐.中国粮食价格波动分析:基于ARCH类模型[J].中国农村经济,2010(4):30-37.
[4]罗锋,牛宝俊.我国粮食价格波动的主要影响因素与影响程度[J].华南农业大学学报(社会科学版),2010,09(2):51-58.