APP下载

兰州市农村居民人均可支配收入的典型相关分析

2021-08-04

湖北农业科学 2021年13期
关键词:因变量兰州市支配

魏 赟

(兰州城市学院电子与信息工程学院,兰州 730070)

农村居民人均可支配收入与农业生产的生产资料投入以及产出两大类变量有着重要的关联。从宏观角度看,农业生产投入包括劳动力、土地、农业生产资料、畜牧业养殖水平、农业机械化程度、农村商品市场的繁荣程度等;而与农业生产产出相关的是国内生产总值、农林牧渔业总产值、农业总产值、粮食总产量等。如果分别研究农村居民人均可支配收入与每个变量间的相关关系,研究工作量大且繁琐,同时不易厘清问题的本质。典型相关分析是在借鉴主成分分析方法的基础上,从每组变量中选择若干个有代表性的综合变量(变量的线性组合),通过研究两组综合变量之间的关系来反映两组原始变量间的相关关系。近年来,国内众多专家利用典型相关分析,分别针对休闲农业发展的影响因素、城市经济效益综合评价、农业转型升级、综合环境质量评价等各类与农业经济发展相关的议题展开了丰富的研究[1-4]。同时,农业科学家也利用典型相关分析研究了农产品的化学成分与质量、土壤养分与农产品质量间的相互关系[5-9]。本研究采用典型相关分析研究了兰州市1995—2018年农业生产投入产出与农村居民人均可支配收入之间的关系,以期为提高兰州市农村居民人均可支配收入提供决策依据。

1 研究方法与变量构成

1.1 典型相关分析方法

在典型相关分析中,研究的是两组变量x1、x2、x3…xp1与y1、y2、y3…yp2之间的相关关系。前者称为自变量组,后者称为因变量组。在实际应用中,规定p1≥p2,定义:

式中,u代表自变量组的典型变量,v代表因变量组的典型变量,p1是自变量组中原始变量的个数,p2是因变量组中原始变量的个数。

其中:

上述4个表达式均为列向量,显然u、v为随机变量。

典型变量u和v之间的相关系数称为典型相关系数,用下式表示:

式中的cov(u,v)表示u与v之间的协方差,var(u)与var(v)表示各自的方差。如果不做其他限制,典型变量会有任意多组。Hotelling准则的思想是,首先选取系数向量α(1)和β(1),使得u(1)=α(1)′X和v(1)=β(1)′Y之间的相关系数达到极大,且使u(1)和v(1)的方差均为1,然后再选取下一组系数向量α(2)和β(2),使u(2)=α(2)′X和v(2)=β(2)′Y的相关系数在所有分别同u(1)和v(1)不相关的线性组合中达到极大,并且使u(2)和v(2)的方差也均为1,依次类推,到所有不同线性组合都挑出来为止。因典型变量u与v均已标准化,所以第i个典型相关系数为:

各原始变量与典型变量之间的相关系数向量分别记为Gu和Gv,依据定义有:

式(5)和式(6)是衡量原始变量与典型变量相关性的尺度,其中R11和R22分别为X和Y两组内各自变量的相关系数矩阵。典型相关系数可以看作是从原始变量中提取的变异,因此第一组变量u提取的变异百分数为:

同理第二组变量v提取的变异百分数为:

冗余测度是第一组典型变量提取的变异被第二组典型变量重复的百分数,因此在第一组冗余而在第二组中存在的冗余测度为:

类似地,在第二组中冗余而在第一组中存在的冗余测度为:

典型相关系数的显著性,其检验方法是:

对于大的子样本,在典型相关u和v不相关的零假设下,统计量为:

近似地服从自由度f=p1×p2的χ2分布。对于给定的信度,如果式(12)计算结果大于χ2的临界值,则第一个典型相关系数是显著的。

同样检验第二个典型相关系数,令:

此时,统计量:

近似地服从f=(p1-1)(p2-1)的χ2分布。一般来讲,对于第k个典型相关系数,k<p2,令:

经过检验,设显著的典型相关系数有m个,则总冗余测度为:

1.2 典型相关分析的变量构成

在进行实际分析时,依据典型相关分析的算法将原始变量分为两组。第一组由兰州市农业生产资料的投入量构成,称为自变量组,共有13个变量。第二组由兰州市农业生产的产出量构成,称为因变量组,共有5个变量。具体的变量构成如表1所示。

表1 变量的构成

本研究分析计算所用的原始数据均来自1995—2018年《甘肃年鉴》《甘肃发展年鉴》,计算分析时首先对原始数据进行标准化处理。

2 结果与分析

2.1 典型变量相关显著性检验及分析

典型相关分析研究的对象分为2组变量,首先在自变量组中求出一个原始变量的线性组合,在因变量组也求出一个原始变量的线性组合,使其具有最大的相关系数。然后在自变量组、因变量组中再各求出第2对原始变量的线性组合,使其在与第1对线性组合不相关的线性组合中这2个线性组合之间的相关系数最大。如此进行下去,到2组变量间的相关系数都提取完毕为止。本研究的因变量组有5个原始变量,因此每组将分别求得5个典型变量,共构成5对典型变量。进行分析计算时,对每对典型变量间的相关性进行显著性检验(表2)。

表2 典型相关系数的卡平方统计量及检验临界值

每对典型变量间的典型相关系数是否达到显著水平,可近似地利用χ2分布进行检验。由表2可知,第1对典型变量u1和v1,自由度为65,在显著性检验水平α=0.01时,χ2的检验临界值为94.422 078 15,第2对典型变量u2和v2的自由度为48,同样在显著性检验水平α=0.01时,χ2的检验临界值为73.682 637 63。由此可知,典型相关系数达到极显著的典型变量是第1对和第2对,典型相关系数分别为0.999 697 90、0.999 127 26。因此在分析典型变量及其相关关系时,利用前2对典型变量进行有关的分析即可。经计算,自变量组、因变量组各原始变量构成5对典型变量的系数如表3、表4所示。

表3 自变量组典型变量的系数

表4 因变量组典型变量的系数

自变量组、因变量组的原始变量与各自典型变量间的相关系数如表5、表6所示。由表5可知,第1对典型变量u1与原始变量x9(社会消费品零售总额)、x1(年末总人口数)、x3(耕地面积)、x10(农林牧渔从业人员)的相关系数分别为0.952 704 88、0.793 299 10、-0.773 816 71、-0.573 949 48,说明这4个原始变量在典型变量u1中占据主导地位。表明社会消费品零售总额、年末总人口数、耕地面积、农林牧渔从业人员在增加农村居民人均可支配收入中起决定作用。

表5 自变量组的原始变量与典型变量间的相关系数

由表6可知,典型变量v1和原始变量y1(农村居民人均可支配收入)、y2(国内生产总值)的相关系数分别为0.967 957 86、0.949 872 49。相对于典型变量v1,这2个原始变量占据主导地位,v1可视为主要代表农村居民人均可支配收入和国内生产总值。由于第1对典型变量u1和v1的相关系数达到极显著水平,因此兰州市农村居民人均可支配收入、国内生产总值与社会消费品零售总额、年末总人口数、耕地面积、农林牧渔从业人员有着密切的关系,而且在这对典型变量中,相关系数最大的原始变量分别是社会消费品零售总额与农村居民人均可支配收入。

表6 因变量组的原始变量与典型变量间的相关系数

综上可知,要提高兰州市农村居民人均可支配收入,必须大力培育农村商品市场,搞活农村经济,加速农产品的快速流通、销售,真正做到农业增产、农民增收,从而推动农村社会消费品零售市场的发展,促进国民经济的发展,同时要确保常驻人口总数维持在一定的数量上,才能为农业生产发展提供充足的劳动力。典型变量u1与耕地面积、农林牧渔从业人员的相关系数为负,一方面说明耕地、劳动力的红利已逐渐消失,另一方面也说明由于耕地面积、农林牧渔从业人员的减少,农村居民人均可支配收入和国内生产总值的增长减慢。因此,必须注重农业耕地面积的保护和农林牧渔从业人员队伍的稳定,健全完善政策措施,调整优化供地结构,高质量推进实施耕地占补平衡,坚决治理耕地“非农化”“非粮化”问题,建立耕地保护长效机制,守好守牢耕地保护红线。

由表5、表6可知,对于第2对典型变量u2、v2,典型变量u2与农作物播种面积(x4)、化肥施用量(x13)的相关系数较大,分别为0.907 349 00、0.621 752 77,因此在典型变量u2中占主导地位是农作物播种面积和化肥施用量。典型变量v2与粮食总产量(y5)的相关系数最大,为0.794 501 68,因此在典型变量v2中,起主要作用是粮食总产量。由于第2对典型变量u2、v2间相关系数的显著性检验也达到极显著水平,说明粮食总产量与农作物播种面积、化肥施用量的关系极为密切。

就目前的实际情况而言,兰州市粮食总产量的提高,主要依靠农作物播种面积、化肥施用量的投入。但随着兰州市所属县区城市建设力度的加大,农作物播种面积、耕地面积会不断减少,再加上对环境保护的要求,化肥施用量也将逐步减少,从而导致粮食总产量呈下降趋势。从大的方面讲,全球粮食安全面临诸多挑战,中国粮食中长期供求仍呈“紧平衡”态势,当前结构性矛盾突出。这就要求兰州市在城乡一体化进程中,要协调好经济发展与土地资源缺少的关系,保持兰州市各县区粮食生产能力的不断提高,优化粮食生产结构和资源配置,严守耕地红线和永久农田,为提高粮食总产量打下坚实的基础。同时调动各县区重农抓粮积极性,真正实现藏粮于地,稳步提升粮食产能,为全省粮食安全提供基本保障。尤其重要的是,要将粮食生产能力的提高建立在农业科技进步之上,通过大力推广各种先进农业生产技术,做好良种繁育体系和基地的建设工作,走出一条稳定提高粮食生产能力的科技创新之路。

冗余测度反映各典型变量对各原始变量组变异提取的百分数,典型变量的冗余测度结果见表7。由表7可知,第1对典型变量中,第一组典型变量提取的原始变量的变异被第二组典型变量重复的百分数是23.67%,第二组典型变量提取的原始变量的变异被第一组典型变量重复的百分数为60.12%,两者合计为83.79%,较好地反映了两组原始变量中占有主导地位的变量间的相互关系。第2对典型变量的第一组典型变量提取的变异被第二组典型变量重复的百分数是17.99%,第二组典型变量提取的变异被第一组典型变量重复的百分数为31.01%,两者合计为49.00%,也较好地反映了两组原始变量中占据主导变量间的相互关系。

表7 典型变量的冗余测度

2.2 兰州市农业生产不同阶段的分类

整体来看,兰州市农村居民人均可支配收入呈逐步增长的趋势,但农业生产受自然条件、农产品市场功能、各种政策因素的影响很大,增长的速率呈现波动态势。为了划分兰州市农村居民人均可支配收入增速的不同阶段,本研究利用典型相关分析得到的中间结果典型变量的得分来实现。典型变量的得分是将原始数据进行标准化变换后,分别代入典型变量u1、v1和典型变量u2、v2的线性组合表达式中,经计算得到的。第1对、第2对典型变量的得分见表8。利用表8典型相关变量的两组得分对1995—2018年兰州市农业生产过程进行分类。具体方法是先将原始数据进行正规化变换,再利用费歇最优分段进行分类,分段数从K=2至K=12共11段,其中表9为K=2至K=5的分类结果。例如当兰州市农业生产过程划分为2个阶段时,第1阶段为1995—2016年,第2阶段为2017—2018年。本研究具体分析时取K=4的计算结果,即将1995—2018年兰州市农业生产的发展阶段分为4个阶段,1995—2007年为第1阶段,2008—2012年为第2阶段,2013—2016年为第3阶段,2017—2018年为第4阶段。为了说明每个不同阶段农业生产发展的具体涵义,本研究对2对典型变量中相关系数最大的2个原始变量社会消费品零售总额、农村居民人均可支配收入在不同阶段的年均增长率利用复利公式进行计算,分别得到的结果是,在第1、第2、第3、第4阶段中,兰州市社会消费品零售总额的4个阶段年均增长率分别是0.10982687、0.17218610、0.14098015、-0.00488252;农村居民人均可支配收入4个阶段年均增长率分别是0.086 812 68、0.154 535 69、0.134 613 19、0.093 940 73。二者呈现出共同点,即从第1阶段到第2阶段,二者的年均增长率呈增长趋势,从第3阶段开始二者的年均增长率均有所减缓,第4阶段又继续下降。由此可知,随着农村经济结构和发展模式的不断变化,兰州市原有的农村商品市场规模和运作方式已经不适用于建立现代农业生产体系。这便要求相关部门积极创造条件,组建新型农民联合体,加强土地管控,细化农作物种植管理,节本增效,培养集约化、规模化的现代农产品市场,并通过市场加信息技术的现代化手段,不断加速农产品流通交易和日用消费品的销售,以此大力发展农村经济,实现农业增产与农民增收同步进行。

表8 典型变量的得分

表9 费歇最优分段计算结果

3 小结与讨论

本研究利用典型相关分析,对兰州市1995—2018年的农业生产发展实际与兰州市农村居民人均可支配收入进行了分析。结果表明,对兰州市农村居民人均可支配收入影响最重要的投入量是社会消费品零售总额、年末总人口数、耕地面积、农林牧渔从业人员,对粮食总产量影响最重要的投入量是农作物播种面积、化肥施用量。最后利用费歇最优分段法,将1995—2018年兰州市的农业生产发展阶段分为4个过程,通过计算不同阶段主要原始变量的年均增长率,分析了每个不同阶段农村居民人均可支配的增长情况。

分析兰州市农业生产的发展过程,一般常用的方法是利用18个原始变量所产生的数据进行最优分段。本研究利用典型相关分析计算所得的中间结果典型变量的得分将18个原始变量用4个综合典型变量代替,再进行费歇最优分段法,极大地降低了变量的维度,提高了计算效率。计算结果与兰州市农业生产的发展过程相吻合。因此在处理具有多个原始变量的大数据时,首先利用典型相关分析获取显著性检验达极显著水平的若干组典型变量,计算各典型变量的得分,再进行其他分析处理,是一种非常有效的解析方法。

兰州市农村在取得脱贫攻坚的全面胜利后,下一步的工作重点将转入全面推进乡村振兴、巩固拓展脱贫攻坚成果的新阶段。要实现这一宏伟目标,农村居民人均可支配收入是目的基础,耕地面积、农林牧渔从业人员是抓手,粮食生产是保障。因此,应大力健全农村商品市场,完善农产品的销售模式,切实注意保护耕地面积,稳定农村从业人员队伍,并将粮食生产能力的提高建立在农业科技进步之上。本研究将为兰州市有针对性地谋划全面推进乡村振兴,全面启动乡村建设行动,推进兰州市城乡融合发展提供科学依据。

猜你喜欢

因变量兰州市支配
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
兰州市园林绿配置模式
阳光少年的飞驰年华——兰州市第四十六中学轮滑社团活动掠影
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
跟踪导练(四)4
兰州市艺彩少儿美术作品选登
偏最小二乘回归方法
基于决策空间变换最近邻方法的Pareto支配性预测
随心支配的清迈美食探店记
《兰州市再生资源回收利用管理办法)》8月起实施