基于聚类分析和主成分分析的河南省农业经济评价研究
2020-08-31胡井军薛梦瑶
胡井军 薛梦瑶
摘要:使用聚类分析法和主成分分析法,将河南省18个市依照9个指标分为3个农业经济发展类别,即农业经济发展领先区、农业經济发展中等区和农业经济发展相对落后区;分析各类别的主要指标数据,发现各地区之间存在较大的差异。选取了影响农业经济发展水平的3个主成分,并计算各指标的权重,得出农业经济发展的综合得分模型,最后针对性地提出各类地区农业经济发展的决策与建议,为推动河南省农业经济发展提供借鉴。
关键词:聚类分析;主成分分析;农业经济;河南省
中图分类号:F30 文献标识码:A
文章编号:0439-8114(2020)10-0214-04
DOI:10.14088/j.cnki.issn0439-8114.2020.10.048 开放科学(资源服务)标识码(OSID):
Abstract: Using cluster analysis and principal component analysis, 18 cities in Henan province were divided into 3 agricultural economic development categories according to 9 indicators, namely, leading agricultural economic development area, middle agricultural economic development area and relatively backward agricultural economic development area. The main indicator data of each category is analyzed, and the results show that there are large differences among regions. Three principal components that affect the level of agricultural economic development are selected, and the weights of various indicators are calculated to obtain the comprehensive scoring model for agricultural economic development. Finally, decisions and suggestions for various areas of agricultural economic development are targeted to promote Henan provide reference for the development of agricultural economy.
Key words: cluster analysis; principal component analysis; agricultural economy; Henan province
2019年3月8日,习近平总书记在参加十三届全国人大二次会议河南代表团审议时指出,河南省是中国的农业大省,要把实施乡村振兴战略、做好“三农”工作放在经济社会发展全局中统筹谋划和推进。河南省位于中国中部,下辖有17个地级市和1个省直管市;地属北亚热带向暖温带过渡的大陆性季风气候,全省的气温、 降水、 日照等条件适宜多种农作物的生长。2018年,河南省的粮食产量高达6 649万t,是中国粮食总产量的1/10。然而,河南省农业经济发展仍存在着区域发展不均衡、农业经济差异大等问题。据统计,2017年焦作市单位面积粮食产量为7 330 kg/hm2,而洛阳市的单位面积粮食产量仅为4 450 kg/hm2;漯河市和周口市实际耕地灌溉面积占总耕地面积的100%,而平顶山市只有52%。区域农业经济发展差异较大[1]、发展不均衡等问题始终制约着河南省的农业经济发展。为了全面了解河南省各市的农业经济发展状况,探索河南省各市农业经济的差异化发展之路,本研究采用聚类分析法和主成分分析法对河南省18个市农业经济发展水平开展评价研究。
1 研究方法与评价指标
1.1 研究方法
本研究主要使用聚类分析和主成分分析对数据进行评价。聚类分析是按照样本数据之间的相似性,选择一定的规则,将样本分为几个类别,使得类别内部相似性高而各类别之间具有很高的差异性,包括系统聚类法、有序样品聚类法、动态聚类法和模糊聚类法等[2],本研究使用的是系统聚类法。主成分分析法是对数据进行降维操作[3],其主要思想是将原始指标按其相关性的高低排序,从中筛选出排名靠前的几个指标作为新的变量。本研究使用的软件工具为SPSS。
1.2 评价指标
河南省作为农业大省,其农业经济发展影响着全省GDP的增长,关系着人民生活最基本的保障。依据各地农业经济发展状况对河南省各市进行分类总结,本研究采用9个指标进行分类(表1)。指标的选择依据数据的可收集性、易操作性、准确性、及时性等原则,从而保证结果的可信度。
2 数据来源与预处理
2.1 数据来源
本研究的原始数据来自于《河南统计年鉴2018》,数据采集及时、权威、有代表性,从而保证了本研究的结果质量。
2.2 数据预处理
将原始数据进行一定的四则运算后得到本研究所要使用的各个指标数据。由于10个指标之间的单位不同,如农村居民家庭人均可支配收入以元为单位,单位面积粮食产量以kg/hm2为单位,而实际灌溉面积占总耕地面积比例取值范围为(0,1)之间, 明显不能一概而论。因此本研究在做分析之前,要先对数据进行标准化处理。采用“Z-score标准化”方法,通过对原始数据的均值和标准差进行处理,使结果数据的均值等于0,标准差等于1,也就是数据呈标准正态分布,公式为最终数据=(原始数据-均值)/标准差[4]。
3 实证分析
3.1 系统聚类分析
本研究使用SPSS对标准化后的数据进行聚类分析,使用系统聚类的平均联接法,最终得到河南省各市农业经济聚类分析的谱系图(图1)。
从图1的树状图可以看出,将河南省18个市分为了三大类。第一类包括郑州市、开封市、安阳市、鹤壁市、新乡市、焦作市、濮阳市、许昌市、漯河市、商丘市、周口市、驻马店市和济源市共13个。第二类包括洛阳市、平顶山市、三门峡市共3个。第三类包括南阳市和信阳市。
对每一类数据进行简单的算术平均(表2)。
根据表2将第三类别的2个市划为农业经济发展领先区;第一类别的13个市划为农业经济发展中等区;第二类别的3个市划为农业经济发展相对落后区。
3.2 主成分分析
由于本研究所选取的农业经济发展指标体系范围广、数量多,所对应的数据构成了多元数据[5],且指标之间存在着一定的重叠。为了更加全面综合地展示各地农业经济发展状况,本研究使用主成分分析法对指标数据进行降维处理,旋转方法采用凯撒正态化最大方差法,迭代次数最大值选择25。各指标之间的相关性矩阵见表3。
由表3可看出,个别指标之间存在较强的相关性,也就是指标之间存在着一定重叠。例如机电井数量与第一产业就业人数之间的相关性达到了0.659;实际灌溉面积占耕地面积的比例与单位面积产量之间也存在着一定的错位。
由表4可看出,当第3个成分累积值为69.887%时,且前3个主成分的特征根大于1[6],本实验认为已满足一定的贡献率,所以选择前3个指标作为第一主成分。表5中的指标系数表明,实际耕地灌溉面积占总耕地面积的比例、单位面积粮食产量和单位耕地面积占用的农业机械总动力3个指标在第一主成分上存在较高的载荷[7]。第二主成分主要代表的是机电井数量、水库数量和单位耕地面积平均农用塑料薄膜使用量的信息。第三主成分反映的是农村居民家庭人均可支配收入、第一产业就业人数和单位耕地面积平均化肥使用量的信息。接下来利用Excel进行权重的计算,解得各指标的综合得分系数。对其进行归一化处理,得出各指标的权重分别为0.207、0.261、0.128、-0.118、-0.031、0.140、0.154、0.085、0.175。
根据权重建立综合得分模型[8]
Y=0.207C1+0.261C2+0.128C3-0.118C4-0.031C5+0.140C6+0.154C7+0.085C8+0.175C9
计算出各市农业经济水平的综合得分并进行排名(表6)。
根据排名结果分析,南阳市和信阳市排名最高,济源市排名最低,且综合得分为负数,与聚类分析结果存在一定的差异,这是由于算法本身缺陷导致的。根据主成分分析和聚类分析的综合结果以及实际情况,本研究将南阳市、信阳市、许昌市、驻马店市和安阳市划为农业经济发展领先区;将漯河市、商丘市、周口市、濮阳市、新乡市、开封市、焦作市、郑州市和平顶山市划为农业经济发展中等区;将三门峡市、鹤壁市、洛阳市、济源市划为农业经济发展相对落后区。
4 河南省农业经济发展的差异化之路
由主成分分析和聚类分析的综合结果,本研究将河南省各地区的农业经济发展水平分为3个类别,各类别之间存在较大的差异,且各地区的实际情况也不尽相同。所以为了全面发展农业经济,需要走差异化发展道路。本研究根据各类别地区的具体状况探索出不同的发展道路,以促进河南省农业经济整体发展。
农业经济发展领先区包括南阳市、信阳市、许昌市、驻马店市和安阳市5个市,其农业基础建设、农业生产投入和农业生产效益的水平都高于其他两类。其中,南阳市农业历史悠久、水资源丰富、地理环境优越,为农业的发展提供保障,农业经济发展水平最高。驻马店市的单位耕地面积占用的农业机械总动力位列河南省第一,为1.88 万kW/千hm2,应该在保持原有投入的基础上,加大农业经济的创新性发展,增加农业科技资金的投入,积极响应国家政策,发展新型农业。同时,也应向全国各地的农业经济发展领先城市学习,根据自身的实际情况,选取优秀策略,促进本地农业的快速、稳定发展,实现农业经济的跨越式进步。
农业经济发展中等区包括漯河市、商丘市、周口市、濮阳市、新乡市、开封市、焦作市、郑州市和平顶山市9个市。其中,周口市和漯河市的实际耕地灌溉面积占总耕地面积的100%;濮阳市的单位面积粮食产量远高于其他市;开封市的单位耕地面积占用的农业机械总动力排名第二,为1.58萬kW/千hm2。该类地区应融入最新科技,继续发展特色农业,同时改善农业设施。开封市的单位耕地面积化肥使用量高达1 290.60 t/千hm2,新乡市达到了1 164.42 t/千hm2,化肥使用量严重超标,政府和相关部门应该加大对化肥使用的把控,同时加强科技创新,实现农业绿色发展;周口市的实际耕地灌溉面积占总耕地面积的100%,第一产业就业人数排名第二,但农村居民家庭人均可支配收入相对其他市较低,周口市应加大对农村居民的就业扶持和技术培训,改善农村各行业就业人员的比例。
农业经济发展相对落后区包括三门峡市、鹤壁市、洛阳市和济源市。该类地区的农业基础建设、农业生产投入和农业生产效益都比较落后。其中,三门峡市单位面积的粮食产量为3 984 kg/hm2,仅为焦作市的一半。针对第三类相对落后区,应全面完善农业基础设施,改善农业生产环境,同时政府应该加大对此类地区的资金、技术和人才扶持力度。
参考文献:
[1] 周景楠.基于主成分分析的广东农业经济发展水平评价研究[J].商,2015(27):271.
[2] 王晓蓉.基于系统聚类分析的山东省区域农业竞争力实证研究[J].山东省农业管理干部学院学报,2012,29(5):39-41.
[3] 王爽英,李立辉,戴向洋.基于主成分分析方法的湖南省农业区域经济评价及发展方向[J].农业现代化研究,2010(31):241-244.
[4] 李 勇.陕西省农业经济发展的聚类分析[J].湖北农业科学,2018,57(16):143-145.
[5] 彭 博,罗泽举.河南省各地区农业经济评价——基于聚类和主成分分析[J].重庆工商大学学报(自然科学版), 2015,32(4):91-96.
[6] 苏 飞.基于主成分分析的徐州城郊旅游游客满意度研究[J].河北工程大学学报(社会科学版), 2015,32(4):36-38.
[7] 吴 娇.基于主成分分析的四川省农业经济发展水平综合评价[J].安徽农学通报,2018,24(12):1-4.
[8] 钭一土,郑文钟.浙江省农业竞争力的总体评价与地区比较研究[J].农机化研究,2011(6):9-13.