利用Motyka相似系数进行农业产值的Q-型聚类分析
2017-12-04李丽颖
李丽颖
(吉林师范大学计算机学院 吉林 四平 136000)
利用Motyka相似系数进行农业产值的Q-型聚类分析
李丽颖
(吉林师范大学计算机学院 吉林 四平 136000)
利用Motyka相似系数作为两个群之间相似程度的一种度量,给出了分析群相似性的Q-型聚类分析方法,利用这种方法对2014年我国各省、市、区的农、林、牧、渔各产业的产值结构类型进行了区划,并将结果与10年前进行比较,对其发展趋势进行了统计分析。
Motyka相似系数;聚类分析;农业区划
1.群相似程度分析的Q-型聚类分析法[1]
国家统计局每年公开发行的统计年鉴中,有全国各地区农业总产值和农、林、牧、渔等各产业的产值,如何按照这四项产值将各省、市、区进行相似性划分具有判断我国农业类型的现实意义。群的相似程度分析在本质上是每个群有若干个相同类型的数据数量指标的Q-型聚类分析问题。
进行群分相似程度分析时,要用数值作为群相似性的度量指标,假设两个群I和II各有若干个同类指标,群I的指标为a1,a2,a3,K,am,群II的相应指标为b1,b2,b3,K,bm,那么利用Motyka相似系数来分析两个群的相似程度可以按照如下方法进行:
假设有n个群落A1,A2,···,An,首先根据数据统计软件可以计算出任意两个群的相似系数阵,然后利用动态聚类法的原理进行Q型聚类分析,其步骤为:
(1)选取相似系数阵中最小的相似系数d(AS,AK)=min{d(Ai,Aj)│i,j=1,2,∧,n},则AS,AK这两个群为两个聚点。
(2)对 i=1,2,……,n,i≠s,i≠k,比较 d(Ai,AK)与 d(Ai,As)的大小。
①若 d(Ai,AK)>d(Ai,As)则 Ai归属于 AK类。
②若 d(Ai,AK)<d(Ai,As)则 Ai归属于 As类。
③若d(Ai,AK)=(Ai,As)则Ai自成一类,这一次的划分完毕。
本次分类后形成2-3个类,分别检验每个类中的最小相似系数,如果该系数较大,说明本类中各个群之间具有较高的相似程度,可以停止分类,否则,在对应的类中重复步骤(1)和(2),直到各类中最小相似系数达到满意则停止分类。
2.根据相似程度划分我国农业产值结构类型
利用2014年国家统计局公布的统计年鉴中的数据,可以计算出我国31个地区(不含港澳台)的农、林、牧、渔产值在总产值中所占比例,通过以上方法进行计算,就可以求出任意两地区之间的相似系数阵,经过反复分析将全国分成了五个区域,具体分组情况见表1。
表1 各类中包含的地区
各类中最小的相似系数取值区间为[0.885,0.97],说明各类内部的相似程度已经很高,每类所包含的地区大体具有相同的农业产值结构。按照地图的地理位置划分各个类,大致上把我国分成自东北到西南方向的几个区域,同我国传统划分的土地资源分布有异曲同工之妙。
如果进行进一步分析,将各类内部按农、林、牧、渔产值分类累和再求各产值的比例,那么就可以得出表2的结果:
表2 各类内的产值比例
10年前的相关数据如下:
3.我国农业结构现状分析
根据以上表格中的数据进行分析,各类的农业产业值的变化趋势为由西向东,由南向北,结合10年前的相关数据,可以得出以下结论:
第一,我国农作物产值基本上是由南向北递减的。这种情况出现的主要原因是因为北方(以东三省为主要代表)的土壤肥沃,非常适合农作物生长,而南部(以东南地区为主)的人口密度大,因此人均占有耕地面积少,造成的结果是从事农业生产的人只占总人口的一小部分,因而农作物产值在总产值中所占的比例偏低。但是山东、河南这类内陆地区已经取代东北三省成为农业产值的大户,说明这类省份加强了农作物尤其是蔬菜的耕种面积,成为供应全国的蔬菜大省,增加了地方农业产值。总体看来,农作物产值比10年前低,部分原因是由于近10年楼市火爆,所以各地都减少了种植面积用于房地产开发。
第二,从林业产值比例上看,对比10年前的数据,我国林业产值有显著升高,说明我国普遍重视林业发展,扩大林业种植面积提高绿化面积。内陆省份明显比例增高,而原来占绝对优势的东南地区和东北地区则稍显落后。
第三,牧业产值最高的由西部地区转移到了东南地区,这说明我国为保护环境而减少了游牧,同时牧业也从落后的游牧进入到了集中养殖,是牧业摆脱自然环境限制进入现代化、科技化养殖阶段的体现。同时牧业产值对比10年前明显大幅度降低,部分原因是由于我国的乳制品质量不高,大部分人对乳制品的购买由国内奶源地产品转向国外奶源地产品,这给我国的牧业产业带来了巨大的冲击。
第四,东南沿海地区将渔业高产值比例转让给了内陆省份,这种现象说明了我国渔业生产转入了内陆湖泊的淡水渔业和人工养殖,近海渔业产值降低说明我国对近海的资源保护已见成效。
根据以上分析,我国农业产值的新特点说明我国农业已经基本摆脱了地理环境的限制,不再是几十年前的受自然资源限制的初级农业类型,人对环境进行了积极有效的干预。根据农业生态经济的发展规律,农业应由顺应自然到积极干预自然并逐步建立合理的农、林、牧渔结构。随着消费能力的提高,市场需要的变化,商品经济的发展,以及科学技术的进步,对农业结构的影响应由单纯的自然条件因素转向自然条件和社会经济技术两个因素共同起作用[1]。
综上,利用Motyka相似系数对我国各地区进行农业类型划分得出的农业区划结构准确,符合我国农业发展的现状,这种划分对分析农业发展趋势,指导农业健康发展具有现实的指导意义。产权理论创始人、诺贝尔经济学奖得主、美国经济学家科斯认为:缺乏统一市场势必造成区域间交易成本扩大、导致产业结构通化、产业相似度偏高、过度竞争激烈、竞争费用、保护成本增大等畸形发展。[4]若能连续对农业产值进行区域划分,对农业产值类型进行持续监控,将对我国农业的宏观调控起到积极干预的作用。
[1]国家统计局编.中国统计摘要[M].北京:中国统计出版社,2014:115.
[2]宋立新,李丽颖.关于我国各省市区农林牧渔产值结构类型的区划[J].数理统计与管理,2005(5):15-17.
[3]唐保国.我国区域经济协调发展指标体系及定量评估研究[D].山东财经大学硕士论文,2013(5).
[4]王文森.产业结构相似系数在统计分析中的应用[J].中国统计,2007(10).
Q-accumulate analysis on Agricultural output value by the Utilization of Motyka Similar Coefficient
Li li-ying
(Jilin Normal University Computer College Jilin Siping 136000)
This article use Motyka similar coefficient as a measurement of similarity between two communities,provide the method of Q-accumulate analyzing.We also practice the method by making agricultural divisions according to the structure type of the output of farming,forestry,stock rising and fishery in 2014,and compare the results with 10 years ago,analyze the develop tend from statistics figures.
Motyka similar coefficient;Analyze the accumulating;Agricultural divisions
O212
A
2095-7327(2017)-10-0045-02
李丽颖(1978—),女,汉族,吉林柳河人,硕士,讲师,毕业于吉林师范大学数学学院,主要研究方向为数理统计。