运用混合聚类法对两型社会农业发展状况的评价
2010-07-09贺正楚翟欢欢
贺正楚,翟欢欢,张 锐
(1.长沙理工大学经管学院,湖南 长沙 410076;2.湖南农业大学经济学院 湖南 长沙 410128)
1 两型社会农业的涵义
我国农村改革与发展的基本目标就是:2020年,要基本形成“资源节约型和环境友好型社会”(简称“两型社会”)农业生产体系。这是建设我国新农村的重大战略要求,是实现农业生产可持续发展、建设中国特色现代化农业的必由之路。“两型社会”定义于农业,就是“资源节约型农业”和“环境友好型农业”,即“两型社会农业”。所谓资源节约型农业,是以节地、节水为中心的集约化农业生产体系,包括发展多熟制种植,提倡立体多层农业,采取先进的灌溉制度和灌溉技术以及科学的施肥制度等节时、节地、节水、节能、高效低耗的集约化农业。所谓环境友好型农业,是以循环农业为中心的清洁农业生产体系,包括减量使用农药、化肥和地膜,改进种植养殖技术,发展农业生态工程、健康养殖工程、废弃物循环再利用工程,实现农业生产无害化和农业废弃物的资源化。
从资源节约型农业和环境友好型农业的各自内涵出发,所谓“两型社会农业”,就是按照科学发展观的要求,紧紧围绕转变农业发展方式,以提高资源利用效率和生态环境保护为核心,以节地、节水、节肥、节药、节种、节能、资源综合循环利用和农业生态环境建设保护为重点,大力推广应用节约型的耕作、播种、施肥、施药、秸秆综合利用等技术,注重水土保持和生态建设等环保型技术,大力培养农民和农业企业的资源节约和环境保护观念,大力发展循环农业、生态农业、集约农业等有利于节约资源和保护环境的农业形态,以促进农业实现可持续发展。
“两型社会农业”作为一种新型的农业生产方式和一种生产体系,具有如下基本特征:(1)经济效益和生态效益高度统一于生产体系中。对可再生资源用养并重,实现永续利用。对非再生资源实行开发利用,边开发边使用。在农业内部结构上,实行一业为主,多种经营,立体种植、种养结合,逐步实现“整体、协调、循环、再生”生产模式,提高资源利用率和农业生态系统的生产力。(2)循环型生态农业发展模式成为农业发展的主导模式。农业生产资源在农业生产系统内被循环使用和重复利用,农药、兽药、肥料、饲料、燃料和其他原材料,要尽可能减少投入,农林牧副渔产品及其加工制品,要尽可能多地产出,获得生产发展、环境改善、生态保护、能量消耗降低以及资源再生利用、农产品质量安全和经济效益提高的综合效果。(3)农业可持续发展能力不断增强、农产品有效供给得到保障。要保证农产品生产的总量、结构、质量和效益相统一,农业发展与人口资源环境相协调,农业生产的生态环境与自然和谐友好,农民生活水平显著提高。
2 “两型社会农业”的评价
要发展“两型社会农业”,首先需要解决其评价问题。如果不能准确地评价,就不能准确把握“两型社会农业”的发展态势,就不可能客观地、有针对性地提出发展“两型社会农业”的建议和对策,提升区域农业竞争力也无从谈起。“两型社会农业”发展状况是以区域农业生产条件为基础,以区域农业的资源节约型、环境友好型为前提,以区域农业生产资源得到节约与农业成长环境得到改善为途径,以区域农业产出效益为目标,涵盖区域农业本身以及区域内部有关要素、关系和行为多方面的综合系统。
对“两型社会农业”的讨论,目前多集中于理论层面,缺乏像“和谐社会”指标体系那样的量化指标。“两型社会农业”的评价体系还未建立,对其生产的考核也无标准。这种状况导致政府部门在决策时缺少依据,执行部门在执行时缺乏方向。
适用于“两型社会农业”发展状况的系统评价方法有很多,但是,采用基于K-means聚类和层次聚类的混合聚类方法,针对省级区域“两型社会农业”发展状况进行评价的相关研究,目前还未见于有关文献资料。而研究湖南省各市州“两型社会农业”的发展状况,对于定位和调整省内各市州的区域农业功能,促进人口、经济与资源环境的相互协调,进而推动社会经济健康发展,具有重要的现实意义。笔者结合湖南省的实际情况,针对“两型社会农业”的各市州区域发展状况的指标体系和划分方法进行研究,提出湖南各市州“两型社会农业”发展状况的评价方案,以期为建立新时期湖南省区域农业发展政策提供指导,为有关部门提供决策参考。
3 “两型社会农业”发展状况的评价指标体系
“两型社会农业”是我国首次提出的概念,虽然很多研究者对“两型社会农业”的评价问题进行了不少研究,但在“两型社会农业”发展状况的评价方面,迄今还没有现成的、完整的省级农业发展状况评价指标体系可供参考。而评价指标的选择是否合理,直接关系到“两型社会农业”发展状况评价的科学性和可操作性,进而影响农业政策制定的成败。
遵循指标体系构建的代表性、易获性、科学性和可比性等原则,结合湖南省农业发展的自然地理和社会发展的实际情况,构建了湖南省“两型社会农业”发展状况评价指标体系,如表1所示。
“两型社会农业”发展状况指标评价系统由3个一级指标、10个二级指标和82个三级评价指标构成。其中生态农业综合效益子系统由3个二级指标、28个三级指标组成;循环农业发展水平子系统由3个二级指标、25个三级指标组成;农业可持续发展水平子系统由4个二级指标、29个三级指标组成。
由评价指标的构成可以看出,农业系统的可持续发展是生产、经济、社会、生态相耦合的复杂有机过程,其发展活动不是孤立的技术活动,也不是单纯的经济活动,而是与自然、社会诸多过程交织在一起的统一体,其实质是一个生产——经济——社会——生态复合系统。
4 数据采集与处理
4.1 数据的采集
根据2007~2008年湖南省统计年鉴和湖南统计信息网以及湖南省宏观数据挖掘分析系统中的数据资源,结合前文的指标计算方法,对湖南省14个市州“两型社会农业”发展状况的评价指标进行了数据采集,获得各指标的取值,如表2所示。
4.2 指标的归一化
由于每个指标的取值大小和计量单位差别较大,为使各项指标与影响因素在加权计算之前对分类结果的影响程度相同,应对采集到的数据进行[0,1]区间标准归一化处理,把数量级不同的数据统一映射到[0,1]区间段上。为此,对于效益型指标,本文采用式(1),对于成本型指标,采用式(2)进行归一化处理。
表1 “两型社会农业”发展状况的评价指标
表2 湖南省14个市州"两型社会农业"发展状况评价指标值
其中,x、y分别为转换前、后的值,maxValue、minValue分别是样本的最大值和最小值。
5 “两型社会农业”发展状况的评价实例
聚类分析可较好地满足“两型社会农业”发展状况的评价要求。通过聚类分析可将样本数据归入相对同源的组或“类”(cluster)。K-means聚类算法简单,运行效率高,是比较常用的聚类算法。本研究使用K-means聚类算法对湖南省14个市州进行聚类。但K-means聚类算法需要事先制定聚类数,而层次聚类(Hierarchical Clustering)无须事先指定聚类数,因此同时采用层次聚类对湖南省14个市州“两型社会农业”发展状况的评价进行研究,以验证K-means聚类的结果。
5.1 基于K-means聚类的划分
K-means聚类算法是典型的基于距离的聚类算法,采用距离作为相似性的评价指标,两个样本的距离越近,其相似度就越大。根据K-means聚类算法的规则,聚类数k值必须事先指定。为得到样本间的距离,可将每个样本数据看作是m维空间上的一个点。两样本之间的距离就是它们所对应的m维空间上的点和点之间的距离,反映了相应样本间的亲疏程度。聚类时,距离较近的样本属于同一类,距离较远的样本属于不同类。本文以欧式距离(Euclidean Distance)作为相似度测度。两样本(x,y)之间的欧式距离计算方法如公式(3)所示。
将各分类个体与聚类中心表示为m维空间中的点后,“两型社会农业”发展状况的评价问题,即转化为m维空间中的点按其与距离中心之间欧氏距离大小聚类为k类的问题。
针对湖南省14个市州现有的农业经济发展情况,我们将该聚类数指定为3类,即划分为A类地区、B类地区和C类地区。基于K-means聚类的划分结果如表3所示。从表3可知,其以长沙市作为中心点,距离最近的有湘潭市、株洲市,这三个地区聚集为A类地区;衡阳市、岳阳市、常德市、郴州市聚集为一类,这四个地区聚集为B类地区;邵阳市、娄底市、益阳市、永州市、怀化市、张家界市、湘西自治州聚集为一类,这七个地区聚集为C类地区。
表3 湖南省14个市州“两型社会农业”发展状况评价的K-means聚类结果
5.2 基于层次聚类的划分
与K-means聚类算法不同,层次聚类无须事先指定聚类数。其基本原理是首先将每个对象归为一类,共得到N类,每类仅包含一个对象。然后找到最接近的两个类且合并为一类,同时重新计算新的类与所有旧类之间的距离。如此重复,直到最后合并成一个类为止。类与类之间的距离就是它们所包含的对象之间的距离,该距离亦采用欧氏距离,小类间的距离按类间平均链锁法计算。
基于层次聚类的14个样本均有效,聚类过程中缺少样本为0,即14个样本均进入了聚类分析。
通过层次聚类,可将湖南省14市州分为3大类,分别是:长沙市、湘潭市、株洲市;衡阳市、岳阳市、常德市、郴州市;邵阳市、娄底市、益阳市、永州市、怀化市、张家界市、湘西自治州。这与K-means聚类算法得到的聚类结果是一致的,这个结果也与实际情况相吻合,充分表明了本文方法的可行性和有效性,也说明了本文提出的“两型社会农业”区域划分指标是合理的。
因此,通过基于K-means聚类和层次聚类的混合聚类方法,可得到湖南省14个市州“两型社会农业”区域发展状况的评价结果分为:A类地区为长沙市、湘潭市、株洲市;B类地区为衡阳市、岳阳市、常德市、郴州市;C类地区为邵阳市、娄底市、益阳市、永州市、怀化市、张家界市、湘西自治州。
6 结 语
本文根据“两型社会农业”发展状况的评价指标和评价模型,构建了湖南省14个市州“两型社会农业”的区域发展状况的评价结果,运用层次聚类和K-means聚类的混合聚类方法,结合湖南省所属的14个市州的实际情况,对全部市州的“两型社会”区域农业发展状况进行评价。针对评价结果,提出湖南省“两型社会”农业发展状况区域划分的备选方案,所提出的政策建议可以为有关部门提供决策参考。
[1]刘 洋,甘 红.区域农业竞争力系统评价[J].农业系统科学与综合研究,2005,(4):295-299.
[2]任咏梅,胡灵红.建设节约型农业实现循环经济的对策分析[J].安徽农业科学,2007,(10):288-290.
[3]戴 钰.基于IPAT模型的长株潭城市群经济增长与资源消耗的实证研究[J].经济数学,2009,26(2):65-71.
[4]万 中,阳彩霞,郝爱云.地市级可再生资源能源利用优化[J].经济数学,2009,26(2):45-51.
[5]李俊岭.东北农业功能分区与发展战略研究[D].北京:中国农业科学院,2009.
[6]Hans H B.Probabilistic models in cluster analysis[J].Computational Statistics&Data Analysis,1996,23(1):5-28.
[7]Christian H.Dissolution point and isolation robustness:Robustness criteria for general cluster analysis methods[J].Journal of Multivariate Analysis,2008,99(6):1154-1176.
[8]Cenk B,Irem D M,Talat B.Comparing the performance of traditional cluster analysis,self-organizing maps and fuzzy C-means method for strategic grouping[J].Expert Systems with Applications,2009,36(9):11772-11781.