基于聚类分析的可持续发展实验区分类评价研究
2010-09-28陈华荣王晓鸣
陈华荣 王晓鸣
(华中科技大学土木工程与力学学院,湖北武汉 430074)
基于聚类分析的可持续发展实验区分类评价研究
陈华荣 王晓鸣
(华中科技大学土木工程与力学学院,湖北武汉 430074)
针对传统的经验分类方法导致的客观性缺乏等问题,从数据着手,运用聚类分析的手段根据实验区数据本身的结构特征对实验区进行分类,揭示出不同实验区发展状态之间的相似性和差异性,研究得出合理的实验区分类标准和分类数量,并在此基础上初步设计了实验区分类评价模型,为实验区的分类管理实践提供了理论依据和技术手段。根据对17个实验区样本数据的分析结果显示,可按照实验区经济发展状况和生态环境状况两方面的情况,将实验区划分为以加速经济发展为主题的实验区、以促进生态环境建设为主题的实验区和以全面协调发展为主题的实验区3类。以上述标准进行分类,各类实验区之间的差异显著而同类实验区存在较好的相似性。实验区的评价流程可划分为如下的两个步骤:首先将待评价实验区数据与该阶段已有实验区数据对比,通过专家评价法或聚类分析过程,划定该实验区所属的种类;而后参照同类别实验区相关指标,进行定性或者定量评价。
可持续发展;实验区;聚类分析;评价
国家可持续发展实验区建设作为中国探索可持续发展道路的一种崭新模式,日益受到理论研究界的重视。目前,针对国家可持续发展实验区(下文简称“实验区”)的研究主要集中在探索实验区管理、建设和规划思路[1-3];分析实验区管理建设过程中面临的实际问题[4-6]以及以地方实验区为对象的实证研究[7-9]等方面。在新的历史发展时期,加强对国家层面实验区分类管理思路研究,完善管理操作流程,是提高实验区管理工作能效,推进可持续发展探索实践的重要途径。
1 国家可持续发展实验区的管理与分类
现行的《国家可持续发展实验区管理办法》将国家级实验区的建设管理过程划分为三个阶段:新区申报阶段、中期检查阶段和期末验收阶段。从管理的基础理论看[10],在各个阶段的评审或检查过程中,对特定区域的可持续发展水平进行测量,即对某一区域在特定时点的经济、社会、环境、资缘等诸要素的协调状态进行度量具有十分重要的意义(见表1)。
目前对区域可持续发展水平的测量大体分为两种方式:一种是测量该水平的相对值(如区域可持续发展水平所处位次等);另一种为定量测量该水平的绝对值(如设计评价指标体系及协调度的计算方法得出确定分值)。在管理理论和实践中,由于评价对象分属不同的类型(见表2),无论采取何种测量方法,试图采用一套固定的指标来评价不同类型的实验区均缺乏足够的说服力和可操作性。
因此,以现有实验区管理统计指标为基础,寻求一种合理的分类依据(在众多的分类标准采用哪一种或几种标准作为分类依据),在此基础上对待评价实验区归类,而后在同一类别中对实验区进行横向比较成为一种比较可行的评价思路。在此过程之中,通过研究得出合理可靠的分类依据是评价过程的关键,本研究主要致力于解决分类依据(包括分类数量和分类标准)问题。
表1 不同管理阶段测量区域可持续发展水平的作用Tab.1 Function of measuring the district sustainable development level in different management period
表2 实验区分类标准与类型Tab.2 Classify criterion and styles of CNSCs
2 实验区的聚类分析思路与分类评价模型
2.1 聚类分析原理
聚类分析是按照数据本身的结构特征对数据进行分类的一种探索性统计方法。其实质就是按照距离的远近将数据分为若干个类别,使得类别内数据的“差异”尽可能小,类别间“差异”尽可能大[11]。聚类分析的基本步骤首先确定距离的基本定义和类间距离的计算方式,随后按照距离的远近,通过把距离接近的数据一步一步归为一类得到可能的聚类结果,最后再利用一些相应的指标来确定聚为几类最为合适。
2.2 实验区聚类分析思路及分类评价模型
对实验区的数据进行聚类分析旨在改变传统的经验划分方法,从数据着手,运用聚类分析方法从实验区申报数据本身的结构特征对数据进行分类。具体而言,即以现有统计指标为基础,以实验区申报数据为对象,对一定数量实验区的申报数据进行聚类分析,通过验证不同分类方案的合理性及类别间的特征,得出合理的实验区可持续发展水平测量的分类标准,并在此基础上统计得出不同类别的特征值(如均值和极值)。
明确实验区的类别数量和分类标准之后,实验区的评价流程可划分为如下的两个步骤:首先,将待评价实验区数据与该阶段已有实验区数据对比,通过专家评价法或重复以上的聚类分析过程,划定该实验区所属的种类;而后,参照同类别实验区相关指标,进行定性或者定量评价。聚类分析方案及分类评价模型见图1。
3 实验区聚类分析过程及结果
3.1 数据来源
本研究的数据采用08年17个新区的申报材料中提供的数据。现有实验区指标体系共由覆盖7个领域(人口、生态、资源、环境、经济、社会、科技教育)的30项指标组成,按照指标的代表性和数据的可获取性原则,从中遴选出19项指标组成的新的研究指标体系。指标体系及数据见表3。
图1 聚类分析方案及分类评价模型Fig.1 Clustering schedule and classification-evaluation model
表3 指标体系及实验区数据Tab.3 Index system and CNSCs date
续表3 指标体系及实验区数据Tab.3 Index system and CNSCs date
3.2 数据处理
缺省值处理:由于部分地方提供的申报材料数据不完整,造成部分分析数据缺失。对于缺失值,分析过程采用均数替代。
数据标准化处理:17个指标数量级并不一致,各指标数据的平均数从最小的0.57到最大的88.20,标准差也从0.23-93.23(各指标分析表略),显示了数据量纲之间的差异性。为了消除不同变量大小不同对聚类结果的影响,有必要在聚类分析前对数据进行标准化处理,本分析过程采用Z—评分法对数据进行标准化处理。
3.3 数据分析及结论
本研究运用SPSS软件(版本:SPSS 13.0 for windows)对数据进行聚类分析。对于两个类之间的距离,采用离差平方和法计算,距离测量方法选择“平方欧几里得距离方法”,这意味着对于两条数据(x1,y1,z1)和(x2,y2,z2),平方欧几里得距离[6]:
全部数据标准化化为Z-评分,希望保留的类别数为3-5类。同时,为便于观察理解,分析结果采用树状结构图的方式表示(见图2)。树状结构图直观地表现了聚类的全过程,横坐标代表对类间距离的度量,它把类间的最大距离算作相对距离为25,其余的距离换算成以之相比的相对距离大小。在下图中,图形左边代表进行聚类的对象(本研究为实验区),线条连接表示类别的合并过程。
不同的分类方案产生的分类结果见表4。
在分类方案2,3中,第2类包含对象的数量(1个)与第1类(6个)相比过于悬殊,另外从树状结构图来看,分类方案二、三中,第2类和第3类相对距离过小,两类别间差异不明显,综合以上分析,采取分类方案一,将实验区分为三类为宜。总结各类的特征如下:
图2 树状结构图Fig.2 Dendrogram
表4 不同分类方案分类结果表Tab.4 Results of different classification schedules
第1类:以加速经济发展为实验主题的实验区:此类地区经济水平一般,产业结构以农业为主,生态环境基础较好。在资源环境条件允许的前提下加速发展经济是实验工作重点。
第2类:以促进生态环境建设为实验主题的实验区:此类地区工业特别是能源化工工业发展迅猛,经济发展迅速,资源消耗大,社会进步显著,但环境治理水平未能与经济发展速度相适应。在经济高速发展的同时,提高环境治理能力是实验工作重点。
第3类:以全面协调发展为实验主题的实验区:此类地区经济基础雄厚,产业结构较为合理,社会事业兴旺。进一步全面协调经济、社会、资源、环境的发展,建设和谐社会是实验工作的重点。
从以上分析可以看出,对实验区的分类,应结合实验区经济发展和生态环境两方面状况进行评价,具体分类标准见表5。
表5 实验区分类标准Tab.5 Classification criterion for CNSCs
以上述标准进行分类,各类实验区之间的差异显著而同类实验区存在较好的相似性,在此基础上进行分类评价,评价结论具有较强说服力。各类别部分主要指标的对比见表6。
表6 各类别主要指标对比表(部分)Tab.6 Comparison table of key indications between styles(portion)
4 结 语
本文通过采用聚类分析的手段分析实验区样本数据,揭示了不同实验区发展状态之间的相似性和差异性,研究得出合理的实验区分类标准和分类数量,解决了传统的经验分类方法导致的客观性缺乏等问题,并在此基础上初步设计了实验区分类评价模型,为实验区的分类管理实践提供了理论依据和技术手段。作为我国可持续发展战略的一种有效的探索模式和实验示范方式,在科学发展观的指引下,实验区工作必将迎来一个崭新的发展阶段。
(编辑:李 琪)
References)
[1]陆学艺.可持续发展实验区发展历程回顾与建议[J].中国人口·资源与环境,2007,17(3):1-2.[Lu Xueyi.The Review of Development Progress and Suggestion for CNSCs[J].China Population Resources and Environment,2007,17(3):1-2.]
[2]陈劭锋,王毅,邹秀萍,等.可持续发展治理的一个理论架构[J].中国人口、资源与环境,2008,18(6):23-29.[Chen Shaofeng,Wang Y i,Z ou Xiuping et al.A Theoretical Framework for G overnance of SustainableDevelopment[J].ChinaPopulationResourcesand Environment,2008,18(6):23-29.]
[3]宋征.21世纪新曙光:可持续发展实验区[J].中国人口·资源与环境,2002,12(3):108-112.[Song Zheng.The 21st Century’s New Dawn-National Sustainable Community[J].China Population Resources and Environment,2002,12(3):108-112.]
[4]徐俊.系统工程方法及其在国家可持续发展实验区评价中的运用[J].科技进步与对策,2006,(1):109-111.[Xu Jun.System Method and the Application in the Evaluation of CNSCs[J].Science&Technology Progress and Policy,2006,(1):109-111.]
[5]李善峰.科学发展观在我国可持续发展实验区的实践[J].理论学刊,2004,127(9):8-11.[Li Sanfeng.The Practice of Scientific Outlook on DevelopmentApplied in theNationalSustainableDevelopment Community[J].TheoryJournal,2004,127(9):8-11.]
[6]江涌.可持续发展实验区发展循环经济路径探究[J].软科学,2007,21(4):123-125.[Jiang Y ong.Exploration on the Way to Develop Circular Economy in Sustainable Development Testing Regions[J].Soft Science,2007,21(4):123-125.]
[7]丛林.福建省可持续发展实验区建设模式的示范作用[J].海峡科学,2007,(7):3-5.[Cong Lin.The exemplary role of construction model of FuJian Province’s CNSCs[J].Straits Science,2007,(7):3-5.]
[8]郎友兴,周津象.地方政府与中国乡村的可持续发展:以浙江省横店镇可持续发展实验区为个案[J].中国人口·资源与环境,2007,17(4):134-139.[Lang Y ouxing,Zhou Jinxiang.Local G overnments and The Sustainable Development in Rural China:A Case Study of Hengdian T own[J].China Population Resources and Environmeng,2007,17(4):134-139.]
[9]王兴杰,刘照胜,王伟莉.可持续发展:由理念走向行动:山东省国家可持续发展实验区现状分析[J].山东省农业管理干部学院学报,2004,20(2):72-74.[Wang Xinjie,Liu Zhaosheng,Wang Weili/Sustainable Development:From ldea to Action-Analysis to Present Situation of China National Sustainable Commmunity in Shandong Province[J].The Journal of Shandong Agricutural Administrators’College,2004,20(2):72-74.]
[10]牛文元.中国可持续发展总论[M].第1版,北京:科学出版社,2007.350-351.[Niu Wenyuan.The Overview of China’s Sustainable Development[M].Beijing:Science Press,2007.350-351.]
[11]张文彤,董伟.SPSS统计分析高级教程[M].北京:高等教育出版社,2004.236-237.[Zhang Wentong,Dong Wei.Senior Textbook for SPSS Statistical Analysis[M].Beijing:High Education Press,2004.236-237.]
AbstractAim at resolving the problemof lack-objectivity caused by traditional classification method,this article classified the China National Sustainable Community(CNSCs)according to their own structure characteristics of data by cluster analysis method,revealed the similarities and differences of development status between CNSCs,and draw rational classification criteria and category number.The classification evaluation model of CNSCs is designed.All achievements above provide theoretical basis and technical means for the CNSCs’classified management.The result from the analysis of 17 CNSCs sample data show that all CNSCs can be classified into three categories by evaluating economics development status and ecological environment status:the CNSCs taking the acceleration of economics as object,the CNSCs taking the promoting of the ecological environment construction as object and the CNSCs taking the comprehensively coordinated development as object.Based on above-mentioned classification,the difference between categories is notable but there is fairly good similarity in the same categories.CNSCs evaluation process follows two steps:first,compare data of CNSCs under evaluation with former data,determine the type of the CNSCs by the expert evaluation method or cluster analysis process,and then carry out the qualitive or quantitive valuations referring to relevance index the same category of CNSCs.
Key wordssustainable development;experiment community;cluster analysis;evaluation
Study of China N ational Sustainable Community’s Classification Evaluation Method Based on Clustering Analysis
CHEN Hua-rong WANG Xiao-ming
(School of Civil Engineering&Mechanics,Huazhong University of Science and Technology,Wuhan Hubei 430074,China)
F061.3;X22
A
1002-2104(2010)03-0149-06
10.3969/j.issn.1002-2104.2010.03.027
2009-09-09
陈华荣,博士生,主要研究方向为区域经济管理。