APP下载

模糊C均值聚类法在节水灌溉水平聚类分析中的应用

2017-08-07王同旭王铁雷冠军

东北水利水电 2017年7期
关键词:均值节水灌溉

王同旭,王铁,雷冠军

(1.黑龙江大庆水文局,黑龙江大庆163316;2.中国水利水电科学研究院水资源研究所,北京100038)

模糊C均值聚类法在节水灌溉水平聚类分析中的应用

王同旭1,王铁1,雷冠军2

(1.黑龙江大庆水文局,黑龙江大庆163316;2.中国水利水电科学研究院水资源研究所,北京100038)

阐述了模糊C均值聚类法对样本进行聚类的基本原理,对模糊C均值聚类法不能有效确定聚类数目的问题进行分析,提出采用动态聚类方法计算出聚类数目的前提下对模糊C均值聚类法进行改进。利用改进模糊C均值聚类法对某地区的节水灌溉水平进行聚类分析,结果表明模糊C均值聚类法具有较高的适用性。

模糊C均值聚类;动态聚类法;不一致系数;节水灌溉指标体系

0 引言

模糊C均值聚类法是用隶属度确定某个样本点属于某个聚类的一种聚类方法,该方法是对普通聚类法的改进,模型简单实用,能够有效减小运算时间。张肆红[1]运用模糊C均值聚类法针对现场调查的泥石流的各因素划分泥石流沟的类别,分类结果表明泥石流沟类别的划分与现场调查和室内结果较为一致,说明模糊C均值聚类法具有较好的适用性。张文[2]针对泥石流影响因素较多的问题,运用主成分分析法进行降维处理,对提取出的主成分运用模糊C均值聚类法进行分类,分类结果与现场实际情况吻合较好。徐茵[3]针对泥石流6个常用的影响因子采用熵权法计算各因子的权重,运用模糊C均值聚类法对乌尔德库区的泥石流进行聚类,实际调查发现实际聚类结果能够体现泥石流沟的发育状态。张曙红[4]指出模糊C均值聚类法对于处理低维的数据具有较高的有效性,但是难以很好地处理高维的数据,提出一种基于遗传算法采样的模糊C均值聚类法,能够提高处理大规模数据的能力。

模糊C均值聚类算法需要预先确定被分类的元素分为几类,从初始分类出发用迭代方法进行修正,直到分类结果符合要求[5],具有较大的不确定性。针对模糊C均值聚类法需要人为确定出聚类数的不足,对模糊C均值聚类法改进,采用动态聚类方法求出聚类数,进而采用模糊C均值聚类法聚类。构建了节水灌溉水平的评价指标体系,运用改进的模糊C均值聚类法聚类,聚类结果与动态聚类法保持一致,能够有效避免模糊C均值聚类法聚类主观性强的问题。

1 模糊C均值聚类法

1.1 模型简介

给定样本矩阵:

其中,X的每一行为一个样品(或观测),每一列为一个变量的n个观测值,X是由n个对象的(x1,x2,…,xn)的p个变量的观测值构成的矩阵。

假定将n个对象划分为c类(2≤c≤n),设定c个类的聚类中心V=(v1,v2,…,vc),其中vi=(vi1,vi2,…,vip),(i=1,2,…,c)。令uik表示第k个对象xk属于第i类的隶属度,这里能够使得各对象与聚类中心的距离最小的分类即为最佳的聚类。定义目标函数

其中,U=(uik)c×n为隶属度矩阵,dik=‖xk-vi‖。显然,J(U,V)表示了各类中对象到聚类中心的加权平方距离之和,权重是对象xk属于第i类的隶属度的m次方。模糊C均值聚类法的聚类准则是求U,V,使J(U,V)取得最小值。

1.2 建模步骤

模糊C均值聚类法的具体步骤如下:

2)通过下式计算第l步的聚类中心V(l):

3)修正隶属度矩阵U(l),计算目标函数值J(l)。

4)对给定的隶属度终止容限ξu>0,当max时,停止迭代,否则l=l+1,然后转2,不断迭代直到满足迭代终止条件为止。

经过以上步骤的迭代之后,可以求得最终的隶属度矩阵U和聚类中心V,使得目标函数J(U,V)的值达到最小。根据最终的隶属度矩阵U中元素的取值可以确定所有样品的归属,当时,可将样品xk归为第j类。

1.3 模糊C均值聚类法的改进

模糊C均值聚类法是在已知聚类数目的前提下,根据目标函数最小来确定最终的聚类结果,因而模糊C均值聚类法聚类数目的确定直接影响了聚类结果的优劣。对于一系列样本观测值往往聚类数目的确定让人莫衷一是,因而本文提出采用动态聚类的方法对模糊C均值聚类法进行改进。

设定聚类的阈值C,采用动态聚类法,当一个节点和它的所有子节点的不一致系数小于C时,该节点及其下面的所有节点被聚为一类,不断调整聚类阈值,观察聚类的个数。为了有效判定当次聚类效果的优劣,采用不一致系数作为衡量聚类结果优劣的标准。不一致系数可用来确定最终的分类个数,在聚类过程中,若某一次聚类所对应的不一致系数较上次有大幅度增加,则说明该次聚类的效果较差。

式中:ξi为第i次聚类时的不一致系数;di1为第i次聚类时的聚类距离;di2为第i次聚类时所涉及的聚类距离的均值;di3为第i次聚类时所涉及的聚类距离的标准差;i=1,2,…,n-1,n为样本的个数。

2 节水灌溉指标体系的建立

2.1 节水灌溉的内涵

节水灌溉是根据种植作物的需水规律以及当地水资源的供给条件,最大限度利用当地自然降水和灌溉水,以获取农业的最佳综合利用效益(包括经济效益、社会效益、生态环境效益等)为目标,而采取的多种措施的总称。节水灌溉实际上是以降低灌溉用水的无效损耗量来实现节约水资源的目的,因此节水灌溉的技术体系就围绕水资源的高效利用展开,具体技术贯穿于从水源到田间入水口等各输水环节、从田间入水口到作物根系的灌水环节,以及作物吸收利用根系层土壤水分的耗水环节,在农业灌水过程中,节约用水的理念无处不在。

2.2 节水灌溉指标体系构建

节水灌溉受到气候、地质等自然因素的影响,同时也受到经济、社会、技术等发展水平的制约,是一个复杂的多目标、多层次的系统。节水灌溉水平的研究,就是对一个地区节水灌溉各指标的研究,建立合理全面易于操作的评价指标体系是研究节水灌溉水平的关键。评价指标体系的建立有分析法、综合法、频度统计法和统计分析法等多种方法。

杨旭[6]将节水灌溉工程所涉及的指标分为七大类,涉及到政策、技术、经济、财务、资源、环境、社会等指标,对于指标的综合评价提出采用加权等方法对综合指标进行协调。李晓渊[7]遵照指标设定的系统性、简洁性和可操作性原则,将新疆地区的节水灌溉的技术经济指标评价体系分为投入产出、效果评价和比较效果三类指标,建立了组合赋权法的综合评价模型,能够有效对新疆地区的节水灌溉水平进行评价。张晶楠[8]在分析了节水灌溉的影响因素的基础上,选取了工程节水、农业节水和管理节水所对应的34项指标构建节水灌溉评价指标体系,采用模糊综合评价法对四川省的节水灌溉水平进行评价。王慧[9]针对西北缺水地区,从社会、经济、资源环境效益三方面共提出25个评价指标,利用改进的集对分析法对灌区节水改造效益进行综合评价。张占庞[10]对生态灌区的水资源可持续利用建立了水资源发展程度、水资源与社会、经济、生态环境的协调程度的指标,并简要论述了生态灌区的综合评价方法。韩振中[11]等提出大型灌区节水改造评价指标体系,包括水土资源指标、生态环境指标、社会经济指标等7个准则层,采用线性加权法进行灌区评估。高峰[12]等构建了涵盖技术、经济、资源、财务、政策、环境、社会评价7个准则、41个具体指标的节水灌溉工程评价指标体系。刘从柱[13]依据关中灌区节水改造项目,建立包括项目效益、项目可持续性、建设过程、项目管理的灌区节水改造项目评价指标体系,结合模糊综合评判法将其应用于关中灌区,该研究构建了较为完善的指标体系,但是评价方法和权重确定的比较简单。

节水灌溉指标体系的建立,应该能够科学合理地反映节水灌溉的特征和优势,应遵循下列基本原则:经济合理性原则,技术先进性原则,方案可行性原则,生态协调性原则、可持续性发展原则。基于目前极端气候现象严重,将节水灌溉水平的指标定为社会效应、经济效应、环境效应,构成节水灌溉水平评价的指标体系,见表1。

3 模糊C均值聚类法的运用

我国是农业大国兼灌溉大国,灌区在我国社会经济发展中的地位举足轻重,合理高效地利用灌区水资源,是灌区生态环境保护的重要保障。为缓解我国灌区水资源短缺、水资源利用效率低下、生态环境恶化等问题,大规模的节水型农业建设应运而生。

由于评价区域多样性,其自然生态环境各有不同,区域在发展节水灌溉过程中侧重于对灌区的节水灌溉水平进行综合评价,然而根据灌区的实际情况进行综合聚类,为灌区的综合管理提供分区管理、分区整治的依据是必需的。建立具有实际操作意义的全面反映我国界水灌溉状况与进程,以及社会、经济和生态环境之间相互协调程度的指标体系及评价方法,从而科学地指导节水灌溉的良性健康发展。

表1 节水灌溉水平评价指标体系

为了研究河北某地区的节水灌溉水平,选取能够找到的相关指标作为该地区节水灌溉水平的评价指标,见表2。

表2 待评价地区指标

对各待评价地区的节水灌溉指标分别计算,依据指标进行聚类,选择阈值是0.1,0.5,1.0,1.5,2.0,2.5,分别进行动态聚类,聚类结果见表3,由于在聚类数目最小且聚类效果最好的原则下,选取聚类数目为3类。

在确定聚类数目为3类的条件下,采用模糊C均值聚类法进行聚类,见表4及图1。

表3 动态聚类表

由于各地区的指标的量纲不同,为了消除量纲的影响,对不同地区的指标值采取归一化处理,如表4。

表4 各地区模糊聚类的隶属度及聚类结果

图1 节水灌溉水平聚类树形图

在采用动态聚类法确定聚类数目的前提下,运用C均值模糊聚类法对六个地区的节水灌溉水平进行评价,结果表明模糊C均值聚类法和动态聚类法结果保持一致,说明模糊C均值聚类法的正确性,同时在动态聚类法确定聚类数目的基础上运用模糊C均值聚类法,能够有效提高该方法的实用性。

4 结论

本文在对模糊C均值聚类法的基本原理进行阐述的基础上,采用动态聚类的不一致性系数对模糊C均值聚类法进行改进,并对某地区的节水灌溉水平运用改进后的方法进行分类,结果表明,改进后的方法能够有效确定聚类数目,且聚类结果与动态聚类结果保持一致,说明改进后的模糊C均值聚类法具有较强的适用性。

[1]张肆红,路晓光,赵伟.FCM(模糊C-均值聚类)法在石流分类中的应用[J].福建建筑,2010(3):77—79.

[2]张文,陈剑平,秦胜伍,李明,等.基于主成分分析的FCM法在泥石流分类中的应用[J].吉林大学学报(地球科学版),2010,40(2):368—372.

[3]徐茵.乌尔德库区泥石流模糊C均值聚类法初步分类研究[J].水文地质与工程地质,2014,41(2):129—133.

[4]张曙红,孙建勋,诸克军.基于遗传优化的采样模糊C均值聚类算法[J].系统工程理论与实践,2004,24(5):121—125.

[5]朱喜林,武星星,李晓梅.基于改进型模糊聚类的模糊系统建模方法[J].控制与决策,2007,22(1):73—77.

[6]杨旭,曾赛星,王蔚武,张金萍.节水灌溉综合评价指标体系与量化方法[J].黑龙江水利科技,2005,33(4):27—28.

[7]李晓渊,朱美玲,何继武.新疆干旱区农业高效节水灌溉技术经济评价指标体系构建初探[J].农村经济与科技,2010,21(4):62—63.

[8]张晶楠,杨路华,翟宁,楼豫红,等.基于可变模糊集理论的区域节水灌溉发展水平评价方法[J].河北农业大雪学报,2010,33(3):111—115+119.

[9]王慧,毛晓敏,董锋.灌区节水综合效应评价的集对分析模型比较[J].节水灌溉,2010(2):48—51.

[10]张占庞,韩熙.生态灌区基本内涵及评价指标体系评价方法研究[J].安徽农业科学,2009,37(18):8621—8623.

[11]韩振中,门冠宇,刘云波,等.大型灌区续建配套与节水改造评价指标体系的研究[J].中国农村水利水电,2002(7):17—21.

[12]高峰,雷声隆,庞鸿宾.节水灌溉工程模糊神经网络综合评价模型[J].农业工程学报,2003,19(4):84—87.

[13]刘从柱.大型灌区节水改造项目后评估指标体系与评估方法研究[D].西安理工大学,2007.

S274

A

1002-0624(2017)07-0055-04

2016-09-24

猜你喜欢

均值节水灌溉
坚持节水
节水公益广告
苍松温室 苍松灌溉
苍松温室 苍松灌溉
苍松温室 苍松灌溉
节水公益广告
苍松温室 苍松灌溉
均值与方差在生活中的应用
节水妙想
关于均值有界变差函数的重要不等式