基于极限学习机的长江流域水资源开发利用综合评价
2013-09-05崔东文
崔东文
(云南省文山州水务局,云南 文山 663000)
基于极限学习机的长江流域水资源开发利用综合评价
崔东文
(云南省文山州水务局,云南 文山 663000)
为能客观、准确地对长江流域水资源开发利用进行综合评价,利用层次分析法构建了符合长江流域水资源开发利用现状的综合评价指标体系和分级标准,基于极限学习机(ELM)算法原理,构建了ELM水资源开发利用综合评价模型对长江流域及主要水系水资源开发利用进行综合评价,并构建RBF、BP神经网络模型作为对比评价模型。采用随机内插的方法在各评价分级标准阈值间生成训练样本和检验样本,在达到预期评价精度后将模型运用于长江流域水资源开发利用综合评价中。结果表明:ELM水资源开发利用综合评价模型对长江流域及主要水系水资源开发利用综合评价等级为4~8级,处于有潜力至失衡之间,与长江流域各主要水系水资源开发利用现状相符;该模型的评价精度和泛化能力均优于RBF及BP神经网络评价模型,是合理可行和有效的,可应用于长江流域水资源开发利用综合评价,具有参数选择简便、评价精度高、泛化能力强等优点。
水资源开发利用;极限学习机;RBF神经网络;BP神经网络;长江流域
水资源开发利用综合评价是区域水资源可持续发展综合分析与评价的核心技术之一,用以反映区域水资源及其开发利用状况,对区域水资源开发利用与环境生态保护、促进水资源可持续利用具有重要意义[1-2]。目前用于区域水资源开发利用综合评价的方法有模糊集理论方法、人工神经网络理论方法、灰色系统理论方法、数理统计方法等[3],但由于水资源及其开发利用是一个复杂巨系统,评价指标较多,对评价指标的筛选与权重的赋值普遍采用层次分析等方法[4],存在明显的主观臆断成分,对其评价并不适宜建立常规数学模型,而是借助诸如人工智能、模糊识别、知识工程等方法建立模型,以处理多指标系统的综合评价问题[5]。目前,模拟智能算法已成为建立和评价这类复杂系统最为有效的方法之一,其中人工神经网络(artifical neural network,ANN)则是这类智能算法中运用最为广泛的算法之一。将ANN用于水资源开发利用综合评价等此类型的评价中[6-8],存在两个关键性问题:一是没有统一完善的评价指标体系和分级标准;二是如何有效解决神经网络由于“欠拟合”与“过拟合”所导致的网络泛化能力降低的问题[6-9]。为能客观、准确地对水资源开发利用进行综合评价,针对水资源开发利用综合评价中的关键性问题,本文构建了符合长江流域水资源开发利用现状的综合评价指标体系和分级标准,基于极限学习机(extreme learning machine,ELM)算法原理,构建了ELM水资源开发利用综合评价模型(以下简称ELM评价模型)。采用随机内插的方法在各评价分级标准阈值间生成训练样本和检验样本,选用决定系数R2以及平均绝对误差δMAE、均方根绝对误差 δRMSE、平均相对误差 δMAPE、均方根相对误差δRMAPE共5个统计学指标对ELM评价模型及RBF和BP神经网络评价模型进行性能评价,在达到预期的评价精度后将模型运用于流域水资源开发利用综合评价中,并认为训练样本、检验样本的 R2足够大,δMAE、δRMSE、δMAPE和 δRMAPE足够小,且满足各评价指标相近时模型具有很好的评价精度和泛化能力,此时可将模型运用于长江流域及主要水系的水资源开发利用综合评价。
1 ELM原理
ELM是一种新型单隐层前向神经网络(singlehidden layer feedforward neural network,SLFN)[10],ELM算法随机产生输入层与隐含层间的连接权值及隐含层神经元阈值,且在训练过程中无需调整,只需要设置隐含层神经元的个数,便可以获得唯一的最优解。与传统的训练方法相比,该方法具有学习速度快、泛化性能好等优点。ELM算法原理如下:
式中:ai为连接第i个隐含层节点的输入权值,ai=(ai1,ai2,…,ain)T;bi为第 i个隐含层节点的偏差;βi为连接第i个隐含层节点的输出权值,βi=(βi1,βi2,…,βim)T。激励函数 g(x)可以是“Sigmoid”、“Sine”或“RBF”等函数。
上述N个方程的矩阵形式可写为
E(W)表示期望值和实际值之间的误差平方和,问题求解就是寻找最优的权值W=(a,b,β)使代价函数E(W)最小,其数学模型可表示为
Huang等[10-16]在前人研究的基础上,基于以下定理为SLFN提出了ELM算法,为ELM的应用提供了理论基础。
定理1 设任意N个不同样本(xi,ti),其中xi=(xi1,xi2,…,xin)T∈Rn,ti=(ti1,ti2,…,tim)T∈Rm,N个隐含层节点和一个任意区间无限可导的激活函数g:R→R,SLFN在ai∈Rn和bi∈R任意赋值的情况下,所形成的隐含层矩阵H可逆,即方程组有精确解,代价函数E(W)=0。
定理2 设任意N个不同样本(xi,ti),任意小误差e>0,及在任意区间无限可导的激活函数g:R→R,总存在一个包含M(M≤N)个隐含层节点的SLFN,使得在ai∈Rn和bi∈R任意取值情况下,误差E(W)≤e。
定理1和定理2表明,只要隐含层节点数足够多,SLFN就能在输入权随机赋值情况下逼近任何连续函数。但为了使SLFN具有良好的泛化性能,通常M≪N。当输入权以随机赋值的方式确定后,所得隐含层矩阵H便是一个确定的矩阵,因此训练SLFN就转化为计算Hβ=T的最小二乘解问题。
2 指标体系构建及综合评价的实现
2.1 评价指标及标准
鉴于国内外水资源及其开发利用综合评价指标体系及分级标准的多样性与复杂性,本文参考相关文献[5,17-21],根据水资源全属性内涵,结合评价和实践需要[5],利用层次分析法构建适用于长江流域水资源开发利用综合评价的指标体系和分级标准,将评价分为目标层A、准则层B和指标层C 3个层次,如表1所示。目标层A主要用于综合评价水资源开发利用状况;准则层B用于反映水资源及其开发利用的内部协调性,分别由水资源系统、水资源开发利用系统、水生态系统、水环境系统、经济社会系统和水资源供需状况系统6部分构成,它将水资源及其开发利用的各个方面有机地结合在一起;指标层C反映水资源及其开发利用综合评价中各个准则层的具体指标,由反映水资源系统等准则的20个评价指标组成,它是水资源及其开发利用综合评价的基础。建立适用于长江流域水资源开发利用综合评价的标准和尺度,将水资源开发利用综合评价各指标分为11等级,从1到11级依次递减,即1级表示水资源开发利用潜力最大,11级最小,其余相互对应,由此组成各指标的评价标准,再按隶属原则将各指标量化分级,即把水资源开发利用综合评价的最大值1与最小值0之间划分为11等份(0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1),依次对应各评价等级,详见表2。
表1 长江流域水资源开发利用综合评价指标体系
2.2 综合评价的实现
2.2.1 指标数据标准化处理
为了消除表2中各评价指标不同量纲对评价结果的影响,需对评价指标数据进行标准化处理。对开发利用率、用水模数等指标值越大对水资源开发利用综合评价越不利的指标,采用最大最小法进行数据归一化处理,公式为
经过标准化处理后,数据处于[0,1]区间之内,有利于网络训练。
2.2.2 训练样本及检验样本设计
为不失一般性,采用随机内插的方法在各评价分级标准阈值及各隶属度间生成20个样本,随机选取15个样本作为训练样本,5个作为检验样本,以此计算共随机内插得到220个样本,其中165个作为训练样本,55个作为检验样本。为使各评价指标具有相同的权重,依据表2,规定以各评价指标上限的2倍和下限的0.5倍(极大与极小值)作为上下限值对各指标进行标准化处理。
2.2.3 网络训练及性能评价
以表1中各评价指标作为输入向量,即输入层神经元个数为20个;以各等级对应的隶属度作为输出向量,即输出层的神经元数为1个,构建20输入1输出的评价模型。采用ELM和RBF、BP神经网络对上述随机内插得到165个训练样本和55个检验样本进行评价。网络在训练过程中常出现“欠拟合”和“过拟合”两种状态,会降低网络的泛化能力。网络“欠拟合”表示模型无法完全探测到复杂数据集中的信号,使得训练达不到预期的评价或预测精度;网络“过拟合”表示模型会将信号连同噪声一起进行拟合,使得模型“记住”了训练样本的信息而使网络泛化能力降低,得不到理想的评价或预测精度[9,22],基于此,本文选用决定系数 R2、平均绝对误差δMAE、均方根绝对误差δRMSE、平均相对误差δMAPE和均方根相对误差δRMAPE共5个统计学指标分别对模型的训练及检验样本进行评价,当训练样本、检验样本的各统计学指标相近时认为模型具有很好的泛化能力和预测精度。决定系数R2在[0,1]区间内,越接近 1,表明模型的性能越好;δMAE、δRMSE、δMAPE以及δRMAPE值越小,表明模型的性能越好[9]。统计学指标计算公式如下:
表2 长江流域水资源开发利用综合评价指标分级标准
由于ELM只需在确定激励函数的情况下选择隐含层节点数,参数确定过程较为简单。选取Sigmoid为激励函数,采用循环训练算法确定当ELM隐含层神经元个数为20时网络有着较好的评价精度和泛化能力;RBF神经网络评价模型人为调节的参数少,只有一个阈值,程序同样采取循环训练算法,最终确定RBF神经网络评价模型的SPREAD和期望误差分别为1和0.001时,网络达到较好的评价精度和泛化能力。传统BP神经网络评价模型采用目前较为普遍的Kolmogorv定理确定隐含层神经元数,利用逐步增长法或逐步修剪法确定最终神经元数为21,预测模型结构为20-21-1,隐含层和输出层传递函数分别采用logsig和 purelin,训练函数采用traingdx,期望误差为0.001,最大训练轮回为5000次时BP神经网络评价模型达到了较好的评价精度和泛化能力。由于训练样本和检验样本是采用随机内插生成,因此模型每次运行结果均不一样,本文采用随机运行10次的平均值作为ELM评价模型及RBF和BP神经网络评价模型的对比实验结果,以此来评价模型性能的优劣。对比实验结果见表3。
表3 评价模型对比实验结果
3 长江流域水资源开发利用综合评价
3.1 流域概况
长江为我国的第一大河流,长江流域是我国水资源丰沛地区之一,地处我国中南部,位于24°30′~35°45′N、90°33′~ 122°25′E 之间,流域面积约180万km2。长江流域水系发育,主要有金沙江水系、岷沱江水系、嘉陵江水系、乌江水系、洞庭湖水系、汉江水系、鄱阳湖水系和太湖水系。近年来,由于长江流域内水资源的持续开发利用,水污染、水土流失等环境生态问题不断突显,对水资源的开发利与管理保护造成不良影响。因而探寻简便、高效的评价模型对长江流域水资源开发利用综合评价具有重要意义[5]。2006年长江流域及主要水系水资源开发利用评价指标统计结果见表4。
表4 2006年长江流域及主要水系水资源开发利用综合评价指标
3.2 评价结果及分析
利用ELM评价模型对2006年长江流域及主要水系水资源开发利用进行综合评价,并对表2中水资源开发利用综合评价等级临界值进行模拟计算,将模拟计算结果作为划分长江流域及主要水系水资源开发利用评价等级的依据,并采用“潜力大”等适当语言对评价等级进行定性描述,结果见表5和表6。
表5 ELM评价模型对水资源开发利用综合评价等级临界值模拟结果及描述
表6 2006年长江流域及主要水系水资源开发利用综合评价结果
分析表5和表6可以得出以下结论:
a.ELM评价模型对长江流域及主要水系水资源开发利用综合评价等级为4~8级,处于有潜力至失衡之间,符合长江流域及主要水系水资源开发利用现状,可为长江流域的水资源开发利用与管理保护提供参考依据。ELM评价模型从定性和定量两方面评价长江流域及主要水系水资源开发利用状态,从评价结果可以看出,本文所研究建立的ELM评价模型和评价方法是合理可行的。
b.从模拟结果及评价等级上看,太湖水系水资源开发利用已呈饱和状态,处于8级,即失衡状态,具体受开发利用率、用水模数、污径比、地下水利用指数以及人均缺水量等指标的影响较大,说明太湖水系在水资源开发利用、水环境及生态、水资源供需方面存在诸多问题;洞庭湖及鄱阳湖水系水资源开发利用综合评价等级均为6级,处于基本平衡状态,水资源开发利用已具有相当规模,主要受用水模数、单方水GDP产值、耕地灌溉率以及缺水边际损失等指标的影响较大,表明洞庭湖及鄱阳湖水系在用水效率等方面存在问题;长江流域及其余各水系水资源开发利用综合评价等级为4、5级,处于有潜力状态,表明尚有开发利用潜力,其中水资源开发利用最具有潜力的是乌江水系。
4 结语
构建了符合长江流域水资源开发利用现状的综合评价指标体系和分级标准,基于ELM算法原理,构建ELM评价模型及传统BP、RBF神经网络对比模型。采用随机内插的方法在各评价分级标准阈值间生成训练样本和检验样本,选用决定系数R2、平均绝对误差δMAE等统计学指标对各评价模型的拟合精度和检验精度进行评价及比较。在达到预期的拟合精度和泛化能力后将ELM评价模型应用于水资源开发利用综合评价中,有效解决了此类综合评价中难以获取足量的训练样本以及由于“欠拟合”与“过拟合”降低网络泛化能力的问题,对长江流域及主要水系水资源开发利用进行了综合评价,获得较理想的评价效果,表明ELM评价模型可在具有评价、分级标准或不具有评价、分级标准的各种资源环境综合评价中推广应用。
[1]金菊良,洪天求,王文圣.基于熵和FAHP的水资源可持续利用模糊综合评价模型[J].水力发电学报,2007,26(4):22-28.(JIN Juliang,HONG Tianqiu,WANG Wensheng.Entropy and FAHP based fuzzy comprehensive evaluation model of water resources sustaining utilization[J].Journal of Hydroelectric Engineering,2007,26(4):22-28.(in Chinese))
[2]陈进,黄薇.河流健康评价理论及在长江的应用[M].武汉:长江出版社,2010.
[3]尹志杰,管玉卉,胡晓雪.区域水资源可持续利用系统评价的集对分析模型[J].水资源保护,2010,26(4):28-33.(YIN Zhijie,GUAN Yihui,HU Xiaoxue.Set pair analysis model for assessment of regional water resources sustainable utilization system [J].Water Resource Protection,2010,26(4):28-33.(in Chinese))
[4]许新宜,王红瑞,刘海军,等.中国水资源利用效率评估报告[M].北京:北京师范大学出版社,2010.
[5]金菊良,王文圣,洪天求,等.流域水安全智能评价方法的理论基础探讨[J].水利学报,2006,37(8):918-925.(JIN Juliang,WAN Wensheng,HONG Tainqiu,et al.Theoretical basis of intelligent evaluation methods of watershed watersecurity[J].JournalofHydraulic Engineering,2006,37(8):918-925.(in Chinese))
[6]崔东文,郭荣.基于GRNN模型的区域水资源可持续利用评价:以云南文山州为例[J].人民长江,2012,43(5):26-31.(CUI Dongwen,GUO Rong.Evaluation of sustainable utilization of regional water resources based on GRNN neural network model:case of Wenshan Prefecture of Yunnan Province[J].Yangtze River,2012,43(5):26-31.(in Chinese))
[7]崔东文.基于BP神经网络的文山州水资源承载能力评价分析[J].长江科学院院报,2012,29(5):9-15.(CUI Dongwen.Evaluation and analysis of water resources carrying capacity in Wenshan Prefecture based on BP neural network[J].Journal of Yangtze River Scientific Research Institute,2012,29(5):9-15.(in Chinese))
[8]崔东文.RBF与GRNN神经网络模型在河流健康评价中的应用:以文山州区域中小河流健康评价为例[J].中国农村水利水电,2012(3):56-61.(CUI Dongwen.RBF and GRNN neural network model in the evaluation of river health[J].China Rural Water and Hydropower,2012(3):56-61.(in Chinese))
[9]施彦,韩力群,廉小亲.神经网络设计方法与实例分析[M].北京:北京邮电大学出版社,2009.
[10]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:theory and applications[J].Neurocomputing,2006,70(1/2/3):489-501.
[11]FENG G,HUANG G B,LIN Q P,et al.Error minimized extreme learning machine with growth of hidden nodes and incremental learning[J].IEEE Transactions on Neural Networks,2009,20(8):1352-1357.
[12]ZHU Q Y,QINAK,SUGANTHANPN,etal.Evolutionaryextreme learning machine[J].Pattern Recognition,2005,38:1759-1763.
[13]HUANG G B,LEI C,SIEW C K.Unievrsal approximation using incremental constructive feedforward networks with random hidden nodes[J].IEEE Transcations on Neural Network,2006,17(4):879-892.
[14]HUANG G B,ZHU Q Y,SIEW C K.Extreme learning machine:a new learning scheme of feedforward neural networks[C]//Proceedings of the International Joint Conference on Neural Networks.Budapest:[s.n.],2004:985-990.
[15]HUANG G B,SIEW C K.Extreme learning machine with randomly assigned RBF kernels[J].International Journal of Information Technology,2005,11(1):16-24.
[16] HUANG G B,LIANG N Y,RONG H J,et al.On-line sequential extreme learning machine[C]//Proceedings of the IASTED International Conference on Computational Intelligence.Anaheim,CA,USA:Acta Press,2005:4-6.
[17]左东启,戴树生,袁汝华,等.水资源评价指标体系研究[J].水科学进展,1996,7(4):367-373.(ZUO Dongqi,DAI Shusheng,YUAN Ruhua,et al.Study on the water resources assessment indexes system[J].Advances in Water Science,1996,7(4):367-373.(in Chinese))
[18]高彦春,刘昌明.区域水资源开发利用的阈限分析[J].水利学报,1997(8):73-79.(GAO Yanchun,LIU Changming.Limit analysis on the development and utilization of regional waterresources[J].JournalofHydraulic Engineering,1997(8):73-79.(in Chinese))
[19]刘恒,耿雷华,陈晓燕.区域水资源可持续利用评价指标体系的建立[J].水科学进展,2003,14(3):265-270.(LIU Heng,GENG Leihua,CHEN Xiaoyan.Indicators for evaluating sustainable utilization of regional water resources[J].Advances in Water Science,2003,14(3):265-270.(in Chinese))
[20]来海亮,汪党献,吴涤非.水资源及其开发利用综合评价指标体系[J].水科学进展,2006,17(1):95-101.(LAI Hailiang, WANG Dangxun, WU Difai.Comprehensive assessment indicatorsystem forwater resources and its development and use[J].Advances in Water Science,2006,17(1):95-101.(in Chinese))
[21]耿雷华,卞锦华,徐澎波,等.水资源合理配置评价指标体系研究[M].北京:中国环境科学出版社,2008.
[22]史峰,王辉,郁磊,等.MATLAB智能算法30个案例分析[M].北京:北京航空航天大学出版社,2011.
Comprehensive evaluation of water resources development and utilization in Yangtze River Basin based on extreme learning machine
CUI Dongwen(Wenshan Water Authority of Yunnan Province,Wenshan 663000,China)
In order to accurately and objectively evaluate water resources development and utilization in the Yangtze River Basin,a comprehensive evaluation index system and classification standard of water resources were determined using the analytic hierarchy method.Based on the extreme learning machine(ELM)algorithm,a comprehensive evaluation model for water resources development and utilization was built to evaluate the water resources of the Yangtze River Basin using RBF and BP neural network models as comparing evaluation model.Training samples and testing samples were generated using the random interpolation method to train the ELM comprehensive evaluation model.The results show that the evaluation grade of water resources of the Yangtze River Basin is 4 to 8,which coincides with the water resources reality.Compared with RBF and BP neural network models,the ELM comprehensive evaluation model has better evaluation accuracy and generalization ability,and has the advantages of simplicity,high accuracy,and strong generalization ability.
water resources development and utilization;extreme learning machine;RBF neural network;BP neural network;the Yangtze River Basin
TV213.9
A
1006-7647(2013)02-0014-06
10.3880/j.issn.1006-7647.2013.02.004
崔东文(1978—),男,云南玉溪人,高级工程师,主要从事水环境及水资源保护研究。E-mail:cdwgr@163.com
2012-06-06 编辑:熊水斌)