基于FCM-LVQ网络模型的疏勒河流域水安全评价
2021-04-23靳春玲逯晔坤朱桂勇
王 婧,靳春玲,贡 力,2,逯晔坤,朱桂勇
(1.兰州交通大学 土木工程学院,甘肃 兰州 730070;2.兰州交通大学调水工程及输水安全研究所,甘肃 兰州 730070;3.水利部海河水利委员会引滦工程管理局,河北 迁西 064309)
1 研究背景
21世纪以来,我国社会已经牢固树立起保护生态文明的观念。祁连山脉作为我国西部重要的生态安全屏障及生物多样性保护优先区域[1],近些年来生态安全问题层出不穷,在社会上引起了广泛关注。疏勒河流域作为祁连山脉内流水系的一部分,其水安全问题直接影响着祁连山脉整体的生态安全,因此,对疏勒河流域水安全进行评价研究,对祁连山脉生态治理具有积极意义。
针对疏勒河流域水安全问题,我国学者已取得部分研究成果。如潘竟虎等[2]通过建立遥感综合评价模型对疏勒河流域生态系统质量进行了评价研究,得出疏勒河流域2001-2010年生态质量处于较低水平;柳思等[3]通过EES模型建立了疏勒河土地生态安全评价指标体系,结合熵权物元模型计算得到2005-2014年疏勒河流域土地安全状况仍然存在恶化风险;周苏娥等[4]对甘肃省河西地区自然-社会系统的脆弱性进行了定量研究,结果得出疏勒河流域脆弱性最高,并提出自然适应能力、社会经济敏感性、自然敏感性和自然暴露度是影响脆弱性的关键因素;岳东霞等[5]运用遥感技术和GIS技术,对疏勒河流域近20年的生态承载力和生态需水量进行了分析,得出疏勒河流域生态承载力与生态需水量呈正相关的关系。这些研究成果不仅为祁连山脉内陆水系水安全评价提供了可参考的模型及方法,同时也表明疏勒河流域水安全问题仍然并将长期存在,需要通过后续不断地研究进行改善。
目前,运用学习向量量化(learning vector quantization,LVQ)网络模型进行区域水安全评价研究的文献较少,本文在既有研究的基础上,通过建立祁连山脉水安全评价指标体系,运用模糊C-均值聚类(fuzzy C-means algorithm,FCM)算法优化后的LVQ网络模型对疏勒河流域水安全等级进行了评价,并与传统神经网络的评价结果进行了对比。FCM-LVQ网络模型不仅可以避免指标权重分配等人为因素的干扰,而且其结构简单,运行速度快,对难以进行模式分类的变量也能取得比较满意的结果,因此相比其他传统评价方法[6-9]更加简单易行。
2 数据来源与研究方法
2.1 研究区概况
祁连山脉地处于青海省东北部及甘肃省西部边界地区,是我国境内主要山脉之一,也是西北地区重要的生态蓄水中心,其生态安全直接关系到西北地区生态系统的稳定。山脉自西北向东南走向由多条平行山脉与宽谷组成,海拔4 000~6 000 m,面积约2 062 km2。疏勒河是河西走廊三大内陆河之一,发源于祁连山脉西段,总体地势东高西低,生态环境较为脆弱。流域气候类型为内陆干旱性气候,在这一气候条件下流域内普遍发育的地带性土壤为棕漠土,植被主要为温性荒漠植被类型。流域面积约为41 300 km2,年平均降水量约为47~63 mm,年蒸发量为2 897~3 042 mm,年平均气温为6.9~8.8 ℃,年水资源总量为11.34×108m3,其中:地表水资源总量为10.82×108m3;不重复的地下水资源总量为0.52×108m3。由于历史原因造成的河西走廊断陷,使得走廊低洼、盐碱聚集、荒漠化严重。结合近年相关研究表明,疏勒河流域仍然存在着天然植被萎缩、草场退化、水土流失等一系列问题,需要进一步进行治理和完善。
2.2 数据来源
为保证研究数据真实有效,本文样本数据取自《甘肃省水资源公报》《甘肃省水利发展统计公报》《甘肃省城乡统计资料汇编》《酒泉市统计年鉴》等资料。通过统计各评价指标2013-2019年的数据作为测试数据,应用训练好的FCM-LVQ网络模型得到疏勒河流域水安全评价结果。
2.3 水安全评价指标体系及等级划分标准
2.3.1 水安全评价指标体系 目前,国内外还没有形成一套通用的水安全评价指标体系,指标体系的合理构建直接关系到水安全评价结果的合理性与准确性。为了能更好地反映出祁连山脉内流水系水安全状况,本文在结合祁连山脉生态问题及疏勒河自身环境问题的基础上,参考相关论文[10-13]及规范[14],从水环境、水生态、水监管、水治理4个方面建立了环境-生态-监管-治理模型用于构建内陆河流域水安全评价指标体系。得到环境安全和生态安全(各5个评价指标)及监管安全和治理安全(各4个评价指标)共18个评价指标的水安全评价指标体系,具体评价指标及计算方法如表1所示。
表1 疏勒河流域水安全评价指标
2.3.2 评价指标等级划分标准 结合国家相关标准及文献资料[6-8]可知,安全级别常常被划分为以下5个等级:非常安全、安全、基本安全、不安全、非常不安全,可分别用Ⅰ级、Ⅱ级、Ⅲ级、Ⅳ级、Ⅴ级表示。参考相关规范[14]及地区发展规划要求值,结合前人研究成果[10-13],得到各指标等级划分标准,如表2所示。
表2 疏勒河流域水安全评价等级划分标准
2.4 研究方法
2.4.1 模糊C-均值聚类算法(FCM) 模糊C-均值聚类[15]是根据模糊理论对数据进行聚类分析和建模的方法,通过对样本类属的不确定性描述,客观反映数据间的类属关系。其核心是通过将基于某种范数及聚类原型的目标函数最小化来达到数据分类的目的。设X={xj}(j=1,2,…,n)表示样本集合,V={vi}(i=1,2,…,c)表示聚类中心,U={uij}为指标隶属度矩阵,其中n为样本个数,c为最优聚类数目。FCM算法具体步骤[16-17]如下:
(1)由于聚类数目关系到最佳聚类结果,而依据人为经验设定聚类数目的方法过于笼统,因此本文通过信息熵[18]来确定最优聚类数目c,当聚类数目划分合理,数据点对某一类隶属度越大时,则该类隶属和非隶属的信息熵之和H(k)就越小,即公式(1)的计算结果越小。
(1)
式中:k=cmin-1,当聚类数目k从最小值cmin增加到最大值cmax时,会产生cmax-cmin+1个H(k)值,其中最小的H(k)值所对应的聚类数目k即为最优聚类数目c。
(2)设定最优聚类数目c及模糊指数m;初始化聚类中心V(0);设置收敛精度ε>0;令迭代次数l=0。
(3)设dij=‖xj-vi‖表示样本点xj到聚类中心向量vi的距离,根据公式(2)修正指标隶属度矩阵U(l+1)。
(2)
(4)根据公式(3)计算聚类中心V(l+1),然后令迭代次数l=l+1。
(3)
(5)重复步骤(4),直到符合如下条件:
‖V(l)-V(l-1)‖≤ε(l≥1)
(4)
2.4.2 LVQ神经网络模型 LVQ神经网络[19]是根据事先指定的目标分类结果,通过在网络中的监督学习来完成对输入矢量的准确分类,其模型结构如图1所示。由图1可见,LVQ神经网络有竞争层和线性层两个网络层,网络层的每一个神经元的输出均与一个分类(子分类或目标分类)结果相对应,竞争层在网络学习中,得到S1类子分类结果;然后通过线性层再将S1类子分类结果分成S2类目标分类结果(S1>S2)。
图1 LVQ神经网络模型结构
LVQ网络算法[20-22]的计算步骤如下:
(1)设输入向量为x=(xj)T(j=1,2,…,n),wij为输入向量层神经元j与竞争层神经元i之间的权值,初始化权值wij及学习速率η(η>0)。
(2)根据公式(5)计算竞争层神经元与输入向量间的距离di,S为竞争层神经元个数。
(5)
(3)选择最小di值的竞争层神经元,将与其相连接的输出层神经元的类别记为Ci。
(4)记输入向量对应的类别为Cx,神经元i对应类别为Ci,若Cx=Ci,则神经元i、j根据公式(6)进行权值修正,否则,根据公式(7)进行权值更新。
(6)
(7)
2.4.3 FCM-LVQ网络模型 采用FCM-LVQ网络模型对流域水安全进行评价的具体流程可用图2水安全评价模型建立流程图来表示。首先,对训练样本集通过FCM聚类将评价样本划分为不同类别,结合专家打分法对指标再次筛选获得新的评价样本,将这一经过处理的样本数据作为输入矢量在LVQ神经网络中进行训练,达到训练精度要求后通过仿真模型验证训练效果。然后,对测试样本集进行数据处理(方法同训练样本集),利用训练好的LVQ网络获得最终的水安全评价结果,并与传统评价模型进行对比,以验证评价模型的适用性。
图2 水安全评价模型建立流程图
FCM-LVQ网络模型能够避免指标样本数据的冗余,提高LVQ神经网络的训练速度,同时能够防止数据降维过程中重要指标丢失,使评价结果与实际情况更相符。
3 结果与分析
3.1 FCM聚类分析
(1)对表2中的水安全评价各指标阈值采用插值法进行划分,设定每两组样本数据对应水安全评价的1个分类级别,根据表2中的5类水安全分类级别,则可获得10组插值数据,从而构成初始样本矩阵P。
(2)根据前文2.4.1节中信息熵原理,得到信息熵H(k)随聚类数目k的变化趋势如图3所示。由图3可知,当k=2时熵值最小,因此,最优聚类数目c取值为2。
图3 信息熵H(k)随聚类数目k的变化趋势
(3)设最大迭代次数为200,目标函数的终止容限设为1×10-6,利用MATLAB中的zscore函数对样本矩阵P进行标准化处理,再利用MATLAB中的fcm函数进行聚类分析,得到的聚类中心矩阵V及隶属度矩阵U如下:
(4)对聚类结果进行再分析,结合专家打分法从两类聚类样本中筛选出最重要的评价指标构成新的样本数据,最后形成如下10组用于实际LVQ网络训练的样本矩阵P′。
3.2 LVQ神经网络训练
(1)将得到的训练样本矩阵P′作为神经网络的输入向量,与其对应的水安全级别作为训练样本的输出向量C=[1 1 2 2 3 3 4 4 5 5],利用MATLAB中的ind2vec函数将其转化为网络目标向量,再利用newlvq函数建立神经网络,其中:竞争层神经元个数取为10,学习速率设为0.01,10组数据每两两输出一个等级,各级分类百分比为20%。
(2)在建立的神经网络中输入样本数据,可得到如图4所示的输入向量及初始网络权值,再通过MATLAB中的train函数对神经网络进行训练,在达到精度要求后停止训练,可得到输入向量及训练后的权值如图5所示。从图5中可以看出,训练后的权值向量已经具有了基本的模式分类能力。
图4 输入向量及初始权值
图5 输入向量及训练后权值
(3)为了检验训练完成后神经网络的网络性能,利用MATLAB中的sim仿真函数仿真训练样本,将得到的仿真结果与期望输出值进行比较,结果如表3所示。由表3可以看出,仿真输出等级与期望输出等级完全一致,说明该网络模型已经达到训练要求。
表3 输入样本的仿真检验
(4)对测试数据进行分类分析后作为输入矢量,在训练好的LVQ神经网络中进行水安全等级评价,评价结果利用MATLAB中的vec2ind函数转化为最终的目标向量。另外,分别使用LVQ网络模型及BP网络模型对疏勒河流域水安全等级进行评价(限于篇幅,具体计算未在此列出),将FCM-LVQ网络模型最终预测结果与LVQ网络模型及BP网络模型预测结果进行比较,结果如表4所示。
表4 3种模型对疏勒河流域水安全等级评价结果对比
4 讨 论
(1)由表4可知,训练完成后的FCM-LVQ网络模型能够对测试数据进行准确地等级评定。从各年份评价结果来看,2013年疏勒河流域存在的不安全因素较多,评价结果为Ⅳ级,表现为不安全;2014-2016年存在一定的不安全因素,评价结果为Ⅲ级,表现为基本安全;2017-2019年存在的不安全因素较少,评价结果为Ⅱ级,表现为安全。研究时段内流域水安全状况整体呈逐渐上升的趋势,这与疏勒河流域生态治理效果是相符的,也说明了该模型对疏勒河流域水安全评价结果的正确性。
(2)对比表4中3种评价模型所得出的评价结果可以看出,FCM-LVQ网络模型得到的评价等级有Ⅱ、Ⅲ、Ⅳ 3种级别,LVQ神经网络和BP神经网络得到的评价等级只有Ⅱ、Ⅲ两个级别,说明FCM-LVQ网络模型评价结果等级划分更加细致,评价结果更为精确。同时,在网络运行中,FCM-LVQ网络模型呈现出了更好的鲁棒性和容错性,也证明其优于BP神经网络。
(3)对比表4中FCM-LVQ网络模型与单纯使用LVQ神经网络的评价结果可以发现,2013和2017年两种模型的评价结果有所不同,且表现为FCM-LVQ网络模型评价结果等级划分更加明确。分析其原因可能是LVQ神经网络本身无法对样本数据进行降维处理,样本数据的冗余对LVQ神经网络的评价结果精度形成了干扰,使得最终评价结果精度不高。
(4)流域水安全保护是一项复杂且庞大的系统工程,涉及到多个区域及多个行业的共同合作,其终极目标是保护水资源、预防水污染、改善水环境以及修复水生态。目前,流域水安全评价已从最初的定性评价逐步发展为定性与定量相结合进行评价[23-27],本文从疏勒河流域整体安全状况出发,采用FCM-LVQ网络模型对该流域水安全进行评价,根据评价结果判断,得出疏勒河流域水安全状况逐步好转,说明近年来对疏勒河流域的治理是有效的,应当继续保持并根据实际情况加以完善。
综上可知,运用FCM-LVQ网络模型对疏勒河流域水安全进行评价取得了良好的评价效果,结合近年来疏勒河流域生态恢复情况可知,采取正确的环境应对措施解决流域内目前存在的水安全问题,对保证流域内生态可持续发展及祁连山脉的生态安全具有积极意义。
5 结 论
(1)本文从内陆河流域存在的主要生态问题与环境问题出发,通过环境-生态-监管-治理模型构建了内陆河流域水安全评价指标体系,利用FCM-LVQ网络模型对疏勒河流域水安全进行评价,得出2013-2019年疏勒河流域水安全状况呈现出稳步上升的态势,说明了当前疏勒河流域生态环境有逐步向好的趋势。
(2)FCM-LVQ网络模型无需计算评价指标权重,能够避免人为因素对评价结果的影响,且具有评价结果精度高和收敛速度快的特点。在疏勒河流域水安全评价中,FCM-LVQ网络模型评价效果明显,更优于单纯使用LVQ神经网络模型和BP神经网络模型,是一种值得推广的水安全评价模型。
(3)疏勒河流域的水安全影响着祁连山脉整体的生态安全,评价结果表明近年来疏勒河流域生态治理效果显著,这也将直接促进祁连山脉的生态安全向着更稳定的方向发展,因而应积极推行当前的生态治理措施,进一步完善管理方案,以保障流域内生态可持续发展。