基于BP神经网络的浙江省水资源承载力状态评价
2023-12-09孙潇涵
周 丽,孙潇涵
(温州大学数理学院,浙江 温州 325035)
水资源承载力研究作为可持续发展研究和水资源安全战略研究中的一项基础课题,已成为当前水资源科学研究中的重点和热点问题.以新疆水资源软科学课题研究组1989年对新疆水资源及其承载问题进行的专项研究[1]为始点,国内学者陆续从不同角度对水资源承载力展开了大量的讨论.从概念辨析来看,国内学者对水资源承载力的认识繁杂多样[2-3];从指标体系构建来讲,水资源承载力存在两个研究层面,即当前承载状态评价和未来承载力预测[4-5];从研究方法上来说,水资源承载力研究还处于不断尝试与探索阶段,常用方法主要有常规趋势法、模糊评价分析法、系统动力学方法、多目标决策分析法、多元统计分析法等[6-11].利用人工神经网络方法[12-14]进行水资源承载力评价是近几年发展起来的一个研究热点.
浙江省一直走在我国经济和社会发展的前沿,是经济强省、科技强省,在经济快速增长的同时,对水资源的需求程度也相应增加.因此,为寻求地区社会经济的可持续发展,必须对浙江省水资源承载能力进行研究.本文探讨了BP神经网络模型在浙江省水资源承载力状态评价中的实证应用.
1 模型方法
1.1 BP神经网络模型简介
BP(Back Propagation)神经网络是一种多层前馈神经网络,按照误差逆向传播算法训练模型,是应用最广泛的神经网络.
BP 神经网络是对一组输出信号间的关系进行建模的评价方法,利用的模型主要是模拟人脑对反应外界刺激的理解.首先是依据输入的信息来建立神经元,并学习模拟来组织出相应的模型,不断地改进模型,最终使得采用模型计算得出的数据与实际结果相差不大.运用人工神经网络能够方便地记录事情在时间与空间上那些复杂的联系,而各个神经元所占的权重就能够表示这些问题的特征,这时,模型建立成功,只要将研究问题的主要特征数据放到模型中去,神经网络输出端就可输出结论,从而使问题得到很好的解决.
其数学模型为:
其中ix为输入的评判指标,w是每个评判指标所占的权重,y(x) 为预测结果.
BP 算法基本原理:利用输出后的误差来估计输出层的直接前导层的误差,再用这个误差来估计更前一层的误差,如此一层一层反传下去,就可获得所有其他各层的误差估计.BP 神经网络结构图如图1.
图1 BP 神经网络结构图
运用BP 神经网络综合评价浙江省水资源有许多优点,如该方法具有自学习与自适应的能力,容错性也极强,能够建立综合评价模型.
1.2 水资源承载力的评价模型
1.2.1 水资源承载力的分级
采用水资源承载力指数,作为浙江省水资源承载力评价的目标值,定义取值区间为[0,1].水资源承载力指数的分级没有一定标准,分3 级、4 级或5 级的都有[12-16].考虑到级别越多,后面的分级指标需要确定的分界线就越多,难度越大,本文采用4 级分级标准,承载能力共分为4 个等级,即Ⅰ、Ⅱ、Ⅲ和Ⅳ,分别对应严重超载、弱超载、基本承载、盈余承载4 个水平,具体如表1.
表1 水资源承载力状况的分级
1.2.2 指标体系的建立
影响水资源承载力的因素涉及经济、社会、环境等方面.按照科学性、代表性、可行性的选取原则,并参照以往文献[4-16],选取了以下15 个指标构成评价体系,其中正向指标有11 个,负向指标有4 个,各指标的具体分级区间如表2 所示.
表2 水资源承载力评价指标体系及分级区间
1.3 水资源承载力评价的BP 神经网络模型
1.3.1 模型搭建
本文使用3 层BP 神经网络模型.输出层对应水资源承载力指数,为1 个神经元输出.输入层包含15 个神经元,即为15 个评价指标.隐含层神经元数量对建立神经网络模型的性能影响很大,如果数目太少,网络将不能建立复杂的判断界,训练不出合适的网络,容错性差;若数目过大,会使训练时间过长,使网络的泛化能力降低,而且误差也不一定最佳,因此存在一个最佳的隐藏层节点数.对于隐含层节点数的确定,目前做法有经验公式法、反复试验法、增长法、删减法、遗传算法等.本文使用增长法,逐步增加神经元节点数目,直到模型评估指标达到满意的效果为止.
1.3.2 生成模拟样本
表2 实际上是神经网络模型的输入端的各个数据的区间段,表1 是神经网络模型的输出端的数据的区间段,它们是对应分级标准而形成的,没有真实样本.但为了得到最优神经网络模型黑箱的参数,只能把这些区间段细分,从而形成样本点,用来训练和测试模型.
对水资源承载力指数的4 个等级区间(0―0.2]、(0.2―0.5]、(0.5―0.8]、(0.8―1.0] 以及表2中15 个评价指标相应的4 个等级区间,分别以平均内插方式将区间50 等分,共产生201 条模拟样本,随机抽取其中的75%作为训练集,剩下的25%作为测试集.
1.3.3 数据预处理
构建的指标体系中,有些指标数值越大证明水资源承载力越强,为正向指标;而有些指标数值越小证明水资源承载力越强,为负向指标,在实际运用中,由于各指标之间数值间存在较大差异,为了去除数据之间量纲差异,先对数据进行归一化处理,公式如下:
正向指标
负向指标
1.3.4 模型评估指标
为了评估模型的精度,常用的指标有相关系数ρ和均方误差MSE,计算公式分别为:
其中yi为真实值,yˆi为预测值.相关系数ρ表示模型输出端的真实值与预测值的线性相关程度,ρ介于-1 到1 之间,ρ越大越好.均方误差MSE 是模型输出端的真实值与预测值的误差平方的平均值,MSE 越小越好.本文在确定模型参数时,以ρ大于0.99 且MSE 小于0.01 为判断标准.
1.3.5 模型求解
先使用训练样本,借助统计软件R 的nnet 函数建立神经网络模型,输出层为水资源承载力指数y,输入层对应15 个评价指标1x―x15,中间隐含层神经元数量需要编程调参设定,运用增长法调整隐含层神经元节点数量.优选得到最终隐含层神经元数目为15 个,神经网络模型结构为15-15-1,编程软件输出的网络结构图中可以显示输入层与隐含层、隐含层与输出层之间的权重系数,他们可以体现评价指标的重要性.受篇幅所限,输出的最优神经网络模型结构图在此略去.将测试样本代入训练好的最优模型,对应的模型相关系数达到0.999,均方误差为3.05e-05,表明模型合理,具有一定适用性.
2 实证分析
对浙江省时间纵向数据和地域横向数据,分别应用上述已经训练好的BP 模型,得到相应的水资源承载力指数,进而对结果进行分析.
2.1 数据收集
根据建立的15 个评价指标,收集浙江省2006―2018 年的相关原始数据,以及2018 年浙江省11 个地市的相关原始数据.数据主要从浙江省水资源公报①参见: 2006―2018 年浙江省水资源公报[EB/OL].[2019-07-15].http://slt.zj.gov.cn/col/col1229243017/index.html.与浙江统计年鉴②参见: 2007―2019 年浙江统计年鉴[EB/OL].[2019-11-02].http://tjj.zj.gov.cn/col/col1229129212/ index.html.中获取.
2.2 计算结果
首先,将原始数据读取到R 软件中进行归一化;其次,将归一化数据输入1.3.5 节已经训练好的BP 模型中;最后,输出2006―2018 年期间的水资源承载力指数的评价值(如表3),输出2018 年各地市水资源承载力指数的评价值(如表4).评价指标与浙江省水资源承载力指数评价值(时间纵向和地域横向)的相关系数见表5.
表3 2006―2018 年浙江省水资源承载力指数评价值及等级
表4 2018 年浙江省各地市水资源承载力指数评价值及等级
表5 评价指标与浙江省水资源承载力指数评价值(时间纵向和地域横向)的相关系数表
2.3 结果分析
从时间纵向上看,2006―2018 年间浙江省水资源承载力指数都分布在区间[0.62,0.79]内,2006年指数值最低,2010 年指数值最高,都属于等级Ⅲ,呈基本承载状态,水资源承载力在2006―2008年处于稳定阶段,在2009―2012 年处于振荡阶段,在2013―2018 年呈缓慢上升趋势.综上所述,浙江省2006―2018 年的水资源承载力情况较好.
表5 中相关程度较高的前3 个评价指标分别是年降水量x3、水资源利用率x2和人均水资源量x1,这说明区域水资源方面的条件对承载力的影响最大.年降水量高的年份,人均水资源量也相对较高,水资源利用率相对较低.2006―2018 年间,2012 年浙江省降水量2 088.1 mm 是最高值,同年人均水资源量2 637.9 m3也是最高值,而水资源利用率15.4%是相对次低值;2011 年浙江省降水量1 417 mm 是最低值,同年人均水资源量1 362.3 m3也是最低值,而水资源利用率29.9%是最高值.但水资源承载力是个综合指数,还与城市化水平、人口密度等因素都密切相关.目前,浙江省水资源仍能够满足社会的发展要求,开发利用还具有较大潜力,但还是建议合理开发利用水资源,科学治理,防患于未然.
从地域横向上看,2018 年浙江省11 个地市水资源承载力指数都分布在区间[0.65,0.76]内,丽水和舟山的指数值最低,温州的最高,都属于等级Ⅲ,呈基本承载状态.若承载力指数以0.73 和0.7 为界细分,则温州、杭州、嘉兴属于第一梯队,绍兴、宁波、衢州、台州、湖州属于第二梯队,金华、舟山、丽水属于第三梯队,可见金华、舟山、丽水水资源承载力水平相对于其他地市较低.
由表5 可知,年降水量x3的相关系数0.88,远超其他评价指标的相关系数,说明年降水量对水资源承载力的影响最大.在浙江省11 个地市中,2018 年温州的年降水量最多,是2 098.8 mm,丽水的年降水量最少,是1 309.9 mm,舟山的年降水量是1 442.3 mm.
3 结论建议
本文通过构建BP 神经网络模型对浙江省水资源承载力进行了评价分析.研究表明,2013―2018 年间水资源承载力指数都分布在[0.62,0.79]区间内,指数值最低的是2006 年,最高的是2010年,都属于等级Ⅲ,呈基本承载状态,近年来有缓慢震荡上升趋势;2018 年浙江省11 个地市的水资源承载力指数都分布在区间[0.65,0.76]内,丽水和舟山的指数值最低,温州的最高,都属于等级Ⅲ,呈基本承载状态,金华、舟山、丽水水资源承载力水平相对于其他地市较低.年降雨量是浙江省水资源承载力的最主要的影响因素.目前浙江省水资源承载力良好,有一定的开发潜力,当然还要合理开发治理,加强环境保护,促进水资源可持续发展.
针对浙江省的水资源承载力状况,本文从4 个子系统角度提出以下建议:以提高用水效率为核心,采取相对强硬措施,治理水体污染,建立健全水污染的法规制度和惩治方法;适当控制人口规模,以便控制人均水资源量,在制定和倡导相应政策时考虑各方面的承载力;加快制定和完善工业节水的法规和政策,规范工业用水,鼓励工业节水和废水利用等;推进技术创新,如发展人工降雨、雨水等大气降水的收集技术等,帮助减轻供水压力,解决因时间和空间地理分布不均导致的水资源短缺情况.
实证研究中发现评价指标选取的合理性以及评价指标的分级区间对最终评价结果都有较大影响.因此,如何选取指标突出评价结果是超载现象,是值得今后进一步深入研究的方向.