基于PSO-SVR模型的再生水利用潜力预测分析
——以河北省为例
2020-08-27余鹏明管孝艳陈俊英
余鹏明, 管孝艳, 陈俊英
(1.中国水利水电科学研究院 水利研究所, 北京 100048;2.西北农林科技大学 水利与建筑工程学院 旱区农业水土工程教育部重点实验室, 陕西 杨凌 712100)
随着国民经济的飞速发展,水资源短缺已经成为众多地区经济发展的瓶颈[1]。再生水具有水质稳定、水源可靠、既节约天然水资源又能净化污水等优点, 成为缓解水资源供需矛盾的重要途径之一[2-3]。国务院出台《水污染防治行动计划》对再生水利用进行专门规定,到2020年,京津冀区域再生水利用率不低30%,在国家提出大力开发非常规水资源的背景下,开展再生水开发利用潜力预测研究具有重要的现实意义[4]。
国内外学者对再生水开发利用潜力进行了较多的研究。有学者对欧洲的再生水利用潜力进行了预测研究,认为地中海地区再生水具有较大的利用潜力[5];Anane等[6]同时考虑技术,社会,经济和环境方面因素,基于GIS并结合模糊综合评价法对突尼斯Nabeul-Hammamet区域再生水最佳灌溉地点进行进行评价研究;Adapa[7]对澳大利亚再生水利用的因素进行研究,结果表明再生水利用与社会经济福利有关。Li等[8]基于IGES对天津市再生水利用进行研究,并认为该市存在着管网不够完整、再生水使用标准化不够完善等问题。再生水开发利用指标方面,李娟芳等[9]运用灰色关联度分析法确定洛阳市再生水综合发展敏感指标,包括GDP、工业总产值、生态环境用水量、污水处理水平等经济社会指标,并进行分级评价;吴梦烟等[10]综合再生水利用过程中的风险和技术等方面因素,建立了再生水综合发展指标评价体系;杨侃等[11]考虑到经济、社会、生态、水资源等多方面因素,选取新增自来水供水量、地下水替代量、景观生态用水量等17个指标,运用物元分析法建立再生水综合发展评价模型,对云南省进行评价并取得了较好的效果。再生水定量预测方面,汪妮等[12]对城市再生水需水量预测进行研究,分别使用灰色GM(1,1)模型和定额法对西安工业再生水需水量和市政杂用再生水需水量进行预测,确定了再生水发展规划同再生水需求的匹配程度。张志科[13]对影响农村生活用水量的因素进行研究并对水量进行预测,其研究思路可为再生水利用量预测提供参考。吴秋琴等[14]和唐莲等[15]对西安市沣庆湖的再生水生态环境需水量和银川市再生水用于工业、生活、城市杂用等类别进行了定量研究,其结果不能反映再生水量的动态变化情况。城市水资源量预测方面,王春娟等[16]建立了基于主成分分析的BP神经网络水资源需求量预测模型,其中人口、GDP、万元GDP用水量等5个指标为敏感指标;李小芳等[17]建立了城市污水量的灰色马尔可夫预测模型,以天津市为实例进行了预测分析。
综上所述,国内有关再生水利用潜力的定量研究较少,多集中于再生水利用发展的定性评价、经济效益价值评价以及风险的研究。本文以河北省再生水利用量为例,在综合分析河北省再生水开发利用现状的基础上,构建了基于PSO-SVR的再生水开发利用量预测模型,预测了2020年和2025年河北省再生水利用量和利用潜力,以期为制定河北省“十四五”水资源规划和再生水利用政策提供参考依据。
1 河北省再生水开发利用现状分析
据《中国城市建设统计年鉴》统计,2017年河北省再生水利用量为4.02亿m3,污水处理总量为16.23亿m3,再生水利用率为24.77%。河北省再生水利用量仅次于北京、山东和江苏,位居全国第四,再生水利用率也位居全国前列。
河北省污水处理总量基数较大且逐年增加,可以保证良好的再生水水源供给。近三年再生水利用量和利用率逐年增加,如图1—图3所示。这表明河北省再生水利用的数量和水平都有较好的发展。
图1 再生水利用量变化情况
图2 污水处理总量变化情况
图3 再生水利用率变化情况
2017年河北省人均用水量为242.3 m3,仅高于北京、天津、山东和山西四个省(直辖市);万元GDP用水量为53 m3/万元,近年来逐年下降;用水人口逐年增长且增幅逐年增加。如图4所示。图4表明,河北省用水节水水平较高,公民节水意识较强,用水需求较大,有利于开展再生水利用工作。
图4 用水状况变化情况
河北省再生水利用相关投资如表1所示。排水设施投资、污水处理投资和再生水利用投资额逐渐增加,并且在市政公用设施投资中所占比重逐渐增加。其中,污水处理投资增幅最大,2017年为13.02亿元,较2014年增加了2.65倍。
表1 再生水利用相关投资状况
政策方面,2018年2月出台的《河北雄安新区规划纲要》要求推进再生水等非常规水资源利用,用水分类分质供应;雄安新区拟建成于2020完成棚户区改造容东片区安居工程,建设38.6 km给水再生水管道及水加压泵站;自2018年10月起,河北省《大清河流域水污染物排放标准》、《子牙河流域水污染物排放标准》、《黑龙港及运东流域水污染物排放标准》三项强制性地方标准将正与京津现行标准看齐。此外,随着节水压采、黑臭水治理等环保事业的推进,再生水利用的政策支持力度不断加大,河北省再生水利用将有着巨大的发展潜力。
2 PSO-SVR算法原理
2.1 SVR原理
支持向量回归机(SVR)是以结构风险值最低和统计学习为理论的机器学习算法,通过核函数处理线性分类问题,实现高数维内积运算并增加泛化能力, 实现经验风险最低和置信范围的最小化,在小样本数据的分类及预测中具有较好的效果[18]。
对于给定的训练样本数据
{(xi,yi)xi∈Rn,yi∈Rn,i=1,2,…,m}
m是样本数量,SVR预测方程为:
f(x)=ωTK(xi,x)+b
(1)
式中:ω为权重矢量;b为阈值。K(xi,x)为核函数。常采用高斯径向基核函数:
(2)
式中:φ(x)为非线性映射;σ为核函数宽度。
由结构风险最小化得:
(3)
(4)
2.2 PSO算法原理
粒子群优化算法(PSO)是一种群体智能生物启发式进化算法,通过迭代寻优利用追索到的最优值来寻求全局最优化,具有精准度高,收敛迅速等优点。PSO 算法中优化问题的解称为粒子,它们具有位置向量和速度向量。粒子位置Xi和它的速度Vi随机选择产生。计算每个粒子的适应度函数的值,并考虑这些值更新速度和位置[19]。粒子的位置和速度计算如下:
(5)
(6)
2.3 PSO-SVR模型
当SVR的核函数选定以后,需要确定误差项惩罚参数c和核函数参数g。参数的确定方法主要有网格交叉寻优法、遗传算法和经验试算法,本研究PSO算法进行参数寻优。
PSO-SVR的运算流程如图5所示。
图5 PSO-SVR模型流程图
采用3个指标对模型的建模和验证精度进行评估:决定系数R2、均方根误差RMSE以及标准均方根误差nRMSE。R2越接近1,RMSE和nRMSE越小说明模型效果越好。其计算公式为:
(7)
(8)
(9)
2.4 数据处理与建模
使用2002年—2017年《中国城市建设统计年鉴》、《中国环境统计年鉴》及《中国统计年鉴》的实测数据对河北再生水利用量进行分析,自变量选取如表2所示。选取 2002 年至 2012 间数据作为训练样本,2013年—2017年数据作为验证样本,对各指标数据进行[0,1]归一化,消除不同量纲的影响。
本文使用MATLAB 2017 libsvm3.23工具箱建立再生水利用量PSO-SVR模型。设置模型中的种群规模参数设为20,最大迭代次数为200,学习因子c1为1.5,c2为1.7 ,惯性权重ω=1。惩罚系数c介于[0.01,100]之间,核函数参数g介于[0.01,1 000]之间,通过粒子群优化算法,搜索得到最优参数g=0.01,c=56.75。
此外,本文还建立主成分回归模型(PCR)和逐步回归模型作为对比,结果见表3。
建模集误差分析表明,PCR回归模型、PSO-SVR模型和逐步回归模型建模集的R2分别为0.86、0.93和0.94,RMSE分别为4 189、2 907和2 812,nRMSE分别为31.37%、21.77%和21.06%。PSO-SVR模型和逐步回归模型的精度较好,PCR模型精度最差。这表明SVR模型在再生水样本数据较少的情况下,能够取得理想的效果。俩个线性模型的预测效果一般,这可能和样本数量较少有关。
验证集误差分析表明,PCR回归模型和PSO-SVR模型的决定系数达到了0.9及以上,逐步回归模型的R2为0.73,相对前两者较低;PSO-SVR模型的精度误差最小,RMSE和nRMSE分别为1 872和5.16%,明显优于PCR回归模型和逐步回归模型。PCR回归模型和逐步回归模型的nRMSE分别为10.85%和9.40%,精度相对PSO-SVR模型较低。
2.5 再生水利用量和利用率预测
使用建立的PSO-SVR模型对2018年—2025年河北省再生水利用量进行预测,其中污水处理投资和污水处理费以近三年数额均值为基础,年增长率设定为20%;人均GDP增速设定为7%,其余指标使用GM(1,1)灰色时间序列法实现预测。将各个自变量指标带入模型进行计算,预测结果如图6所示。
图6 2020年—2025年再生水利用量和利用率
图6表明,2020年、2025年河北省再生水利用量预测值分别为5.45亿m3和7.48亿m3,较2017年具有较大的增幅,分别为35.93%和86.04%;2020年、2025年再生水利用率分别为30.56%和36.80%,较2017年分别提高了5.79%和12.03%,利用率年均增加1.5%。以2017年为基准,2020年和2025年河北省再生水利用潜力分别为1.43亿m3和3.46亿m3。2020年河北省再生水利用率超过了30%的规划目标。河北省再生水利用量在2018年—2025年预测区间保持高速增长,利用量年均增加0.43亿m3,再生水利用水平不断提高。
2.6 河北省再生水利用量敏感性分析
为了明确影响河北省再生水利用量的主要因素,更好地实现2020年京津冀区域再生水利用率不低于30%的规划目标,分别计算单个指标对再生水利用量影响的敏感性,如图7所示。结果表明,人均用水量对再生水利用量影响最为显著,污水处理总量、人均GDP和生产运营用水量分别次之。
图7 河北省再生水利用量影响因素敏感性分析
随着河北省公民的节水意识和用水水平的不断提高,人均用水量将不断下降,人们将逐渐接受并使用再生水,取代部分自来水用量,应对水资源短缺[20]。随着污水处理总量的增加,河北省再生水利用量也逐渐增加,这表明污水处理量是再生水处理与供给的重要基础。近年来,国内废水排放标准不断提高,污水处理与排放成本逐渐上升,大批污水处理设施进行提标改造,为污水再生利用提供了良好的设施基础,有利于再生水开发利用。如2018年9月,雄安新区将污水排放标准由过去的一级A提高至Ⅲ类水质标准。这表明河北省再生水利用的原水供给方面具有较大的发展潜力。再生水消费需要良好经济发展状况作为基础,随着人均GDP的增加,河北省再生水利用量不断增加。这表明在河北省再生水具有较大的市场消费潜力。随着生产运营用水量的增加,河北省再生水利用量不断增加。这表明,河北省再生水利用量在生产运营用水方面有着较大的需求。
综上所述,河北省再生水开发利用与用水状况因素、设施建设因素和经济投资因素指标均具有密切联系,其中用水状况因素的影响作用最大,有关部门可以对其制定更为具体的规划目标与政策。
3 结 论
本文在对河北省再生水利用现状分析的基础上,构建了基于粒子群算法-支持向量机模型的再生水利用量预测模型(PSO-SVR模型)。选取设施建设、经济投资和用水因素三个方面9个自变量指标,对河北省再生水开发利用量进行了预测分析。得到如下结论:
(1) 再生水利用量预测PSO-SVR模型的验证集R2和nRMSE分别为0.91和5.16%,能够准确地实现河北省再生水利用量的预测,模型具有较好的预测精度与泛化能力。
(2) PSO-SVR预测结果表明,2020年、2025年河北省再生水利用量分别为5.45亿m3和7.48亿m3,较2017年分别增加了35.93%和86.04%。再生水利用率分别为30.56%和36.80%,较2017年分别提高了5.79%和12.03%,将顺利实现2020年30%再生水利用的规划目标。
(3) 河北省再生水开发利用量影响因素的敏感性分析表明,人均用水量对再生水利用量的影响最为显著,污水处理总量、人均GDP和生产运营用水量分别次之,用水状况因素指标的影响作用最大。河北省再生水利用水平不断提高,再生水利用具有较大的发展潜力。