基于支持向量回归机的城市用水量预测研究
2017-07-15刘文高立慧
刘文++高立慧
摘要:对城市的用水量进行准确的预测,能够合理规划城市给排水系统。选取用水人口、居民可支配收入、生活水价三种因素作为影响因子,基于MATLAB构建了一种支持向量回归机(Support Vector Regression, SVR)的城市年用水量预测模型。MATLAB仿真结果表明,基于SVR的城市年用水量预测模型训练集的决定系数为0.990、均方误差为0.0043;测试集决定系数为0.978、均方误差为0.0043。该模型能够有效的对城市的年用水量进行预测,对降低供水电耗具有实际参考价值。
Abstract: The urban water consumption is accurately predicted and the urban water supply and drainage system can be planned reasonably. Based on MATLAB, this paper constructs a city annual water consumption forecasting model based on Support Vector Regression (SVR), which uses three factors including water supply population, residents disposable income and living water price as influencing factors. The results of MATLAB simulation show that the decision coefficient of the training set of urban water consumption forecasting model is 0.990, the mean square error is 0.0043, the test set is 0.978 and the mean square error is 0.0043. The model can effectively predict the annual water consumption of the city, which has practical reference value for reducing the power consumption of water supply.
關键词:用水量;支持向量回归机;预测模型;MATLAB;性能评价
Key words: water consumption;support vector machine for regression;forecasting model;MATLAB;performance evaluation
中图分类号:TU991.31 文献标识码:A 文章编号:1006-4311(2017)22-0059-03
0 引言
随着我国城市化进程的进一步加快、城市范围的扩大、城市人口的增加以及人民生活水平的不断改善,对水资源需求量的增长幅度也越来越大[1-3]。用水量是城市供水管网系统中的一个关键问题,城市中的供水不足或供水水压过大是由对需水量的估计不准造成的[4-6]。因此,对城市用水量进行预测研究具有相当重要的意义。20世纪90年代,May等人将水价、人口、居民人均收入等作为影响因子,建立的中长期用水量与影响因子间的回归模型用于美国Texas州的用水量预测中,取得了很好的效果[7];2002年,Brekke,Levi等人用逐步回归法进行用水量预测,其优点在于模型建立时间短,效率高[8];2001年,哈尔滨工业大学的兰洪娟、袁一星运用人工神经网络建立预测模型,并将模型应用于天津的月用水量预测中[9];2009年,安徽理工大学的何忠华等人建立了城市需水量的改进的BP神经网络预测模型,给出了模型的求解算法,并对规划年作出预测[10]。
本文以华北某市作为研究对象,采用支持向量回归机建立城市用水量预测模型,选取用水人口、居民可支配收入、生活水价的数据作为样本数据,利用支持向量回归机对城市年用水量进行建模分析,并评价预测模型的性能。仿真结果表明,模型能够有效地对该城市年水量进行预测。
1 基于SVR的城市年用水量预测模型
支持向量回归机是用于解决回归问题的支持向量机。支持向量机应用于回归拟合分析时,其基本思想不再是寻找一个最优分类使得两类样本分开,而是寻找一个最优分类面使得所有训练样本离该最优分类面的误差最小,SVR基本思想示意图参见图1。
SVR是建立在支持向量机的原理上的,广泛用于预测、异常检测等领域,与其他模型算法相比,优点是不会受到样本的影响而陷入局部最优解[11]。在样本量比较少的情况下也能获得较好的效果,因此本文选择了支持向量回归机,SVR的结构参见图2。
由图2可知,输出是中间节点的线性组合,每个中间节点对应一个支持向量。SVR预测模型采用决定系数R2和均方误差E作为评价SVR预测模型性能的参数,其决定系数函数如式(1)所示:
(1)
式(1)中, R2为决定系数;N为测试集样本个数;yi(i=1,2,3,…,N)为第i个样本的真实值;■i(i=1,2,3,…,N)为第i个样本的估计值。
其误差函数如式(2)所示:
■(2)
式(2)中,E为均方误差;yi(i=1,2,3,…,N)为第i个样本的真实值;■i(i=1,2,3,…,N)为第i个样本的估计值。
在式(2)中,将每个样本中输出变量y的数值大小考虑进去,在城市年用水量预测过程中,实际用水量范围非常大,运用公式(2)的误差函数,能够避免拟合结果的不均匀,即避免了被测量变量较大的样本拟合程度非常好,但是被测量变量较小的样本拟合的程度却非常差的情况。在训练结束后,每个样本的拟合误差都相对较小,因此能够使每个样本都能得到较好的拟合。基于SVR城市年用水量预测模型基本思想是以用水人口、居民可支配收入、生活水价的数据作为输入样本训练集的数据,通过训练数据选择合适的SVR模型参数,构建预测模型,输入测试数据对模型进行性能评价,选取最佳预测模型。城市年用水量预测模型算法流程参见图3。
2 实验研究
为了对所提城市年用水量预测模型的有效性进行验证,本文以具体数据,进行实验研究。本文选取华北某市作为研究试点,选取2000年到2014年的15组样本数据以及对应的年用水量,其样本变化曲线如图4所示。
选择前12个样本数据作为训练集,用于模型训练及参数选择,剩余的4个样本数据作为测试集,用于预测结果的对比分析。基于SVR的城市年用水量预测模型训练完成后,训练集仿真结果参见图5。
运用式(1)中给出的相关系数和式(2)中给出的误差系数的计算方法,得到预测模型的训练集测试的相关系数为0.990,均方误差为0.0043,放电量与用水人口、居民可支配收入以及生活水价具有很强的相关性。样本训练值与真实值之间的对比参见表1。
由表1可知,所选择的12组样本值的预测模型的训练误差最大为0.093,精度在3%以内,因此该预测模型的建立是比较成功的。
为了对该模型进行性能评价,对测试集的4个样本数据进行测试,测试集仿真结果参见图6。
运用式(1)中给出的相关系数和式(2)中给出的误差系数的计算方法,得出:基于SVR的城市年用水量测试集相关系数为0.978,误差系数为0.0043。基于SVR的城市年用水量预测值与实际值的曲线趋势基本一致。五组样本测试值与真实值之间的对比参见表2。
由表2可知,所选择的4组样本值的预测模型的测试误差最大为0.073,精度在3%以内,因此,使用该方法预测城市年用水量是可行的。
3 结论
城市年用水量预测对城市供水管网系统管理具有重要的意义,本文基于SVR构建了城市年用水量预测模型,仿真结果表明,基于SVR的城市年用水量预测模型训练集和测试集的决定系数分别为0.990和0.978,均方误差分别是0.0043和0.0043,此模型的年用水量预测值与实际值的曲线趋势基本一致,能够有效地对城市年用水量进行预测,也提供了一种有效的城市年用水量预测研究方法。
参考文献:
[1]傅金祥,马兴冠.水资源需求预测及存在的主要問题探讨[J].中国给水排水,2002,18(10):27-29.
[2]冯琨,张永丽,戴沂伽.基于因子分析的BP神经网络对成都市需水量的预测[J].四川环境,2011,30(2):125-130.
[3]Liu Q, Zhao Z, Li Y X, et al. A Novel Method of Feature Selection based on SVM[J]. Journal of Computers, 2013, 8(8).
[4]张雅君,刘全胜.需水量预测方法的评析与择优[J].中国给水排水,2001,17(7):27-29.
[5]Wang H Y, Fang M A, Yang K, et al. A study of information renewal GM (1,1) model for predicting urban medium and long-term water demand[J]. Journal of Wuhan University of Hydraulic & Electric Engineering, 2004, 37(6):32-35.
[6]聂相田.水资源可持续利用管理不确定性分析方法及应用[M].黄河水利出版社,1999.
[7]L W Mays et al. Water Demand Forecasting. Hydro system Engineering and Management. 1992:24-32.
[8]Brekke, Levi,Larsen, Milton D, Ausburn, Mary, Takaichi, Lynn. Suburban Water Demand Modeling Using Step wise Regression. AWWA. 2002:1994(10):108-112.
[9]兰宏娟.城市用水量预测模式及其应用的研究[D].哈尔滨:哈尔滨工业大学,2001:10-48.
[10]何忠华.城市需水量的预测研究[D].安徽理工大学,2009.
[11]曾虎,李川,李英娜,等.联合高频脉冲与超声波信号的局放估计[J].传感器与微系统,2016,35(8):37-39.