APP下载

基于SARIMA模型的农村供水工程用水量实时预测

2022-04-20张恒飞成雪夫田昊梅林辉

水利水电快报 2022年4期
关键词:时间序列

张恒飞 成雪夫 田昊 梅林辉

摘要:在农村供水工程运行过程中,通过观察发现用水量呈现出一定的规律性,可将其作为水厂供水生产安排和管网运行状态检测的基础。在彭阳县农村供水工程实际监测数据基础上,对相邻数据进行了数据加权平滑处理,并进一步采用季节性自回归差分滑动平均算法进行了建模,对研究区域的用水量进行了预测。实验结果表明:农村供水工程中的用水数据的确具有周期性的变化规律,在消除周期性并进行一阶差分后序列满足平稳条件。运用SARIMA算法预测的结果,与实际数据对比误差较小,且满足在线实时计算的条件,可作为农村供水工程调度和检测的依据。

关键词:农村供水; 用水量预测; SARIMA; 加权平滑; 时间序列

中图法分类号:TU991.31 文献标志码:A DOI:10.15974/j.cnki.slsdkb.2022.04.007

文章编号:1006 - 0081(2022)04 - 0042 - 04

0 引 言

从中国供水发展的历程来看,首先解决的是城市地区集中供水的问题,偏远的城镇和农村地区长期采用河湖、水窖、地下水等分散取水方式。近年来,政府大力提升农村安全饮水条件,建成1 100万处農村供水工程。农村供水工程点多、线长、面广的特点突出,与城市供水形成显著差异,也带来了跑冒滴漏严重、运行管理困难等现实问题[1]。随着物联网技术的兴起,农村供水领域的监测问题找到了解决途径[2-4]。陇通输水东干农村供水工程对系统输配水管道压力、流量情况进行无线监测[5];对农村供水管网监测的布设也被纳入研究[6];绍兴市农村供水采用了分区计量等手段,加强对农村供水管网的漏损控制[7]。

在城市供水水量预测方面,黄传连等[8]提出了利用时间序列三角函数分析法进行用水量预测,体现了用水量增长趋势和周期性变化。丁祥等[9]提出基于灰色马尔科夫模型的天津市供水总量预测,提高了对波动性较大序列的适应性。刘洪波等[10]提出利用小波神经网络的方法对城市供水管网水量进行预测,提高了预测精度。由于农村集中供水的建设时间尚短,尤其是农村供水监测的实施近几年刚刚兴起,故农村供水规律及用水量预测等相关研究处在起步阶段。

通过农村供水工程运维过程中对用水量监测数据的观察,发现其呈现出一定的规律性。而用水量规律的发现可以为供水系统的生产安排提供依据,也能够为管网运行状态的实时在线诊断提供基础。

季节性差分自回归滑动平均模型(Seasonal Autoregressive Integrated Moving Average,简称SARIMA模型),是当前常用的时间序列预测分析方法之一,被广泛应用在经济社会各领域的预测场景中[11-14]。SARIMA模型率定计算快速,具备自学习能力,非常适合在线实时预测分析。而农村供水工程用水量是长时段的时间序列,且理论上不受过多外部因素的影响,满足SARIMA模型对平稳性的要求。

1 用水量数据获取及预处理

以彭阳县“互联网+农村供水”工程为例,供水自动化测控体系利用无线物联网技术,实现从源头到龙头全过程计量监控,为农村供水用水量的获取提供前端感知基础,为后续规律发现和预测提供数据保证。

(1) 水源地监控。包括余氯、浊度、pH值、水温、电导率等指标。

(2) 水厂监控。包括取水流量、管道压力、管道流量、阀门开度、水池水位、水质监测、机组运行状态、视频监控等,其中水质包括余氯、浊度、pH值、水温、电导率等指标。

(3) 泵站监控。包括泵站机组运行状态、管道压力、累计流量、阀门开关、设备状态、信号强度等指标。

(4) 调蓄水池监控。包括水池水位、供水阀门开关状态、设备状态、信号强度等指标。

(5) 管网监控。包括管道压力、累计流量、设备状态、信号强度等指标。

(6) 入户监控。包括水表当前读数、水表阀门状态、水表状态、信号强度等指标。

本文实验所用片区的流量数据采集频率为15 min一次,原始采集指标为累积流量。鉴于该片区大口径流量计量设备是以m3为单位,因此将原始采集数据处理为以小时为单位的水量数据,以降低计量误差带来的影响。

2 用水量数据平稳性检验

在统计分析中,用按时间顺序排列的一组变量来表示一个随机事件的时间序列。对于一个选择ARMA方法进行建模的时间序列,首先必须满足平稳性。在现实生活中,时间序列是很难满足严、平、稳的要求,一般所讲的平稳时间序列在默认情况下都是指宽平稳时间序列,即:

均值为常数:

[EXt=μ,∀t∈T]                           (1)

方差为常数:

[DXt=γ(t,t)=γ(0),∀t∈T]                  (2)

自协方差函数和自相关系数与时间无关:

[γ(t,s)=γ(k,k+s-t),∀t,s,k∈T]                (3)

对时间序列的平稳性检验包括构造检验统计量法和图检法两种,本文分别采用增广迪基-福勒检验单位根的方式来完成定量检验,同时输出时序图和自相关图进行直观判断。

对经过预处理的供水量数据直接进行平稳性检查,结果如图1所示,可见其自相关图没有收敛到距离0较近的范围内。

经过分析认为,该时间序列存在明显的季节性变化,即每24 h有较为明显的变化规律,应对其进行周期为24 h的去季节性处理。对处理后的数据再进行平稳性检验,结果(图2)显示自相关系数仍存在一定的规律性。

因此,在季节处理基础上增加了差分处理,再对其进行平稳性检验,结果(图3)表明时间序列的自相关系数和偏自相关系数均收敛至较低的水平,且不存在较强的规律性。

3 SARIMA模型参数计算

在验证了时间序列经过季节和差分处理能够满足平稳性要求后,进入SARIMA建模阶段。SARIMA(p,d,q)(P,D,Q,s) 的结构参数有7个:p 表示自回归模型的阶,指当前值与前p个值有关;d为差分计算的阶,指时间序列经过d阶差分达到稳定状态;q为滑动平均模型的阶,指当前值与前q个误差有关;P表示季节性自回归的阶;D为季节性差分计算的阶;Q为季节性滑动平均的阶;S为单季节周期长度。

根据稳定性分析结果,目测SARIMA模型应选取的参数如表1所示。

经计算,模型SARMAX(5,1,1)(1,1,1,24)的赤池信息准则AIC为511.551。模型预测结果(图4)的平均绝对误差为7.37%,处于较低水平,即模型预测能力较好。

观测法给出了一个粗略的估计,用程序在给定的参数范围内进行优选,优选的目标是模型的AIC最小。模型参数优选范围如表2所示。

根据 AIC 最小原则进行调参,最后得出的最优参数为SARMAX(4,1,1)(1,1,1,24),AIC为511.474。模型预测结果(图5)的平均绝对误差为7.32%,比目测观察的参数预测效果略有提升。

4 结 语

本文以彭阳县“互联网+农村供水”工程某片区实测用水量数据为例,对数据进行了基于滑动加权平均和小时内用水量累加的预处理,使时间序列数据能够相对准确地反映用水实际情况。在此基础上,对时间序列的平稳性进行检验,通过去日季周期性以及一次差分的操作使时间序列满足平稳性要求,也验证了用水量不易被外部因素干扰的判断。通过观察和程序自动优选,完成SARIMA模型建模和预测。实验证明,农村供水工程用水量的SARIMA模型具有较好的预测能力,且具备在线实时预测的条件。后续研究拟在本文建立的SARIMA模型基础上,进一步实现管网运行状态的在线检测和预警。

参考文献:

[1] 林佳楠. 阜新市农村饮水安全现状分析与对策[J]. 水利技术监督,2019,147(1):78-79,206.

[2] 韦应堂,魏凯,蒋晓云. 物联网及专家决策系统在黑石灌区的应用[J]. 水利规划与设计,2020(2):74-78.

[3] 潘悦. 基于复杂事件处理的供水漏失监测系统研究[D]. 杭州:浙江理工大学,2015.

[4] 陈振亚. 应用物联网构建供水计量监测系统模型的实践[J]. 给水排水,2013(6):111-115.

[5] 余琴琴. 无线传输技术在农村饮水安远系统中的应用[J]. 农业工程,2018,8(11):39-42.

[6] 马月坤,杜尧,陈金水,等. 农村供水管网监控资源调配模型及求解方法[J]. 节水灌溉,2016(5):110-112.

[7] 丁亮. 南方地区农村供水管网漏损控制的应用研究[J]. 给水排水,2018,44(6):115-118.

[8] 黄传连. 基于时间序列挖掘的城市供水控制系统研究[J].  科技经济市场,2013(10):19-20.

[9] 丁祥,王彤. 基于灰色马尔科夫模型的天津市供水总量预测[J]. 供水技术,2021,15(5):1-5.

[10] 刘洪波,张宏伟,闫晓强. 城市供水管网水量预测的小波神经网络方法[J]. 天津大学学报,2005,38(7):636-639.

[11] 任爽,崔海波.  SARIMA时序分析在税收预测中的应用——以贵州省为例[J]. 湖北大学学报(自然科學版),2021,43(1):80-85.

[12] 郭静利,董渤. 基于SARIMA模型的国际稻米价格预测[J]. 价格理论与实践,2019(1):79-82.

[13] 李斌,胡德秀,杨杰,等. 基于MLR-SARIMA模型的土石坝位移预测[J]. 工程科学与技术,2019,51(2):108-114.

[14] 郑秀国,杨娟,钱婷婷,等. 近十年上海蔬菜价格的SARIMA分析与预测[J]. 上海农业学报,2020,36(6):138-141.

(编辑:唐湘茜)

Real-time forecast of water consumption in rural water supply projects based on SARIMA model

ZHANG Hengfei1,2, CHENG Xuefu1, TIAN Hao1, MEI Linhui1

(1. Changjiang Survey, Planning, Design and Research Co. Ltd., Wuhan 430010, China; 2. National Dam Safety Engineering

Research Center, Wuhan 430010, China)

Abstract: In the operation of rural water supply projects, it was observed that water consumption showed a certain regularity. This regularity could be used for the arrangement of water supply production of water plant and detection of the operation status of pipe network. Based on the actual monitoring data of rural water supply projects in Pengyang County, we took weighted smoothing method to pre-process adjacent data, and further adopted seasonal auto-regressive differential moving average algorithm to predict the water consumption in the study area. The experimental results showed that the water consumption data in rural water supply projects was periodical. Time series data became stable with eliminating periodicity and performing a first-order difference. The mean absolute error of forecast result was low using SARIMA model. The method proposed in this paper met the conditions of online real-time calculation, which could be used for the dispatch and detection of rural water supply projects.

Key words:rural water supply; water consumption measurement; SARIMA; weighted average smoothing; time series data

猜你喜欢

时间序列
基于分布式架构的时间序列局部相似检测算法
基于嵌入式向量和循环神经网络的用户行为预测方法
医学时间序列中混沌现象的初步研究
基于时间序列分析南京市二手房的定价模型
基于Eviews上证综合指数预测
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于组合模型的能源需求预测