智慧排水监管平台构建与监测大数据应用
2023-11-22吴瑜灵张万辉朱思为
吴瑜灵,曹 雁,张万辉,朱思为
(1、广东省建筑科学研究院集团股份有限公司 广州 510500;2、广东建科创新技术研究院有限公司 广东 中山 528400)
0 引言
近10 年来,随着数据库技术[1]与地理信息系统(Geographic Information System,GIS)技术[2]在排水设施信息管理上的应用和推广,基于这些技术的城市智慧排水监管平台成为解决城市内涝和水环境安全问题的一个重要途径。城市智慧排水监管平台利用数据库技术将城市排水设施的基础数据、巡检排查的监管数据、以及问题审核的管理数据等不同种类数据进行统一管理[3],实现数据便捷上传、更新、储存、关联调用和导出,为资料信息数据的管理提供了极大的便利,避免了传统纸质资料管理数据实时更新难且容易遗漏和出错的问题。然而,目前常用的城市排水设施智慧化系统虽然能实现一些数据处理的基本功能,但对数据背后包含信息的解读能力却非常有限。例如,排水设施监测系统可以实现对管网各节点流量数据的监控并上传,但所传输的原始数据为单一时间点各节点的流量,单一流量值虽然能反映当前管网运行状态,却无法反应长时间段的管网运行情况,难以通过单一数据实现对排水管网的整体运行状态的有效评估。
针对这一问题,本文设计并建立了一套排水设施数据分析与解读方法,利用大数据分析,从排水设施监管数据背后挖掘更多信息,实现对监测监控重要区域的水质和水量的分析与预警,寻找监控区域水质和水量变化的数学规律,为城市内涝治理和水环境监测提供重要决策依据。本研究以广东省某市排水管网溢流口监管为对象,基于排水设施行业监管需求,采用智能感知、异构网络融合、移动互联、大数据分析等先进的信息技术搭建的智慧排水监管平台,建立大数据分析解读方法,利用大数据分析解读出的额外数据信息,实现对区域溢流的溯源、应急管理和防治。
1 智慧排水监管平台架构及功能
1.1 智慧排水监管平台整体架构
智慧排水监管平台旨在实现对排设施的有效监管,采用智能感知、异构网络融合、移动互联、大数据分析等先进的信息技术,全面感知排水数据,实现智能分析、及时响应、辅助决策。本研究的监管平台采用B/S 架构(平台架构如图1 所示),具有兼容性强、对客户端电脑负荷较小等特点,可满足排水行业主管部门对排水设施及水环境的监管需求,实现排水设施现场状况的远程监控。本监管平台包括基础设施层、数据层、支撑层和应用层,各层之间相互作用构成一个有机的整体。
⑴基础设施层:其功能为“感知”,位于物联网结构中的底层,即通过传感网络获取感知信息。感知层是物联网的核心,是信息采集的关键部分。
⑵数据层:数据通信的核心,为数据传输的主要通道,网络层主要采用NB-IoT、4G/5G等通信网络。
⑶支撑层:由物联网设备管理平台组成,实现数据的汇集与管理,为管网监测平台及其他应用平台提供专业、便捷的数据接口服务。
⑷应用层:实现排水设施综合监管、统计分析、GIS一张图、监测预警等功能。
1.2 智慧排水监管平台基本功能
基于数据的实时采集、业务远程的监管及风险的提前预判的需求,采用GIS 技术、计算机技术、物联网技术、大数据处理技术等信息化技术,搭建了统一、标准、共享的智慧排水监管平台。智慧排水监管平台建设在立体感知层部署大量信息传感设备,建设一批基于物联网技术的智慧水务传输网络,在信息处理层通过水务云实现对海量信息的汇集、处理、分析、管理和服务,在智能应用层构建水务管理信息系统,实现更加丰富、更加准确、更加人性化的信息服务,形成一个智慧高效的排水监管环境。智慧排水监管平台可解决水务管理工作中出现的信息资源不足、信息共享困难数据挖掘欠缺、应用基础薄弱等一系列问题[4]。
本平台实现综合监管、统计分析、GIS一张图、监测预警等功能模块,通过应用GIS 技术手段,对排水设施的普查数据和水质水量监测数据进行深度挖掘,分类管网拓扑问题,评估管网健康度,充分掌握排水设施的运行状况果,为用户提供资产管理、日常监控、报警信息管理、大数据分析等服务,如图2所示。
图2 智慧水务管理平台Fig.2 Smart Water Management Platform
2 城市排水设施监测数据分析与解读办法
智慧排水监管平台的基础功能可实现实时监测及时发现排水设施中的短期突发事件(如监测点污染物浓度提升,水量变化等),并实现对突发事件的预警与上报[5]。然而,实时监控仅能从表面发现问题,而无法把控排水设施长运行周期的整体运维情况,缺乏从数据背后挖掘问题出现的原因、出现的规律以及事件之间的关联能力。基于这个目的和需求,本文将推荐以下3种数据分析与解读方法实现数据分析的目标。
2.1 长时间序列周期数据
传统监控平台一般采用按小时或最多1~3 d的时间数据来展示监测结果。由于呈现的数据周期过短,受每天的特殊情况影响,很难发现数据的规律性,从而难以对数据进行解读。例如,某排放口的排水量在某一天陡增,但这个现象是偶然发生,还是周期性的反复出现,仅仅依靠短期数据难以得出结论。因此,有必要对长期的监测数据实现可视化观测与展示,从而更好地了解问题发展的规律和造成影响的大小。
2.2 历史数据累计概率分布分析
智慧排水监管平台会存储所有由基层传感器传输来的监测数值,并对其中超出预警范围的值进行预警。然而,有些时候个别监测数值虽超出了预警范围,但因其持续时间短,并不会对环境造成明显影响;更有甚者,传输设备可能也会因自身或外界环境的原因,造成某一时刻的传输值发生错误而误报一个较大的监测值,这个数值会立即触发监测设备的预警,但实际真实情况却与监测情况完全不同。因此为验证数据的真实可靠,同时分析数据的影响,有必要分析数据分布的概率以确保不是由于监测误差或短时间偶然情况造成的。
累计概率分布是用于描述变量落在任一区间上的概率[6],其概念公式为
在处理水环境历史监测数据时,x为任意监测值区间内的某值,X为对应的监测数据,P{X≤x}描述了监测数据小于x的样本概率,即当x为监测数据X中最大值时,F(x)=1;当x为监测数据X中最小值时,F(x)=0。
累计概率分布对分析数据的有效性具有很重要的作用,能明确显示数据是否具有普遍意义和对实际情况造成的真实影响,因此,累计概率分布也在水文气候[7]、海洋资源调查[8]等其他需求数据处理分析的学科有着广泛的应用。同样,累积概率分布在水环境监测数据处理分析上也有重要作用。
2.3 不同时间段的历史数据的箱型图分布分析
城市排水设施的监测数据往往具有时段性特征,其造成原因与城市工商业以及居民用水周期性有很大关系。由于不同时间段的排水量与污染物浓度都会不尽相同,将所有数据一起统计分析难免会过度概化数据,导致难以发现问题原因,无法真正找出问题的本质。例如,某污水排放口按正常排放规律为每日9:00~17:00 排放,其余时间停止工作,即除工作时间外,其余时间排放量应该为0。对于这种情况,只做以日为单位的统计很难了解污水排放口的排放趋势;而仅仅依赖时间序列数据,虽然能够掌握不同时刻的排放量,但由于缺乏对数据的概括分析,很难理解在工作时间外的排放量是属于偶然泄漏还是长期管理问题造成。因此,对不同时段的监测数据进行归纳分析,有利于发现问题的本质。
为达成分析时段数据的目的,箱型图分析是非常不错的手段。箱型图于1977 年由美国著名统计学家约翰·图基发明。它能显示出一组数据的置信上限、置信下限、中位数、上下四分位数和异常值[9]。如图3所示,置信上限、置信下限确认了数据整体的90%置信区间,超出置信区间的值可认为为偶然异常情况,由图3 中异常值点代表。中位数、上下四分位数为数据信息的基本概况,可以帮助了解数据的具体分布区间以及离散情况,辅助理解监测数据的平均特征和稳定性。中位数越大证明监测数据的整体值越大,而上下四分位数的差值越大,则证明监测数据的波动越大。
图3 箱型图框架示意图Fig.3 Schematic Diagram of Box Diagram Framework
通过箱型图分析各时段数据,可辅助统计并了解各时段排水设施运行状况是否满足要求,分析出现的问题为偶然异常情况还是频繁出现的问题,为设施运行维护的方针制定提供依据。
3 案例分析
3.1 案例背景
由于排水管线老化及承载问题,导致城市生活污水排放量较大时容易出现无法及时排出的现象,广东省某市一些污水井口易存在部分时段溢流的问题。由于溢流污水未经处理,所含污染物浓度较高,若溢流出来直接进入江河湖泊,将直接影响自然水体的水质。因此,需要极力避免污水井的溢流[10]。然而,由于城市排水管线更新维护成本巨大,且短期内实现改进并不现实。为了解溢流情况,以方便对溢流情况进行监管,某市采用本研究的智慧排水监管平台,对若干溢流口的水质、流量参数进行全天候实时监测。当管线中流量超过荷载时,多余污水会由溢流井口溢出,位于井口的流量计和液位计即可捕捉此时的流量和液位数据,传输到数据库进行储存并对超标流量进行预警。同时,位于管底的水质监测设备则会对污水水质进行实时传送,分析发生溢流时水质的影响。
3.2 监测数据分析
本文所用于分析的数据来自某市两个溢流口的实时监测流量数据。数据由该市溢流口智慧化数据监测平台获得,为每分钟采集一次的实时传输数据。本次数据分析截取某市溢流口2022 年10 月份全部数据,排除系统自行维护所损失的统计点,每个流量口共44 000组流量采集数据。
4 结果分析
4.1 长时间序列周期数据
图4 展示了某市两个溢流口2022 年10 月份的溢流数据统计。由数据可知,从10 月1 日开始,两个溢流口均发生了较大规模的溢流事件。结合该市历史天气记录来看(见图5),10月1~3日有持续的降雨,其中1 日有持续时间的大雨,由此可推断极有可能有雨水进入了污水管线,从而造成了污水管超载并引发溢流。溢流口A 的溢流规模远小于溢流口B,在大雨降临时约为B的1/3。对于小雨,溢流口A具有更明显的可靠度,在月中不断有小型阵雨的情况下,溢流口A始终能保持基本没有溢流量。而从溢流口B 的情况来看,任意强度的降水均会造成该溢流口的溢流,且强降雨会造成该溢流口较长延后时间的持续溢流问题,需要引起足够的重视。
图4 某市溢流口10月溢流流量时间序列图Fig.4 Time Series Diagram of October Overflow Flow at An Overflow Outlet in a Certain City
图5 某市2022年10月份降水情况Fig.5 Precipitation in October 2022 in a Certain City
由此结果可知,如何防止大量雨水进入污水处理系统,可能会是解决突发性溢流事件的一项有效措施。有关部门需结合天气预报信息,尤其对于溢流口B,合理制定雨水截流工作方案,防止过量雨水经合流管进入污水系统,若如此可能会大大降低大量突发性溢流事件的发生概率。
4.2 历史数据累计概率分布分析
图6 展示了两个溢流口的溢流数据累计概率分布。由结果可知,溢流口A 的溢流情况基本上均为突发性偶然事件,在整1 个月的监测中,有95%以上的统计数据显示溢流口A 无溢流量,且偶然溢流量的整体溢流值不大,超过1 000 m3/h 的流量出现的频率接近0。因此,宏观上来看,溢流口A 的溢流情况不算严重,仅需注意一些对溢流有影响的外界事件(如降雨),即可实现对溢流口A溢流情况的合理管理。
图6 某市溢流口流量累计概率分布Fig.6 Cumulative Probability Distribution of Overflow Outlet Flow in a City
相比而言,溢流口B的溢流情况较为严峻,由图6⒝可以看出,溢流口B 发生溢流的频率超过20%,即在1个月的时间内,有超过6 d的时间在发生溢流,基本可以推断除偶然突发事件造成溢流外,溢流口B很可能存在常规周期性溢流。突发性偶然事件的溢流量较大,约5%的统计数据显示溢流量超过3 500 m3/h,即便持续时间短,也有可能因较大流量造成较为严重的污染。
综上所述,结合溢流流量累计概率分布来看,对于溢流口A 的管理,有必要调研溢流口A 偶然排放的原因和相关联事件(如降雨),针对这些事件,结合溢流口A 的排放量可取得不错的管理效果。而对于溢流口B的管理,除应注意偶然事件影响外,还需注意周期性常规排放的影响,有必要调查周期排放的原因。
4.3 不同时间段的历史数据的箱型图分布分析
图7展示了两个溢流口在不同时间段的溢流值分布情况,该箱型图统计了两个溢流口一个月的溢流数据,以每2 h为一个时间段(即0:00~2:00,2:00~4:00,一直到24 时)展现溢流情况的分布。其中图7⒜进一步证实溢流口A 的溢流情况为偶然情况,由图7⒜可以看出,在各个不同时段,溢流口A 的统计箱型区间均为0,超过0 的值均以异常值的情况表现出来,即在任意时间段,出现溢流的情况均不多见。然而,存在一个问题是溢流口A 的异常溢流值分布在各个时间段分布相对均匀,并不明显的受时段影响,因此,这些异常值的产生理应与城市居民排水的周期变化无关,应该为随机偶然事件造成。考虑到月初的持续性降水覆盖一天整个时段,这些均匀分布的异常值极有可能与该次降水有关。
图7 某市溢流口不同时段流量箱型图分布统计Fig.7 Distribution Statistics of Flow Box Diagram at Overflow Outlets of a City at Different Time Periods
而对于溢流口B,可以看出溢流值在22:00 至次日2:00 存在明显的溢流情况,其中以0:00~2:00 最多,其溢流流量中位数超过500 m3/h,即在这2 h中,每天的溢流总量中位数会超过1 000 m3,这已经形成具有相当规模的周期性排放。因此,要管理好溢流口B的溢流问题,需要调查清楚溢流口B 对应管线在每日0:00~2:0超载的原因,如何做好该时段管线流量的截流与控制,是缓解溢流口B溢流问题的关键。
4.4 结果分析总结
结合上述数据统计的分析,本文对该市两个溢流口的问题分析汇总如表1 所示。可知,两个溢流口均存在因偶然事件引起的溢流问题,造成偶然溢流的可能原因是降雨后雨水进入污水管道从而造成污水管中水量超出承载上限,但同样不排除其他偶然原因,这需要进一步实地调查。
表1 某市溢流口数据分析结果汇总Tab.1 Summary of Analysis Results of Overflow Port Data in a City
溢流口B 相较溢流口A 不仅溢流量更大,而且在每天凌晨存在周期性溢流,对周边水域生态环境造成持续破坏。因此对于溢流口B,急需查明每天凌晨持续溢流的原因,制定合理的截流措施,保证溢流口B附近水域的生态环境质量。
本次分析从数据的角度出发,分析溢流口溢流的原因并提出可能假设和对应处理建议。虽然数据分析结果不能作为确定原因和问题的直接证据,但是可以为组织实地问题调研提供一定的思路和依据,帮助决策者制定调研方案,辅助决策从而明确解决问题的方式方法以及缩短探索方式方法的时间,并以此提高工作效率。
5 结语
本文结合某市两个溢流口的流量监测实例,通过长时间溢流时间序列、溢流量累计概率分布以及时段流量概率分布分析,发现了溢流情况与降雨存在的数据关系,并对两个溢流口的溢流性质进行了判定。其结果表明,降雨造成的大量雨水进入污水系统可能是造成两个溢流口产生偶然性溢流的直接原因。降雨过后,两个溢流口存在不同程度的溢流量增加,其中溢流口B 短时间溢流量增加量更大,约为溢流口A 的3 倍。除了偶然性溢流以外,溢流口B 还存在周期性溢流。在每天凌晨时段,溢流口B 会平均溢流约1 000 m3污水。因此,对于溢流口B 的溢流管理,除调查偶然溢流问题外,还需查明造成凌晨周期性溢流的原因,同时在溢流治理方面,需做好溢流口B处凌晨时段的截流和分流工作,以缓解该处管网的排污压力。
由该实例可以看出,本文所提出的数据分析方式有助于对排水设施运维过程中出现的水环境问题进行溯源分析,为问题的调查、治理提供辅助决策,方案的制定提供参考依据,为主动、精细、智慧的城市排水运行管理的新模式提供有力支撑,从而促进城市排水综合管理水平的有效提升。