APP下载

基于时间窗的智慧工地扬尘监测数据异常检测研究

2022-11-04南京城市建设管理集团有限公司韦勇陈铭通讯作者河海大学计算机与信息学院河海大学项目管理研究所徐淑芳

中国建设信息化 2022年19期
关键词:监测数据离线监测

文|南京城市建设管理集团有限公司 韦勇 陈铭;通讯作者:河海大学计算机与信息学院/河海大学项目管理研究所 徐淑芳

1.背景

建设项目的施工阶段是项目全生命周期内资源流动和项目管理行为最为活跃的阶段[1]。目前,建设工程施工现场的管理仍存在许多问题,为解决这些问题,政府及相关企事业单位出台了许多政策和标准,其中,应用智慧工地强化建设项目信息化管理就是一种关键方法。在智慧工地产生了丰富数据资源的推动下,对建设工程的监管开始从线下监管向线上监管转变,研究人员开始探索基于海量传感器数据进行数据分析,替代传统的人工监测的方法。

施工扬尘是城市空气污染物的主要来源,采取更加有效的方法针对施工现场的扬尘排放进行管控,对改善城市空气环境质量至关重要。近年来,我国建筑业稳步发展,工程规模不断扩大,2021年我国建筑业企业房屋施工面积157.55 亿平方米,比2020年增长5.41%[2],建设工程的快速发展带来的负面影响是日趋严重的环境问题。针对此问题,政府及相关企事业单位颁布了相关法律法规。例如,《大气污染法》中针对建设工程,指出建设单位应该将防止扬尘污染的费用列入成本决算中,并在施工承包的合同中明确施工单位的扬尘治理责任。

基于此,本文以施工过程中的扬尘监管为例,通过自动化的数据监测手段将施工现场扬尘监测信息实时传输给监管平台,通过数据驱动的方式检测出异常的扬尘数据序列,进而诊断监测设备的故障,实现对智慧工地扬尘监测设备的在线巡检,以降低监管方对各建设项目进行质量评价的监理成本。

2.文献综述

在监管手段变得自动化的过程中,出现许多新问题:第一,数据时效性强。传感器采集的数据一般为短时间内产生的海量实时数据,这些数据以时序数据的形式储存,数据量大且时效性强;第二,数据质量差。施工现场由于人为、环境和设备故障等问题,采集的数据往往存在各类异常情况。针对这些新问题,急需一种适用于建设工程领域数据且时间复杂度低的时序数据异常检测模型,以提高数据质量,完善监管手段。

时间序列(Times Series)异常检测广泛应用于各个特定领域,例如工业界设备检测[3]、网络安全[4]、医学诊断[5]等场景。不同应用场景的数据特点不同,因此需要选用适配的检测方法[6]。国内外异常检测方法种类根据基本检测原理大致可以分为六种,即基于统计、距离、密度、分类的异常检测。基于统计的异常检测方法,假设待检数据服从于某种分布,然后用数据集去拟合分布模型,将明显不符合拟合模型的数据判断为可能的异常数据。该方法效率高、复杂度低,泛化能力一般;基于距离的异常度量方法是通过最近邻来定义异常值,假设异常点的k 近邻距离要远大于正常点的近邻距离。适用于数据量较小的无监督异常检测场景;基于密度的异常检测方法将邻点的“距离”概念进一步转化为“领域”,该方法适用于密度不同的集群情况;基于分类的异常检测方法将异常检测看作异常和非异常的二分类问题,可以使用有监督或无监督的学习方法解决二分类问题。

虽然学术界针对时间序列异常检测问题已经有了多种解决办法,但结合工程管理领域知识和建设工程施工数据集的特点,仍然没有可以直接应用于建设工程领域的异常检测方法。本文以建设工程的扬尘监管为例,利用数据可视化和异常特征挖掘的方法,识别出三种最常见的扬尘监测数据异常模式。使用滑动窗口的方法处理传感器时序数据,以时间窗为最小的异常检测单位。通过监测异常子序列,标记该子序列的异常类型,从而追踪产生该序列的设备,进一步定位到该建设项目,实现基于领域知识和数据驱动相结合的施工过程中扬尘在线监测方法。

3.问题描述

3.1 相关定义

定义2(多维时间序列):D 表示一个包含K 条具有相同时间点的时间序列S 的集合,称为K 维时间序列,记作

定义4(基于滑动窗口的时间窗):滑动窗口是一种基于双指针的一种思想,左指针tleft和右指针tright指向的元素之间形成一个窗口[sleft,sright)。滑动窗口长度记作size,滑动步长记作slide。

3.2 方法概述

N 市智慧工地监管平台是一个对该市建设项目进行管理的信息综合门户。通过建立公开的数据接口标准,集成各项应用系统数据,以物联网、云计算等技术为载体,用来可视化、数字化映射真实施工现场。该监管平台接入了2000 多个建设项目,项目数量多,人工巡检的可行性和准确率都十分低下。因此,本文从监管应用的视角出发,构建基于时间窗的扬尘数据异常检测模型,具体检测流程如图1所示。

图1 基于时间窗的扬尘监测数据异常检测流程图

本文提出的基于时间窗的智慧工地扬尘监测数据异常检测包括设备离线异常检测、设备恒值异常和设备数值过低异常三种类型。

(1)设备离线异常包括设备长时离线和短时离线。设备长时离线是指一个建设项目中的设备 在检测的时间段内无数据;短时离线是指一个建设项目的设备组ε 在检测的时间段内有数据,但存在一个时间窗[sleft,sright),在该时间窗内,扬尘监测数据为空。

(2)恒值异常是指一个时间窗[sleft,sright)内,扬尘数据波动极小,不符合施工现场扬尘排放特征。经过反复实验,本文定义时间窗的方差低于3 为异常。

(3)数值过低异常是指在一个时间窗[sleft,sright)内,扬尘数据数值全部低于某个最低阈值。

4.基于时间窗的扬尘监测设备离线检测分析

每个建设项目包含一个设备组ε,该设备组包含不少于一个扬尘监测设备。若设备存在至少一种异常特征,则将该设备标记为异常,并标注具体异常类型;若某一建设项目包含至少一个异常设备,则标记该项目,最终将检测结果返回给智慧工地监管平台。

扬尘监测设备离线检测包括两种离线情况:(1)该项目对应的设备组ε 为空,即设备全接入异常;(2)项目对应的设备组ε 不为空,但设备采集的扬尘时序数据S=在一个时间窗[sleft,sright)内为空,即数据传输异常。

根据设备离线判断条件:(1),判断ε是否为空。如果设备组ε 为空,则将该建设项目标记为离线异常;(2),遍历设备组ε,使用窗口长度为60 分钟的滑动窗口,以10 分钟为滑动步长读取扬尘序列S,当时间窗内的数据满足离线异常条件时,对该项目进行离线异常标记。

算法1.离线异常M1检测方法

将上述检测算法写成Python 程序,对所选207 个建设项目进行检测,异常结果信息中包括项目信息、建设、施工、监理、运维单位信息、扬尘设备信息和异常类型等19 个特征。分析检测结果,如表1所示,共 92 个项目存在设备离线问题,对比人工线下检测结果,人工与程序检测存在四个项目的检测结果不一致,

表1 离线异常检测结果

5.基于时间窗的扬尘监测数据恒值检测分析

算法2.离线异常M2检测方法

将上述算法编写成Python 程序,对207 个项目的设备检测数据进行分析。分析结果,共 98 个项目存在扬尘数据恒值异常问题,M2异常表现为一个时间窗内的扬尘监测数据波动范围极小。至少有一个设备被标记为M2异常时,对该项目进行标记,得到检测结果如表2所示。

表2 恒值异常检测结果

6.基于时间窗的扬尘监测数据异常低值检测分析

本文结合施工现场周围扬尘国控点监测值和相关政策性文件,将数值过低异常的判断阈值设置为20,即当长度为60 的时间窗内全部数据小于20 时,且非雨雪天时,标记为数值过低异常。

算法3.离线异常M3检测方法

将上述算法编写成Python 程序,对207 个项目的设备检测数据进行分析。分析检测结果,共 83 个项目存在扬尘数据恒值异常问题,M3异常表现为一个时间窗内的扬尘监测数据低于最小阈值。

7.结论及管理启示

7.1 结论

监测设备巡检是建设工程质量监管施工过程管理的关键步骤,智慧工地的应用推动了人工巡检向在线巡检的转变。本文从建设工程在线监管视角出发,以高准确率和低复杂度为优化目标,构建基于时间窗的扬尘监测数据异常检测模型。检测模型以一个时间窗内的子序列为异常检测最小单位,根据子序列的异常类型对产生数据子序列的设备进行异常标记,从而追踪该设备的建设项目,将异常信息追加到建设项目信息中。扬尘设备巡检问题和建设项目施工过程的监管问题转换成基于时间窗的监测数据异常性判断问题,减小了监管成本和时间,拓宽了监测数据的利用维度,有广阔的应用前景。在研究过程中,有以下几点创新:

表3 数值过低异常检测结果

(1)提出基于数据驱动的建设工程监管手段。对于建设工程施工扬尘排放的数据监测系统设计和开发研究较多,但是对于监测的海量时序数据如何利用,以及如何评判数据质量情况研究较少。因此本文改变传统研究视角,致力于检测异常数据,追踪异常设备情况,从数据驱动的角度进行改善建设项目监管现状。

(2)定义了3 种扬尘监测数据异常特征。通过调研N 市某智慧工地监管平台中的207 个在建项目,归纳出三种扬尘监测数据异常模式,针对每种异常模式制定了时间复杂度较低的异常检测方法,在实际应用中检测效果良好。

(3)构建了3种扬尘异常数据检测算法。在方法改进方面,查询待检数据时优化了数据库访问方法。将多条指令合并为一条,设置适当的临时存放表,输入待检序列的起始时间一次性将数据读取到临时表中,减少了数据库的访问次数。异常检测的最小单位为一个时间窗,有效排除了偶然因素造成的单个点异常对检测准确性的影响。

7.2 管理启示

(1)政府部门

政府部门是建设工程的主要外部监管方,需要根据建设工程特点制定相应的约束规则以规范施工行为。通过本文构建的扬尘数据异常检测框架,可以使政府监管部门在智慧工地监管平台直观量化看到施工现场的扬尘排放异常性,进而判断监测设备的异常性,对该设备对应的项目进行重点监管。应用本文构建的基于时间窗的智慧工地扬尘数据异常检测方法,可以对扬尘数据质量进行初步评价,是政府制定激励制度的重要数据支撑。将政府高耗能的人工监管向线上监管转变,节约了政府监管成本,缓解了政府信息不对称的困境。

(2)建设单位

建设单位在智慧工地监管体系中需要严格控制各类接入设备的质量,通过人工检测设备质量耗时耗力。因此,基于数据分析的方法对扬尘监测设备的数据进行质量评价,可以限制不同品牌的设备接入成本来控制设备接入的质量,对于异常频发的设备品牌,应限制其接入施工现场。应用本文构建的基于时间窗的智慧工地扬尘数据异常检测方法,通过检测扬尘序列的异常性,进而对该设备接入的项目进行施工质量评价,督促相关施工方进行整改,实现建设方基于数据驱动的线上监管手段。

(3)施工单位

施工方是施工现场过程管理的直接责任人,施工方在建设工程中处于信息优势地位,将其监测数据接入智慧工地监管平台,可以减少其机会主义,规范施工行为。扬尘监测不仅涉及施工质量,而且不规范的排放可能会殃及施工周边环境,需要施工方采取及时的控制手段。传统的通过建设方抽检再通知施工方进行整改的方法不适用于扬尘监测,扬尘的不规范排放对环境造成的负面影响在一定程度上是不可逆的。因此,施工方通过智慧工地监管平台的扬尘异常性监测结果,可以直观看到不符合排放标准或排放异常的项目信息和设备信息,在建设方责令整改前进行整改,保证了控制措施的时效性和有效性。

猜你喜欢

监测数据离线监测
陆地生态系统碳监测卫星发射成功
基于卷积神经网络的离线笔迹鉴别系统
气囊测压表在腹内压监测中的应用
基于 WSN 的隧道健康监测研究
新版Windows 10补丁离线安装更简单
浅谈环境监测垂直管理的优势
学习监测手环
好进难出 应对迅雷“口袋战”
环保验收监测异常数据的分析与处理探讨
离线发文件 不是会员也能用