APP下载

工程建设环境时序数据质量评价模型研究

2024-12-26忤丹丹梅健李明刘东岳郭嘉媛

环境科学与管理 2024年12期
关键词:智慧工地层次分析法

关键词:智慧工地;工程智慧建设;数据质量评价;层次分析法

中图分类号:X82 文献标志码:B

前言

中国十分重视数字经济、数字化转型改革的深化发展与实施落地。智慧工地作为传统工程建设方式的转型升级方向,是通过物联网、智慧管理平台实现对于工程现场的数据和信息进行收集、分析及处理,实现作业现场的协同高效管理。随着工程建设领域的信息化建设不断深入,大量数据资源不断积累,为数据分析、知识发现提供了大量的基础数据资源。但数据异常、冗余与缺失等数据质量问题也日益突出,严重影响数据的进一步应用与增值,是工程建设行业数字化升级的一大阻碍。

1研究现状

通过数据质量评价,可以发现数据中存在的问题,是提升数据质量的动力和风向标。数据质量评价研究由来已久,主要以通用数据质量研究为主。科学评价一般涉及评价模型、评价指标、评价方法和评价应用等重要方面。

贺文娇提出了基于数据质量评价的目标估计方法。利用目标数据质量评价方法,对不同传感器得到的目标数据质量进行科学、有效的测度和评价,并根据质量得分动态调整各数据源在目标估计过程中所占的权重,从而减少人工干预,提高目标估计效能。郭莉等针对以能源大数据增值服务的商业模式研究不足的现状为出发点,提出通过构建多维度数据质量评价指标体系,得出了影响能源大数据增值服务商业模式的关键因素,为统筹规划和科学实施提供参考。刘桂锋等通过文献调研和分析,依据“3W原则”,评价对象、评价体系构建视角、评价方法、评价技术等角度对相关研究进行系统梳理和内容述评。曹文章基于当下数据质量研究现状,结合工程建设业务实际,构建智慧工地扬尘监测数据质量评价体系,对智慧工地的扬尘监测数据质量进行评价。

2建设工程数据质量评价指标体系构建

2.1监测数据特征分析

智慧工地系统采用物联网技术自动采集工地现场的数据,主要包括扬尘监测、噪声监测、视频监控、车辆冲洗监测等数据。其中,扬尘监测每次采集的数据包括PM2.5、PM10、TSP(总悬浮颗粒物,空气动力学当量直径≤100μm的颗粒物)、天气、风向、风力大小等数据,该数据每分钟一条记录。扬尘监测数据的采集容易受工地环境、设备电力供应的稳定性、设备的安装位置、人为因素等因素的影响。

2.2监测数据质量评价一级指标分析

为了保证评价指标体系建设的科学性,文章首先参考中国关于数据质量评价指标的标准GB/T36344-2018,再根据各省市关于工程信息化制定的相关标准规范以及相关领域的数据质量评价的研究,得到了数据质量评价指标框架。

数据规范性:是指信息化工作需要具有统一的标准,能够与相应的数据准则接轨。

数据完整性:描述在指定业务规则要求下,数据集中应被赋值的数据元素以及数据记录的赋值程度。

数据准确性:描述属于是否与相对应的客观实体之间的特征一致。

数据一致性:描述同一数据在不同存储位置以及与特定的关联数据之间无矛盾的程度。

数据时效性:描述数据在时间变化中的正确程度。

数据可访问性:描述数据在需要时的可获取性以及有效生存周期的可使用性。

2.3监测数据质量评价二级指标分析

在相似的数据质量评价过程中,针对实际应用场景的分析对这类因素均未纳入到构建的指标体系之中,而在实际的数据收集过程中,更能够实现数据的实际情况。所以文章在构建智慧工地数据质量体系过程中,剔除该方面因素。在构建数据准确性的指标过程中,将数据的准确性转化为影响工程建设数据质量的异常类型的反向指标。最终构建基础评价体系见表1。

3智慧工地数据质量评价模型构建

对数据的基础筛选,先提出从数据的完整性、准确性以及时效性等角度进行分析。根据上述建立的模型计算得到每个评价指标的权重,并得到具体数据的得分计算。

3.1基于AHP的评价指标权重计算

此次专家调研随机抽取了本领域相关研究专家15名。问卷有效性判断主要是根据问卷填写的完整性、答案是否有明显的连续重复等规则,并以此构造判断矩阵。

首先对于专家评价结果进行数据分析,得到的一级指标与二级指标的判断矩阵一致性比率CR均小于0.1,认为判断矩阵的一致性可以接受,专家的打分比较合理,自洽程度较好,通过了一致性检验,最终得到的权重见表2。

3.2评价指标的定量计算

建立以上工程数据综合评价体系之后,选取了数据的完整性、准确性以及时序性三个层面的8个具体指标采用客观统计计算每个指标的具体得分。

其中,P1a,P1b分别从数据元素存在固定值异常比重、数据记录的完整性对数据的完整性评价。

P1a是通过遍历数据集,计算出缺失值的数量,通过具体占比计算出得分。

P1b则是先以小时为单位,将项目中同一设备的数据按记录时间进行升序排序并得到每小时的数据记录完整性得分,再进行加权平均,求出统计时间内数据记录完整性的得分。

4实证分析

4.1数据来源

文章采用的数据集是来自于N市的13个行政区内2022年9月16日00:00:00至2022年9月22日23:59:00之间工程建设项目上有效运行设备的实时监测数据。项目类型包括房建工程、市政工程、轨道工程、交通工程、水利工程以及园林工程6种。

4.2评价过程

针对于扬尘监测设备采集的数据质量的分析,从上文中划分的每个得分区间中随机抽取一组数据进行进一步分析,具体抽取数据结果见表3。

在数据完整性中,该项数据指标的平均得分为95.66分。其中以在数据元素完整性的表现较好的设备1为例,在数据采集区间内目标量为10080条,而实际采集的数据数量为10037条,达到了目标数据量的99.57%。由于施工单位工程建设现场的调整进行的设备更新,导致设备状态未进行有效更新。数据记录的完整性,则以小时为单位,考虑在每个时间段的数据量完整程度。以设备4例,其在数据采集区间内同时出现了在部分时间段数据采集过频,同时9月17日5时至9时之间未采集任何数据。因此数据元素的赋值程度较高,但是数据的记录在部分时间段出现严重缺失的现象。

在数据正确性方面,该项数据指标的平均得分为69.55分。其中数据固定值异常描述的采集的数据集异常悬停在某个数据的时间窗长度在总的时间窗的比重。如图1(b)所示,设备6采集的结果只在极小的数据范围内进行上下震荡波动。数据的重复性异常是在相同的时间点上传多次重复上传数据的占总数据量的比重,该指标下,项目设备的整体表现较好。数据相关性异常则是考察采集数据集中各要素之间的相关性,主要由无效采集导致的相关性异常。如图1(c)为设备3采集的实时采集扬尘记录值,其中PM2.5与PM10之间的相关性异常率极低,但在TSP的数据采集上,采集数据值恒为0,因此设备3在相关性评分上明显下降。数据参考性异常则是检测设备的采集数据与N市中离该设备所在项目最近气象监测点的实际统计数据的比较。如图1(d)所示,设备6的PM2.5的采集值在13左右上下波动,且在该时间段记录值均未超过国标点记录值。进行完整数据评价后,该项数据的恒值异常指标得分为0.6分,同时参考值异常得分为41.37分,该设备在统计期间尽管持续上传数据,但采集状态大部分处于异常状态。

在数据时序性方面,该项数据指标的平均得分为76.09分。主要描述的是持续变化的时间正确程度。尽管大多数的时间段内数据采集出现缺失值的现象,但是总体取得数据量与目标量之间的差距并不大。基于时间点的正确性,该指标的平均得分为84.75分。是通过判断相邻上传数据频率是否为1分钟/次来表现设备上传的频率达到要求频率的程度。

5结论

文章以智慧工地建设为背景,探索智慧工地新背景下数据质量评价的关键因素,构建基于领域知识的数据质量评价体系。在理论层面,弥补了智慧建设领域数据质量评价体系的空缺;在实践层面,对海量时序数据的及时评分,实现了数据驱动的远程项目监管。工程建设数据质量影响因素在传统的分析模板中,主要受到数据的规范性、完整性、准确性、一致性、时序性以及可访问性六个方面的影响。文章结合工程建设的实际情况,通过案例研究验证传统数据质量影响因素的可靠性。结论得出数据的完整性、准确性和时序性三方面因素是工程建设中数据管理的关键控制因素。

猜你喜欢

智慧工地层次分析法
发展智慧工地项目,推进智慧城市建设
打造智慧工地提高施工现场安全管理探究
互联网+下的建筑工程企业项目管理发展探索
智慧工地概念下如何做好房地产施工管理工作
施工现场远程监控系统在高职课堂教学中的应用初探
微电子科学与工程专业评价指标体系研究
基于AHP—GRA的工程施工项目进度风险管理研究
关于三江源生态移民创业能力评价指标体系构建的研究
基层社会管理关键绩效指标体系构建研究
基于层次分析法的乳制品品牌顾客满意度实证研究