APP下载

我国工程大数据应用现状及发展影响因素研究

2022-07-04刘珺敏

科技创新与应用 2022年19期
关键词:问卷人员工程

余 璟,杨 玥,刘珺敏,陈 珂*

(1.武汉市城市建设投资开发集团有限公司,湖北 武汉 430070;2.华中科技大学,湖北 武汉 430074)

当今时代,信息化发展大趋势使得数据成为各行各业的重要资源。互联网、物联网促使各类数据爆炸式增长,形成所谓的“大数据”。大数据是“以容量大、类型多、存取速度快、价值密度低为主要特征的数据集合,正快速发展为对数量巨大、来源分散、格式多样的数据进行采集、存储和关联分析,从中发现新知识、创造新价值、提升新能力的新一代信息技术和服务业态”[1]。政务、工业、金融、交通、电信等行业已经开始利用大数据改变传统的生产方式,积极释放数据要素的潜在价值。

对工程建设行业而言,其生产活动含有丰富的数据资源。在以BIM、工程物联网为代表的行业信息技术的驱动下,对各类工程数据进行记录、存储和分析的手段日益丰富,行业信息化程度低、数据大量丢失、数据处理能力弱等问题正在得到改善[2]。工程大数据应运而生,为工程建造项目本身以及项目参与各方提供增值服务。当前,我国工程建设行业处于数字化、智能化转型升级的关键阶段,工程大数据正逐渐发展和应用落地。

在此背景下,本研究首先结合大数据本身以及工程建造行业的特点,明确工程大数据的内涵与特征。然后,开展问卷调研,分析我国工程大数据应用的广度和深度,发现制约我国工程大数据发展的影响因素,进而提出促进工程大数据未来发展的建议。

1 工程大数据内涵与特征

“大数据”概念出现于20 世纪90年代。随着互联网的发展,企业面对的数据越来越多,数据的结构也日益复杂,传统的数据处理技术已经无法满足企业需求,寻找新的数据存储和处理分析技术已迫在眉睫。2008年,《自然(Nature)》杂志推出Big Date 专刊[3]。同年,计算社区联盟(Computing Community Consortium)发表了第八版“Big-Data Computing; Creating revolutionary breakthroughs in commerce,science,and society”报告[4],阐述了为促进大数据应用所需发展的关键技术,以及大数据发展面临的挑战。2011年《科学(Science)》杂志出版Dealing with Data 专刊[5],从多个方面讨论了大数据处理所面临的各种问题以及发展大数据技术的重要性。全球知名咨询公司麦肯锡在“Big data:The next frontier for innovation,competition,and productivity”报告中提出“大数据”是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合[6]。

工程建造本身具有丰富的数据资源,以工程为载体形成工程大数据,可以理解为运用各种软硬件工具实现项目全生命周期各个阶段的数据集成,通过对数据集的处理分析,充分利用数据功能以提供增值服务[7]。作为大数据在工程建设行业的具体形式,工程大数据具备以下4个特征。

(1)体量大:一个工程建造项目会随着时间的推移而产生源源不断的数据,数据体量迅速增大。例如,当前施工现场往往布设大量摄像头进行实时监控。根据笔者经验,若现场布设10~20个摄像头,每天记录的视频数据量可达到500 GB,相当于7 万多张图片,数据量巨大。

(2)管理复杂:不确定性和复杂性作为工程建造的2个最显著的特征,是造成工程数据管理困难的主要原因之一。由于项目往往涉及不同参与方,因此在数据收集、存储、处理等阶段,必然会涉及用户管理权限等问题。当各参与方之间没能协调一致时,就会引发数据孤岛、数据浪费等一系列问题。

(3)类型多:工程大数据分为结构化数据、半结构化数据以及非结构化数据。结构化数据指高度组织和整齐格式化的数据,如建筑产品几何尺寸、成本金额等,而非结构数据指无预定数据模型的图片、音频、视频等。半结构化数据介于结构化数据和非结构化数据之间,比如施工日志。

(4)隐含价值大:工程大数据能够通过数据挖掘技术,产生大量价值。比如施工现场的视频数据,可通过机器视觉技术进行目标检测,识别视频中工人个人防护用品佩戴是否规范,做到安全隐患的及时预警。

2 调研方法

2.1 问卷设计

为了调研我国工程大数据的应用现状,本研究设计的问卷包括两个主要部分。第一部分用于采集受访人员的基本情况,第二部分则围绕受访人员对工程大数据的使用情况、企业数据平台建设情况、大数据应用的影响因素等方面设置问题。问题采用单选、多选、打分、开放问答等多种方式,使受访人员充分发表自己的观点。在问卷初步设计完成后,通过对5 位行业专家进行预调研,明确问题表述并优化问题设置。修改后的问卷通过电子问卷平台发放,以提升问卷发放和回收的效率。

2.2 样本分析

问卷调查为期30 d,排除回答时间过短以及答案呈明显规律性的无效问卷后,共收集到有效问卷125份。问卷来源分布如图1 所示,其中从事施工工作的受访人员有69 人,占比55.2%;从事规划设计的受访人员有14 人,占比11.2%,其余受访人员来自市场监管、工程咨询等领域,占比33.6%,这表明该问卷结果具有一定的普遍性。另外,受访人员从业年限分布如图2 所示,从业时间在0~3年的受访人员有26 人,4~7年的有63 人,8~12年的有28 人,12年以上的有8 人。可以看出,大部分受访人员的工作年限较长,具有较为丰富的工作经验,有助于分析工程大数据应用现状、影响因素,以便提出较为客观的发展建议。

图1 有效问卷来源情况

图2 受访人员从业年限分布情况

3 工程大数据应用情况

3.1 工程大数据采集方式

工程大数据采集方式的调研结果如图3 所示。各项数字之和大于100%,表明工程建造项目的数据类型丰富、来源各异,受访人员在日常工作中会使用多种方式进行数据采集。不难发现,电子文档上报是获取数据的主要方式,90.9%的受访人员表示会使用电子文档(如Word、Excel 等)上报数据。而68.6%的受访人员使用纸质文档采集数据,说明传统数据收集形式依旧存在且占比较大。48.8%的受访人员通过信息系统录入的方式采集数据,33.1%的受访人员使用移动终端设备采集数据(如定制化的数据采集APP、微信小程序等)。此外,25.6%的受访人员采用物联网技术自动采集数据。例如,通过无线传感网络采集施工过程中的人员和机械的位置,以及环境温湿度、噪音、PM2.5 等,又如结合BIM 和RFID 采集装配式构件的尺寸、安装位置、状态等数据,实现施工记录随时可追溯。

图3 数据采集方式

综上,基于纸质和电子文档的人工录入仍是当前数据采集的主流方式。但面对时间推移而大量产生的多源异构数据,需考虑更加自动化、智能化的采集技术来进行采集,以弥补传统单一数据采集方式的不足,对完整、高效地记录项目生命周期内的数据具有重要支撑作用。

3.2 工程大数据存储方式

工程大数据的有效管理及存储是大数据应用的重要支撑。本研究对当前工程大数据存储方式的调研结果如图4 所示,超过60%的受访人员表示他们所在企业会将数据分散存储,其中27.3%的选择将数据分散储存在各个业务系统中,33.1%的选择将数据分散储存于独立纸质或电子文档中,分散的数据存储方式不利于数据资源的共享和高效利用。仅有24.0%和13.2%的受访人员表示他们所在企业分别利用本地数据中心和云端数据中心进行数据存储。

图4 数据存储方式

综上,相较于国内外有关文献广泛应用到的云端分布式存储,当前我国工程大数据仍依赖传统的数据存储方式,数据孤岛和数据浪费的现象依旧存在。需加强云存储技术融合,增强大数据存储的网络应用效果,以支持高效、协同地处理各类工程数据。

3.3 工程大数据平台搭建情况

工程大数据平台是衔接数据采集、存储与分析之间的桥梁,基于平台搭设功能与服务模块,为数据用户提供简洁界面与快捷操作,加强数据利用能力。如图5 所示,60.3%的企业并没有搭建大数据平台,这表明我国工程建设行业在工程大数据平台搭建上表现得尤为不足。而在搭建大数据平台的企业中,大多数企业是委托专业机构定制数据平台,仅有14.9%的受访人员表示所在企业选择自行搭建大数据平台,这意味着大多数企业并不具备独自研发数据平台的能力。同时,可能由于当前市场尚未具备面向工程建设行业且成熟的大数据平台产品,调研未发现企业直接购买商业化大数据平台产品的情况,工程大数据平台仍有巨大的发展空间。

图5 大数据平台搭建情况

3.4 工程大数据应用情况

本研究结合文献调研和工程管理业务需求,整理出11个工程大数据的潜在应用点。受访人员根据自身实际情况,以0-5 分李克特量表对工程大数据应用的频繁程度进行打分,0 分表示未使用工程大数据支持该应用,5 分表示经常使用工程大数据支持该应用,调研结果如图6 所示。

图6 工程大数据应用情况

调研结果说明我国工程大数据应用较为广泛,在工程管理各个方面均有应用。但是,与当前研究进展相比,工程大数据在企业知识管理、废弃物管理、能耗管理等方面的实际应用仍相对较少。相比而言,国内外研究已利用工程大数据支持上述方面。例如,YANG 等人提出一种基于BigKE 的智能桥梁管理与维护框架,将大数据知识工程范式与桥梁管理相融合[8]。LU 提出利用香港政府及相关部门提供的建筑废弃物处置记录大数据训练算法模型,识别出非法倾倒废弃物的行为加强对建筑废弃物的有效管理[9]。ZHOU 等人通过K-means 聚类算法、C4.5 决策树算法等数据挖掘方法,对北京公共建筑用电数据平台提供的用电数据进行分析,探究建筑用电的影响因素及其之间的关系,帮助实现公共建筑进一步节能的目标[10]。不难看出,工程大数据的相关前沿研究和实际应用仍存在一定脱节,如何深入挖掘工程大数据的价值并切实服务实践仍有待进一步探索。

4 工程大数据应用的影响因素

通过问卷调研,发现当前工程大数据应用的广度和深度仍然不足,与研究进展脱节。为了研究影响我国工程大数据应用和发展的主要因素,本研究参考相关研究,初步确定了10个影响因素,并请受访人员使用1-5 分李克特量表对这些因素的影响程度进行打分。1分代表最不重要,5 分代表最重要。

4.1 信度分析

信度分析用于研究定量数据的回答可靠准确性。为确保影响因素调研结果的可靠性,需要对问卷进行小规模的可信度分析[11]。本研究使用SPSS 软件对回收数据进行信度检验。采用Cronbach's Alpha 法,以Cronbach α 系数作为信度指标。当Cronbach α 系数小于0.6,说明该数据信度不佳,而当该系数高于0.8,则表示该数据可信度高。本研究对涉及的10个变量分别进行了信度检验。由表1可知,未标准化的Cronbach α 系数为0.931,标准化的Cronbach α 系数为0.933,二者数值相差不大,且均高于0.9,说明数据信度质量高,可用于进一步分析。

表1 Cronbach 信度分析

4.2 结果分析

调研结果如图7 所示。大数据投入与产出性价比、政策支持、技术人才、标准规范以及数据安全与隐私得分均在4 分以上,表明这些因素对我国工程大数据应用具有显著的影响。而同类产品竞争、已积累数据量、法律规定等因素则对工程大数据的发展影响较小。

图7 工程大数据发展的影响因素

首先,由于我国省份众多且大数据产业发展较不平衡,导致不同省份之间大数据的投入产出效率存在较大差异[12]。大数据作为新兴信息技术,起步较晚,加之企业重视不足且研究与实际应用脱节,进一步扩大了投入产出效率之间的差异。其次,从部分受访人员的进一步反馈中得知,我国政策对工程大数据技术的推广过于概念化,并没有实质性措施使技术落地应用,国内企业无法根据国内实际情况开发适合企业自身的工程大数据技术并加以应用。另外,许多企业由于缺少懂得关键技术以及能将技术综合应用在工程企业中的复合型高级人才,从而无法将大数据价值与实际业务有机结合,严重影响了企业的应用。此外,工程大数据技术应用标准不完善使得企业之间不能很好地协同工作,大数据技术功能无法得到充分应用。最后,数据的安全与隐私也是影响工程大数据应用的一方面,全球提倡“万物互联”,这必然会导致数据泄露等一系列不安全问题的出现,从而使企业面临潜在的危险。

基于上述对影响因素的分析,本文将给出以下建议。

(1)国内企业应在相关政策的引导下,结合技术发展现状以及企业业务需求,重视数据要素的投入产出结构和比例,选择适合自身的大数据技术,积极释放数据要素价值,提高工程大数据投入与产出的性价比。同时,也需考虑对工程大数据各个环节进行加密,使得数据在收集、存储、处理等过程中不易被人为篡改、泄露或者销毁,保证企业的数据安全。

(2)积极培养技术型人才,打通数据和业务之间的壁垒,推动工程大数据技术更贴合工程实际,实现更人性化的功能,直接提升工程大数据的应用效果。

(3)积极出台并实施相关政策支持工程大数据技术的落地应用。应统一工程大数据技术及应用标准,加之合适的技术接口,实现大数据技术不同功能的衔接应用,充分发挥工程大数据技术的价值。

5 结束语

本研究对工程大数据的内涵和特征进行总结,并通过问卷调研梳理了我国工程大数据技术应用现状,分析阻碍我国工程大数据技术应用发展的影响因素,并提出了相关建议。结果表明:

(1)以体量大、管理复杂、类型多以及隐含价值大为特征的工程大数据,在项目全生命周期的各个阶段运用各种数字化、信息化工具实现数据对项目的支撑作用,克服传统模式下数据大量流失、数据处理能力弱等困难,最大程度发挥数据的价值。

(2)我国工程企业数据采集尚未完全实现信息化、自动化,数据仍依赖传统存储方式,且缺乏统一有效的管理,影响了工程大数据在整个流程中应用的推进。企业对大数据平台/系统功能应用不全面,并且多数企业未搭建大数据平台/系统,使得数据处理过程断层,数据采集存储后不能得到有效利用,数据孤岛、数据浪费的现象依旧存在,整体发展水平还有待提高。

(3)市场环境中投入产出的不平衡、政策推广过于概念化、技术人才与标准规范不足、数据安全与隐私顾虑等因素影响了工程大数据的落地应用进程。我国应从三个层面同时着手,即以市场实际状况为背景,平衡工程大数据投入与产出,营造开放、共享、安全的技术应用环境;以技术为核心,积极培养技术型人才,大力开发与扩展工程大数据产品功能,覆盖工程进度、质量、安全成本等各个方面;以政策为主导,鼓励技术创新与转化,使研究和应用的步伐协调统一,大力推行工程大数据技术的落地应用。

猜你喜欢

问卷人员工程
让刑满释放人员找到家的感觉
不得与工会组织任职期内人员解除劳动合同
问卷网
子午工程
工程
问卷大调查
工程
急救人员已身心俱疲
问卷你做主
工程