建设项目数据共享:现状、瓶颈与突破
2023-12-03焦红波厉怡楠李孝林张瑞瑞程立名
焦红波,厉怡楠,李孝林,张瑞瑞,程立名
(1.华北水利水电大学水利学院,河南郑州 450046;2.河南省资源环境调查一院,河南郑州 450000)
随着新一轮科技革命和产业变革向纵深发展,以人工智能(AI)、区块链(blockchain)、云计算(cloud computing)和大数据(big data)为代表的新兴信息技术加速向各行业全面渗透和融合。数据是数字经济时代的重要生产要素,具有价值高、决策有用、增长迅猛、功能多样等特征,既是共享城市(sharing city)和智慧城市(smart city)建设的重要基础,更是推动经济增长和社会进步的战略资源[1]。建筑业的发展为国家经济建设做出了重大贡献,带动了国民经济其他行业的发展和繁荣,如吸纳城镇劳动力、为社会提供新增就业岗位、税收贡献突出,为国民经济各部门提供了重要的物质基础。建设项目具有数据密集型和数据驱动型的特征[2],其相关数据分布于各个部门,利益割据及信息沟通不畅,容易形成“数据孤岛”。数据共享能够使数据的价值最大化,从而改善建设项目管理绩效和投资管控水平。丁烈云[3]指出,建筑企业在工程大数据的帮助下,能够快速、精准地形成报价分析和决策,提高编制施工投标书等环节的效率;施工单位利用与成本管理相关的大数据可根据拟建工程的具体情况判断最优成本构成,实现更好的成本预测和成本过程管控;针对施工过程中出现的质量问题,利用相关工程数据进行关联分析,可准确把握施工质量问题产生的主次原因,提出更有效的解决措施,实现工程管理由经验驱动到数据驱动的转变。同时,利用共享数据进行分析可满足项目各参建方协同作业及线上决策和管理的需要[4]。可见,不断增长的技术推动力使建设项目利益相关方有必要提高数据交换和共享的水平。但与其他行业相比,建筑业的数字化程度不高[5],建设项目的数据共享存在诸多局限与挑战,数据价值没有得到充分发挥。究其原因,一是数据拥有者实现私有价值和数据的社会公共价值之间的利益冲突;二是数据权属和数据共享之间的冲突;三是数据共享与数据安全的冲突。长期以来,我国建筑业主要依赖资源要素投入、大规模投资拉动发展,建筑业信息化水平较低,建设项目数据价值密度低、数据管理不透明、数据共享不顺畅等问题比较突出,建筑业与大数据、信息技术、节能技术融合不够,大量建设项目设计参数及投资指标无公开数据平台供参考,且建设项目的数据整合机制不透明。建设项目如何依据时代背景进行转型升级是亟待解决的现实问题。在此背景下,党的十九届四中全会首次将数据列为生产要素,提出要发展完整的数据要素市场,推动数据共享。这标志着建设项目数据共享受到广泛关注,开启了建设项目发展的新阶段。基于此,本研究将对建设项目数据共享应用和研究现状进行回顾,在此基础上剖析建设项目数据共享的现存问题,并从数据收集与清洗机制、数据共享平台构建、数据共享激励机制三方面出发,为解决建设项目数据共享中数据缺乏兼容性、数据共享内生动力不足、数据安全等问题提供理论基础和思路,促进建筑业向数智化转型,推动建设项目高质量实施。
1 建设项目数据共享现状
1.1 建设项目数据共享相关政策制度逐步完善
在政策引导方面,我国高度重视数据共享,制定了相关政策和标准。党的十八届五中全会首次提出实施国家大数据战略,标志着大数据战略正式上升为国家战略;2020 年4 月,《中共中央、国务院关于构建更加完善的生产要素市场化配置体制机制的意见》将数据列为新型生产要素,提出从推进政府数据开放共享、提升社会数据价值、加强数据资源整合保护三个方面加快培育数据要素市场;党的二十大报告提出,推进新型工业化,加快建设制造强国、网络强国、数字中国。在数据安全方面,2021 年国家陆续发布《中华人民共和国数据安全法》《中华人民共和国个人信息保护法》等,明确了数据安全主管机构的监管职责,建立了健全数据安全协同治理体系,提高了数据安全保障能力。
建设项目数据共享的标准化建设也取得了一定的进展。2014 年7 月,住房城乡建设部印发了《全国建筑市场监管与诚信信息系统基础数据库数据标准(试行)》和《全国建筑市场监管与诚信信息系统基础数据库管理办法(试行)》,正式启动了“四库一平台”的建设,保证了数据的全面性、真实性、关联性和动态性;为推动建设管理数字化转型和数据共享,《建筑信息模型应用统一标准》等六项国家标准在2016 年至2019 年期间陆续发布,填补了建筑信息模型(building information modeling,BIM)技术应用标准的空白。在数据共享平台建设方面,为规范城市信息模型基础平台建设,提升工程建设项目数据共享与应用水平,2021 年9 月,住房和城乡建设部制定了《城市信息模型(CIM)基础平台技术导则》,随后发布《城市信息模型平台工程建设项目数据标准》。这些国家标准及政策的制定实施,对建设项目的数据管理起到规范作用,为促进建设项目数据的高质量共享提供了一定标准。但是,在建设项目数据共享实际操作层面上,由于数据标准化工作机制不健全,数据流、信息流易在某个阶段停滞,无法有效传递,难以及时对出现的新问题进行指导和规范。
1.2 建设项目数据共享相关研究处于探索阶段
我国目前的数据共享研究的发展方向主要集中于政府数据和科学数据共享,具体研究围绕这两大主题展开[6]。对于建设项目数据共享,研究仍处于探索阶段。学界和业界的研究者多聚焦于信息集成技术与平台。黄必清[7]提出可用项目信息门户(project information portal,PIP)为项目各参与方提供基于互联网平台的、用于获取个性化项目信息的单一入口和高效信息交流与协同的工作环境。同时,基于PIP的信息管理具有实现信息共享的显著优点[8]。既有研究还集中于数据库向数据仓库、数据平台发展的路径和建筑信息模型、城市信息模型、地理信息系统等技术与人工智能、物联网、云计算等融合发展的数字化建筑领域,并在数字孪生、智慧城市、智慧建造、可持续数智化城市治理取得明显进展[9]。夏义堃[10]提出数据要素视角下政府数据治理体系的内容建构,倡导培育发展数据要素市场、加快数据资产化进程、构建数据治理监管体系等思路。也有学者尝试将作为计算范式的颠覆式创新的区块链技术与物联网、BIM 等技术相结合,探索新的工程管理模式[11]。
目前建设项目领域相关研究围绕数据共享进行了大量探索,也涉及了PIP,集成项目管理信息系统(integrated management information system,IMIS)、全生命周期管理信息系统(laboratory information management system,LMIS)、设施管理信息系统(facilities management information system,FMIS)及新兴的区块链技术、数字孪生技术等,为项目信息在利益相关方之间快速共享提供了基础与借鉴。但现有研究对项目建设数据共享机制中多元参建方的协作工程未明确阐述,另一方面对于数据共享平台建设也并未深入探究。
2 建设项目数据共享现存瓶颈
2.1 数据共享标准化建设滞后
保证信息的准确、透明对于建筑业持续稳定发展具有重要作用[12],建设项目的高质量完成需要利益相关方之间进行有效的数据交流。根据现有研究,建设项目数据共享过程中存在数据交换和存储方面缺乏统一标准,以及大量非结构化数据集成困难的问题[13]。建设项目组织是一种临时性组织,各部门组织结构较为松散,且项目实施过程中存在多方利益相关者[14],如建设单位、设计单位、施工单位和监理单位等,作业活动分散度较高,数据管理方法不一。大多数情况下,由于缺少统一的数据收集标准、数据管理流程及可靠的管理工具,加之数据收集的临时性、记录方法不规范及项目参与方分工不明确,在施工过程中收集的数据来源冗杂、利用效率低,出现问题时往往无法有效追溯并修正。并且,跨不同数据库以不同格式生成和存储的数据会使数据的匹配更加复杂[15],进而导致不同利益相关方平台之间的数据缺乏互操作性,数据传递易失真,项目参与方之间缺乏有效沟通。共享数据的准确性和互操作性以数据拥有者和利益相关方按照规定格式共享数据为基础,数据只有在采用相同格式并使用通用标准存储和传输时,才对广大受众有价值[16]。总而言之,由于数据管理方法、收集标准不同,在建设项目全生命周期中生成的数据具有非结构化、碎片化和价值密度低等特点,无法及时整合、存储。从而使得数据缺少兼容性和互操作性,无法确保共享数据的完整性。
2.2 数据共享内生动力不充足
数据被视为一种竞争工具,不同的利益相关方对数据共享存在不同的看法,与业主和监理相比,承包商从数据共享中获得的收益通常较少,缺乏数据分享动力。同时,在建设行业中也存在大数据—隐私悖论,即数据在共享过程中主体的意向与共享行动之间是割裂的[17]。由于各参与方以自身利益最大化为主导,没有形成真正的利益共同体,数据共享意愿不高。且部分参与方为了拥有数据霸权,扩大自身优势,大多数据限于内部使用,不愿自身数据被其他参与方共享。但为了获取更多信息,又提倡其余数据拥有者共享数据,导致数据的公开访问和共享难以实现。建设项目实施过程中会产生大量数据[18],且数据分散于各部门,不便于协同管理。利用数据共享平台可实现信息整合、多方协同、业务协作等,能够解决建设项目长期存在的痛点。而建设项目数据共享平台具有一定专业属性,不仅需要遵循国家对行业管理的要求,也需要各方合作与推动。大多数情况下,利益相关方对组织的感知利益压倒了行业层面上可累积的共同利益,存在防御思维和对抗关系。个别利益相关方为维护自身利益对披露“有价值的数据”犹豫不决,出于不信任或保密机制不愿意共享数据,存在小农意识,机会主义行为频发,严重阻碍了数据共享平台建设、全局数据的挖掘和应用以及项目参与方之间信任的建构,限制了数据的应用价值,也降低了工程建造效率。
2.3 数据共享安全环境不理想
随着建筑信息模型、区块链、数字孪生、云计算等新兴信息技术的应用,建设项目全生命周期各个阶段储存的工程信息量也大幅增长。但是,信息技术在为利益相关方及时掌握工程信息提供便利的同时,也伴随有物联网攻击与智能入侵等新的非传统安全问题。建设项目大数据具有巨大的潜在价值,对个人信息、银行交易细节、供应商详细信息、投标以及设施相关敏感数据等的窃取及滥用将导致利益相关方难以估量的价值损失。目前已有研究利用新兴技术创造数据共享的环境,提供多项隐私保护方案,但这些方案仍面临安全或性能上的挑战,如数据安全壁垒、数据确权和系统的数据生命周期管理方法。建设项目参与方众多,每个组织会根据自身安全利益诉求对数据进行筛选、过滤,导致汇总后数据不完整。同时,由于数据碎片化程度高,增大了管理难度,其中因数据丢失、资料被盗用等引起的利益相关方之间的纠纷时有发生,阻碍协同工作的开展,即数据安全壁垒产生。在建设项目全生命周期产生的大量数据类型复杂、来源广泛,包含了建设项目的经济、技术、管理等多方面信息,其中不乏涉及到国家安全、项目参与方权益、商业机密等敏感问题。数据流通与共享是建设项目不可或缺的环节,建设项目数据共享旨在为项目参与方提供动态信息,促进多方协作,使其均能满足各自的利益诉求。若缺乏合理的数据共享机制,则无法保障数据安全以及确定数据共享和隐私保护之间的平衡点,项目参与方会担心数据泄漏损害自身利益,大大降低分享数据的积极性,不愿将自身业务和数据置于平台上,从而妨碍工程执行效率。因此,在发挥数据共享优势的同时,建设安全稳定的建设项目动态数据控制管理系统、聚焦数据服务的有效供给、设计行之有效的数据访问控制技术,保障建设项目在每一阶段的安全运营,是当下的迫切需要。
建设项目数据未能充分有序共享的原因可总结为“不畅、不愿、不易”三个方面。共享不畅,即由于缺乏统一规范的数据收集标准、数据管理流程及可靠的管理工具,数据缺少兼容性和互操作性,各部门协调难,数据共享流程不顺畅。共享不愿,即数据共享内生动力不足,由于利益相关方之间缺乏整体性思维,信用关系建立困难,对数据进行封闭式使用,为维护自身利益不愿共享数据。共享不易,即缺乏安全的数据共享大环境和可靠的数据共享平台,数据安全相关技术发展与应用尚未完全成熟,无法保证数据共享的安全可靠及精确追溯。
3 建设项目数据共享突破思路
3.1 数据收集与清洗机制
建设项目实施过程中产生海量数据和档案信息,数据收集存在着安全性低、被动性高及价值密度低等现实困境,以及数据所有权、利益相关方的选择权等方面的逻辑困境。上述问题可通过以下方式解决:第一,制定统一的数据收集标准。结合《城市信息模型平台工程建设项目数据标准》等相关标准,整合制定统一的适用于建设项目数据共享的数据收集标准,规范工程数据要求,为建设项目的数据管理及共享提供技术支撑。第二,提高数据收集过程准确性。建设项目实施过程中可借助三维激光扫描、数字近景测量和移动计算等信息技术完成对数据的收集工作,三维激光扫描可收集正在建筑物体的精确空间信息;数字近景测量可为施工进度文件提供可视化数字图像;移动计算即借助计算机或其他信息智能终端设备在无线环境下实现数据传输及资源共享。可促进建筑作业的无纸化管理,减少由人工转录引起的数据输入错误,便于对数据进行分析,对项目进行运营和维护。第三,及时整合清洗已收集数据。将已完项目的规划、设计、招标、采购、施工、交付及运维阶段的数据及时整合,细致的整合可以帮助减少因不同数据库中对同一属性的不同描述而造成的数据差异和数据冗余,并设定对应清洗规则。按照不同管理需要将数据划分为若干组,通过去除冗余数据、填补缺失值、识别和处理异常值来清洗原始数据,根据实际需求选择对应检测清洗规则。最后,通过对预处理数据进行缩减获得一个较小数据集,但不改变其分析内容。数据缩减策略包括降维、降数和数据压缩。并应用信息集成理论,基于决策树、神经网络模型、聚类分析等方法对数据进行挖掘,将其转换成有用的信息,提高共享数据质量,实现项目信息在利益相关方之间的快速共享。其具体过程如图1 所示。
3.2 数据共享的平台构建
传统的集成式信息共享模式需要借助第三方建立统一的信息管理中心,利益相关方对其依赖程度较大,若第三方的信息管理中心遭遇安全攻击,数据面临被篡改、丢失、窃取、随意滥用的风险,无法保障存储数据的安全。且传统的集成式信息共享模式存在成本高、数据确权难、激励机制缺失等弊端,难以实现真正的数据共享。区块链技术位于现代信息技术前沿,可将数据区块以链条的方式组合成特定数据结构,并以密码学方式创建具备保证性的、不可篡改和不可伪造的共享总账,具有去中心化、时序数据、集体维护、可编程和安全可信等特点[19],鉴于区块链技术存储的数据具有可追溯性、难以篡改等特征,故其可解决数据管理与共享时面临的安全问题,实现数据的实时共享。在数据共享的基础上,数据存储成为一个亟待解决的问题。星际文件系统(inter planetary file system,IPFS)是一种分布式超媒体传输协议,它不仅可以永久地存储和使用数据,还可以对内容进行寻址和管理。基于此,构建以“区块链+IPFS”驱动的链上数据共享(data sharing on blockchain,DSOB)平台,基于分布式存储、区块链技术、密文策略的属性加密等技术构建主要由区块链模块、IPFS 模块、加密解密模块、快速检索模块四大功能模块组成的建设项目数据共享平台,实现对收集到的建设项目数据的安全、高效共享,具体结构如图2 所示。
加密解密模块。采用高级加密标准(advanced encryption standard,AES)算法和数字摘要算法生成加密密钥,对建设项目工程量数据、材料数据、合同数据、表单数据、质检数据等进行加密,并将加密后的文件上传至IPFS 系统。数据解密即生成解密密钥,使用AES 算法和解密密钥对文件进行解密。用户在前端界面输入个人密钥、联盟密钥和文件路径,后台对路径下的数据进行对称加密和解密。
IPFS 模块。IPFS 是一种分布式数据存储技术,使用点对点协议来解决数据内容,用以存储用户上传的文件、视频、图片等项目相关数据。为保证数据存储安全,IPFS 系统只能在内部网络上运行,各节点通过VPN 连接,用户通过IPFS 系统实现文件的查看或下载。
区块链模块。区块链可分为公有链、联盟链和私有链。本文选择联盟链,用户可按照协议规定操作和维护区块链系统。当数据上传到IPFS 系统时,将关键信息传输到联盟区块链的各个节点,获取当前时间并重置时间戳,通过算力竞争的共识机制维护写入区块链的数据。
数据检索模块。由于数据库中的数据量巨大,数据检索需要消耗巨大的计算能力成本,借助哈希表结构只存储建设项目相关数据的关键信息,以实现快速的数据检索,并将检索结果通过前端可视化界面反馈给用户供其查看。
3.3 数据共享的激励机制
建设项目相关部门在大力推进数据共享,鼓励利益相关方积极共享自身数据,以期改善施工效率,提升项目管理水平。但数据共享的推进,也面临着数据权属不明确、内生动力不足、数据隐私和安全等方面的压力[20]。当需求到达一定层次并有可能得到满足时,利益相关方共享数据的积极性才会提高,政策支持环境能有效提升数据共享平台的运行效率。政府应综合考虑政策、机制和措施三方面,将正向和负向激励相结合,以“推力-拉力”方式构成激励机制。首先,相关部门应结合实际,在法律框架下明确数据主体的数据权益,制定建设项目数据确权、开放、流通、交易相关制度,明确数据权利性质、划分数据权利主体,构建科学的建设项目数据权利体系,为建设项目高质量实施提供体系化的法理基础。其次,通过颁布促进建设项目数据共享相关文件,以及财政补贴、设置专项基金、技术支持服务机制等激励方式,集成使用激励与规制相结合的政策手段完善建设项目数据共享平台的数据共享功能,合理减少利益相关方风险,提高其共享意愿。最后,从数据资源配置、数据确权、实时共享等方面解决数据共享“不畅、不愿、不易”问题,打破信息壁垒与产业边界,释放政策红利和创新红利,推动构建以数据和技术驱动的盈利模式,实现对建设项目数据共享平台的高效运行和充分应用。
3.4 数据共享应用场景分析
在数据收集与清洗阶段,各参建单位结合统一的数据收集标准,对规划、设计、招标、采购、施工、交付及运维阶段的数据等进行采集,解决数据价值密度低、碎片化问题。在数据收集过程中,借助自动化数据传感器、三维激光扫描等信息技术完成对分布式数据的收集,促进实时数据处理、提高数据精度,为后期分析提供便利。数据收集完成后,将各个阶段采集的数据根据实际需求设定清洗规则,通过去除冗余数据、填补缺失值、识别和处理异常值进行数据清洗,最后进行数据整合、缩减和转换,完成对数据的收集与预处理工作。
完成数据收集与清洗后,数据拥有者将合同数据、表单数据、工程量数据、质检数据、材料供应数据等上传至“区块链+IPFS”驱动的链上数据共享平台,对数据进行统一的存储管理,并利用区块链去中心化特征,解决数据存储的单点故障风险,上传的文件存储在IPFS 模块中,完成数据输入。用户需要加密或解密文件时,由后台加解密模块来完成文件的加密或解密。不同的项目参与方具有不同的权限,项目参与方首先通过应用程序在本地存储凭证,然后将授权信息上传到授权信息链。应用程序在链上执行代码,在链上发起查询,并将授权信息记录到块上。当项目参与方提交数据访问需求时,在链上发起身份验证交易,以确认用户是否被授权。根据项目参与方自身的数据属性集合,判定其访问数据的权限,认证节点判定合格后,链上的认证节点返回授权信息和相应的数据,通过数据检索模块实现快速数据检索,以便对数据进行下一步的分析操作。在项目数据的共享过程中,区块链网络中的多个计算节点参与数据计算和记录,并验证其信息的有效性,提供信息防伪和追溯路径。同时,结合数据共享的激励机制,在共享数据的同时保证数据质量、保护知识产权,完成建设项目可信、透明、可追溯的数据共享。
基于此,如图3 所示,首先借助数据挖掘技术,实现对已完工项目历史工程数据和正实施项目即时工程数据的收集和预处理,为建设项目数据共享平台运行提供数据来源。接着,借助建设项目数据共享平台,实现对已完工项目历史数据的数据共享和正实施项目即时工程数据的管理,为数据拥有者和用户之间的数据共享提供可信的执行环境。最后,结合数据共治理论建立激励机制,完善数据共享机制,通过多元主体数据资源和行动能力的整合联动,对建设项目数据共享现存瓶颈突破。
图3 建设项目数据共享总体思路
4 结论
建设项目实施过程中会产生海量数据,且涉及主体众多、流程复杂、项目实施中产生的具体行为繁多,增加了数据共享的难度。本文基于数据共享质量、数据共享主体和数据共享机制三个维度构建建设项目数据共享分析框架,针对数据共享过程中“不畅、不愿、不易”问题提供解决思路。首先,重视数据收集与清洗,通过制定数据收集标准,整合清洗数据,共享准确、真实、规范的数据,提高数据共享效率;其次,高效使用数据,借助区块链技术构建数据共享平台,实现项目数据的实时安全共享,降低信息不对称,打破“数据孤岛”,并可利用共享数据横向比较不同建筑企业的效率,识别造成效率低下的关键因素,把控工程进度,优化合同管理;最后,综合考虑政策、机制和措施建立激励机制,做到数据确权、数据有效供给,保障共享数据的安全。总之建设项目数据的有效共享,既需要制定相关政策法规,也需要技术平台支持与利益相关方的多方协作,形成共建共治共享的建设项目数据共享体系。