基于ISM的公共建筑大数据质量影响因素研究
2021-07-07宋朋波刘伊生
宋朋波,刘伊生,郑 旺
(北京交通大学经济管理学院,北京 100044)
随着我国城镇化进程的快速推进,建筑能耗在逐年增加[1],资源、能源、环境问题日益突出,降低建筑能耗的碳交易市场机制逐渐成为建筑业可持续发展的研究热点.公共建筑碳交易市场能够高效、流畅运行的前提是具备高质量的公共建筑数据,因此明确影响公共建筑大数据质量的因素及其相互作用关系以提升数据质量,对于我国公共建筑碳交易市场的发展至关重要.
公共建筑大数据不仅包含能源类数据,还包括资源环境、经济社会数据等大量结构化和非结构化数据.目前,国内现有相关数据由能源、建筑、环境等多部门多头编制,加之我国各地区技术经济发展不平衡,公共建筑统计数据存在标准体系欠缺、完整性不够、获取机制不健全、准确性存疑和应用性不足等问题.因此,梳理和明确影响公共建筑大数据的因素及其之间的相互作用关系,找到有效提升公共建筑大数据质量的途径和方法,对政府做出精准决策,促进我国公共建筑碳交易市场的发展至关重要.
1 公共建筑大数据质量影响因素分析
数据质量反映的是数据的一组固有特性满足使用者需要的程度[2].它不仅包括数据的准确性,还包括可获得性、及时性、相关性、时间和空间上的一致性以及不同数据之间的一致性等[3].公共建筑大数据种类繁多,影响这些数据质量的因素不仅众多且关系复杂.本文从内在因素、物质环境因素、人员因素等多角度分析公共建筑大数据质量影响因素.
1.1 内在因素
1.1.1 统计方法制度 公共建筑大数据质量对于统计方法制度具有一定的要求.在互联网迅速发展之后,随即迎来的是大数据时代.大数据环境下公共建筑的数据种类趋于多样化,数量日益庞大,对现有统计制度提出了全新的挑战[4].同时,我国相关部门通过公共机构能源资源消耗统计制度、建筑业统计报表制度等若干制度,对公共建筑大数据进行了明确的规定,这些制度在统计口径、统计范围上存在显著性差异,会对数据的质量产生重要影响[5].
1.1.2 统计管理体制 公共建筑大数据的获取不仅需要统计方法制度的保证,还需要有关统计部门的强有力的执行.数据获取能力的高低会受到住建部统计部门内部组织架构的合理性、其对统计工作的协调管理能力以及与各级政府之间的关系等多方面因素的影响[6].同时,完善的统计管理体制可以调节统计活动与统计调查的主体、客体间的利益关系矛盾,从而减少因协同各方关系产生的阻碍[7].其中,对人为干预的程度进行合理且有效的控制,将会提高数据统计过程的客观性和中立性,另一方面,提高统计法律规范对数据统计过程的规范效力可以通过构建良好的内部组织架构实现.
1.1.3 技术方法因素 我国目前正处于城镇化快速发展的中后期,建筑总量在未来一段时间内仍会不断增加,建筑能耗也会不断增加,其数据种类趋向于多样化,数据结构也在不断变化.传统的数据技术在识别错误、缺失、无效或延迟数据时,会耗费大量的时间,其自身经常会出现系统性错误,数据质量无法得到保证,因此要借助新的数据技术进行数据识别[8].数据形式趋向于多样化,对数据收集方法也提出了新的要求.大数据时代下,数据质量的及时性、相关性以及一致性难以进行量化,统计人员多凭借主观经验进行分析,从而影响数据质量[9].因此,数据库技术、数据质量检测技术和数据分析技术的更新换代是保证数据质量至关重要的因素.
1.2 物质环境因素
1.2.1 社会风气 各地区在规定周期内都需要对公共建筑相关数据进行统计.但因为每个地区的社会风气不尽相同,导致在其特有政治、经济和文化环境下的统计数据反映真实性程度不同.
1.2.2 成本性因素 在公共建筑数据的统计过程中,国家住房和城乡建设部等相关部门需要开展一系列时间久、跨度大、复杂程度高的数据调查和统计工作,在此过程中会消耗大量的人力、物力、财力[10].在数据搜集录入的过程中,合理安排人力、物力、财力,有利于提高统计数据的质量.例如上级部门拨付经费的充裕程度会对数据质量产生重要的影响[11],经费充裕时,相关部门可以对软硬件设施进行升级改造,降低统计过程中的错误率,提高数据质量.除此之外,在经费充裕的情况下,数据指标的颗粒度可以做到更加细致,统计范围也可以进一步扩大,从而提高数据的可靠度.
1.2.3 设备条件因素 大数据时代下,公共建筑数据会受到多种设备条件因素的影响,它们对于数据质量的影响程度各不相同.随着大数据、云计算、物联网等现代信息技术的快速发展与广泛应用,数据来源趋于多样化、复杂化,目前获取数据的渠道主要有数据采集平台、各类数据库、统计年鉴、报表、年度报告和物联网分析报告等,如何对多渠道获得的同一指标数据进行选取变得愈发重要.在数据存储方面,为满足大容量、高性能和访问接口多样性的要求,存储格式的多样性变得至关重要.与此同时,也要做好数据库的维护工作.
1.3 人员因素
1.3.1 管理人员因素 统计数据质量的重要影响因素之一便是领导干预.在数据统计过程中,为达到某些目的,相关填报部门、企业领导会更注重于数据的形式而忽略实质性内容,从而影响数据质量.同时,数据统计各层级建设水平会受到各级领导业务素质和知识水平的影响,各层级建设水平的高低会影响数据质量.
1.3.2 统计人员因素 统计人员的工作是加工统计数据的第一道工序,其专业能力会对数据质量产生重要的影响[12].此外,统计人员的数量、稳定性、基本素质以及业务素质是决定数据质量的基础[3].大数据时代对公共建筑统计人员提出了新的要求,他们在掌握自身专业知识的同时,还需掌握计算机、财务管理、能源等其他专业领域的知识,才能降低那些低级、反逻辑、反知识的原则性数据错误的出现频率,提高数据质量.从细节方面分析,统计数据的质量会受到统计人员教育水平的高低、统计人员的流动性、统计人员的知识培训的频繁度等因素的影响[13].
2 公共建筑大数据质量影响因素的解释结构模型分析
解释结构模型(ISM)是复杂网络中的一种静态结构化建模方法,最早是美国学者华菲尔特(J.N.Warfield)利用离散数学或有限数学创造的适用于许多复杂问题的数学语言,在管理学、社会学、经济学及心理学等领域得到广泛应用[14].它是将复杂问题进行结构化梳理,让其成为层次分明的递阶结构,帮助系统中变量之间关系的复杂性施加次序和方向[15],展现复杂系统问题的逻辑关系,以便于更好地切入问题研究[16].ISM应用思路主要是:首先通过文献分析以及专家访谈等形式对其影响因素进行分析,理清各要素两两之间的逻辑关系,建立邻接矩阵;经过布尔矩阵运算,得出可达矩阵;对可达矩阵进行区域分解和级间分解,建立复杂系统要素的解释结构模型,并揭示各要素之间存在的相互关系[17].
2.1 确立系统要素
对影响公共建筑大数据质量方面的内在因素、物质环境因素以及人员因素进行了分析研究,发现影响公共建筑数据质量的因素中存在几点问题:①因素中存在相似度高的要素,需要将其进行整合.②因素中有宏观要素,也包含微观要素.进行定性分析时,为了有助于全面分析,同样需要将其进行整合.③提炼出20个影响公共建筑大数据质量的系统要素,为方便要素表示,将20个系统要素以Si(i=1,2,…,n)的形式表示(表1).
表1 影响公共建筑大数据质量的系统要素及说明Tab.1 System elements and description affecting big data quality in public buildings
2.2 建立邻接矩阵与可达矩阵
通过向住房和城乡建设部、中国城镇供热协会、中国建材协会等与公共建筑数据统计相关的机构、行业进行专家咨询,并结合文献调研分析,对上述要素两两之间的关系进行判断,得到邻接矩阵与可达矩阵.现规定要素Si(i=1,2,…,n)之间的关系由aij(j=1,2,…,n)表示,定义如下:
则公共建筑大数据质量影响因素邻接关系矩阵A为:
接下来进行可达矩阵M的计算.邻接矩阵是表示要素间直接的二元关系,通过二元关系传递可能会建立起要素间间接的影响关系,找出所有的间接传递关系,得到可达矩阵M[18].邻接矩阵A属于布尔矩阵,布尔矩阵的运算规则主要有逻辑和运算以及逻辑乘运算,即逻辑和取大:0+0=0,0+1=1,1+1=1;逻辑乘取小:0×1=0,1×0=0,1×1=1.计算(A+E)k(k=1,2,…,n),其中E为单位矩阵,当(A+E)≠(A+E)2≠(A+E)3≠…≠(A+E)k=(A+E)k+1,可得可达矩阵M=(A+E)k.
利用MATLAB计算上述邻接矩阵,可得M=(A+E)5=(A+E)6,M为:
2.3 构建多层递阶结构图
设可达集合R(Si),其代表将被要素Si影响的要素构成的集合;先行集合Q(Si),其代表将对要素Si有影响的要素构成的集合.交集C(Si)=R(Si)∩Q(Si).
根据可达集合和先行集合,则能够对整个矩阵的所有要素划分等级.一个递进的结构模型是从高级集合往低级集合依次寻找,往下各层分别是上一层的原因.根据C(Si)=R(Si)∩Q(Si)条件来进行层级的抽取,每得到一个集合后,把相应的要素去掉,再用相同的方法寻找下一级集合,依次进行便可划分出各级要素[19].设Ln(n=1,2,…,n)为各层要素的集合,则各层级的可达集(R)、先行集(Q)和共同集(C)关系如表2所示.
表2 可达集、先行集、共同集关系表Tab.2 A table of data sets,antecedents,and common sets
通过计算,可把影响公共建筑大数据质量的系统要素分为7个层级,即L1={S1}、L2={S3,S4,S5}、L3={S2,S9}、L4={S12,S15}、L5={S6,S10,S13,S14,S16,S18,S19}、L6={S8,S11}、L7={S7,S17,S20},则公共建筑大数据质量影响因素的层次结构模型如图1所示.
根据图1,进一步构建公共建筑大数据质量影响因素的解释结构模型(图2).
2.4 模型解释与分析
从上节构建的公共建筑大数据质量影响因素的解释结构模型可以看出,利用解释结构模型方法对公共建筑大数据质量影响因素进行分析,能够把影响因素间的复杂关系变得富有层次且更加条理.根据解释结构模型,将影响公共建筑大数据质量的20个系统要素形成具有7个层级的多层次递阶结构模型,并对其进行进一步的分析与解释.
图1 公共建筑大数据质量影响因素的层级结构模型Fig.1 Hierarchical structure model of big data quality influencing factors in public buildings
图2 公共建筑大数据质量影响因素的解释结构模型Fig.2 Interpretation structure model of big data quality influencing factors in public buildings
1)公共建筑大数据质量的直接性影响要素.从第二层级来看,公共建筑大数据的可获得性、及时性、一致性与其质量直接相关.在大数据时代,统计数据提供者、生产者和用户等多主体都对公共建筑数据具有需求性,准确性已然不是衡量数据质量的唯一标准.数据的可获得性、及时性以及一致性等多重属性既可以更好地满足多层次公共建筑数据用户对数据的需求,也对数据提供者提出了更高的期望与要求.从第三层级来看,公共建筑大数据的准确性也是对数据质量的直接性影响要素.根据公共建筑大数据质量影响因素的解释结构模型,数据准确性因素显然直接影响数据质量,只是影响程度略低于可获得性、及时性和一致性.虽然数据准确性因素和数据质量二者之间互为影响,但在大数据时代数据质量问题的本质已经由数据准确性单一因素转变为以用户需求为导向的多维因素[20].数据准确性现在只是数据质量的一个方面,或者说是其中的性质之一,在大数据时代,它对数据质量的直接性影响显著降低.
2)公共建筑大数据质量的间接性影响要素.从中间层级来看,第三层、第四层、第五层、第六层的要素是影响公共建筑大数据质量的中间环节,是拥有要素最多的层级.第三层的间接性影响要素只有统计方法的健全性,它是直接决定数据能否全面获取的关键,也是数据多样性的重要保障.第四层包括数据多渠道校验可能性以及数据搜集录入成本.数据的多渠道校验能够有效保证数据的准确性以及一致性,进而保证数据的质量.而数据搜集录入成本关系到公共建筑数据统计工作的开展,是影响数据质量的一个重要因素.第五层是单层次包含因素最多的层级,它包含了设备因素、来源因素以及与统计相关人员行为的因素.用来存储数据的数据库越强大,统计渠道的来源越多,越能增加数据寿命以及同种数据的丰富度,这在一定程度上影响着数据的质量.而管理者的干预行为、统计人员的数量以及稳定性是公共建筑数据质量稳定提升的前提,它们的波动将会影响数据质量.现如今,公共建筑大数据并没有官方指定标准,不同统计制度中对同一数据指标的规定不尽相同,这给公共建筑大数据获取带来一定复杂性和重复性,因此基层统计人员数量以及他们的稳定性对统计工作开展具有重要意义.第六层可以说是对公共建筑大数据质量影响最小的一层级因素,它们处于该解释结构模型中最不起眼的位置.由于众多因素在一级级传递中对公共建筑大数据质量的影响逐渐减少,甚至消失,因此在提高公共建筑大数据质量时,可以最后考虑社会风气和数据技术改造及应用能力对它的影响.
3)公共建筑大数据质量的根本性影响要素.从最后一层级来看,管理者、统计人员的综合素质以及统计管理体制是影响公共建筑大数据质量的深层次影响因素.这说明公共建筑大数据在根本上还是由人的水平和体制决定其质量高低的.更进一步讲,统计工作的体系和制度也是由人编制和建立的,所以无论是管理人员还是基层统计人员,其综合素质和专业水平的高低在根本上决定着公共建筑大数据质量的好坏.
3 结论及展望
通过建立公共建筑大数据质量影响因素的解释结构模型,总结影响其质量的系统要素并对它们之间相互关系进行分析,梳理出影响公共建筑大数据质量的直接要素、间接要素以及根本要素,得到结论如下:
1)影响公共建筑大数据质量的系统要素具有丰富的层次性.20个系统要素演化为7个层次,除去公共建筑大数据质量本身和直接影响要素,其余影响要素通过多路径或单一路径影响公共建筑大数据质量.其中,只有统计方法的健全性要素通过公共建筑大数据可获得性要素单路径影响数据质量,其余各要素都是通过多路径对公共建筑大数据质量产生影响.
2)人员因素是影响公共建筑大数据质量的根本因素.统计人员的综合素质、管理者的综合业务素质以及统计管理体制合理性共同构成了影响公共建筑大数据质量的根本性影响要素,他们对统计数据质量的干预性最强.其中统计管理体制又离不开相关政府机构人员的修改和完善,归根结底是人对数据质量的好坏有着根本性影响.在新的大数据时代,公共建筑数据统计相关部门管理层人员应进一步补充大数据相关知识,做到与时俱进,重视公共建筑大数据带来的变化,挖掘公共建筑大数据的潜在价值,从根本上提高数据质量,为决策管理提供依据.公共建筑数据统计人员应增强自我学习和培训学习来提升能力以应对相关数据统计的变化,让自己处于数据时代的前线.
3)处于多种路径中的系统要素是保证公共建筑大数据质量的重要因素.数据搜集录入成本、数据库维护、存储格式和统计渠道的多样性、数据技术改进等处于多路径中的系统要素,它们为其他要素与数据质量之间架起桥梁,它们的改变或波动都会对其他要素造成影响.因此,确保多路径中的系统要素良性发展,是提高公共建筑大数据质量的重要保障.
与公共建筑大数据质量有关的影响因素众多且关系复杂,以往学者们大多单从某一方面研究影响公共建筑数据质量的影响因素,没有系统地对公共建筑大数据质量影响因素进行分析.本文通过构建解释结构模型,将公共建筑大数据质量影响因素间的层级结构及相互作用关系进行梳理和分析,丰富了提高公共建筑大数据质量的途径,为今后学者更有针对性提出建议措施具有借鉴意义,有利于未来公共建筑碳交易市场的发展.囿于解释结构模型只能做定性分析,对本研究造成一定的局限,有待运用定量方法并结合公共建筑大数据发展状况对以上结果进行验证.