城市测绘地理信息档案多源数据融合能力评估指标及方法
2023-09-11张莹莹
张莹莹
(西安市勘察测绘院,陕西 西安 710054)
1 引言
伴随着中国测绘技术水平步入国际领先水平行列,城市测绘地理信息数据的应用逐渐广泛,对国家基础设施建设和民生保障等工作起到了重要的作用。城市测绘地理信息档案资源建设工作引起各级部门的高度重视,尤其是计算机技术的日益成熟以及大数据时代背景下数字化建设平台的日益完善,既给城市测绘地理信息技术档案资源建设提供了便利的条件,也增加了工作难度。城市测绘地理信息是国务院认定的促进国家大数据发展行动中基础设施建设的重要内容[1]。近年来,各地城市测绘地理信息管理部门已经在测绘领域积累了与城市规划、建设、管理等相关的大量基础地理信息数据,这些数据在各级政府部门政策研究、应急响应、基础设施建设、规划发展等环节起到了重要的作用[2-5],但存在数据体量大、管理难、深度挖掘技术落后、数据可视化水平较低的问题,城市地理信息数据的潜力未能得到有效开发。研究基于城市测绘地理信息档案的工作内容及特征,探讨多源数据融合能力在档案信息管理中的应用,以此为理论基础构建可评估地理信息单位在城市测绘地理信息档案建设中多源数据融合能力的综合评估指标体系,并提出适用的评估方法,获得的评估结果有助于各级单位及时调整和优化数据融合能力,实现城市测绘地理信息档案更好地为国民经济和社会进步服务。
2 城市测绘地理信息档案多源数据融合基础理论
2.1 城市测绘地理信息档案内容及特征
城市测绘地理信息档案是指城市测绘地理信息技术主管部门及档案管理部门在测绘生产过程中基于城市建设等活动形成的建档保存的各类技术文件、标准规范、基础数据、计算数据、测绘成果、航空照片、卫星照片、图纸图表等。根据原国家测绘地理信息局与国家档案局2015年联合发布的《测绘地理信息档案业务规定》中指出的共计14类信息,涵盖了航空航天、大地测量等。目前城市测绘地理信息档案按档案形成阶段可以分为管理类档案、技术类档案、成果类档案,信息档案的形式主要以文字、数据、图标、电子文件、数据库等为主。随着我国城市建设速度加快,城市测绘地理信息档案资源呈现出数据体量大、数据类型多、利用率不平衡等多种特征。
针对城市测绘地理信息数据量大的特点,分析其发展背景发现地理信息数据及档案资源都是与城市建设、人类居住生活、基础设施、城市现代化等领域紧密相关的,因此呈现数据体量较大的特点。尤其近年来伴随着信息技术手段的不断完善和提升,以及现代化测绘技术的普及,人类发展与自然资源及城市建设的协同程度逐步提升,导致与城市测绘地理信息建设相关的数据资源、数据渠道更加丰富和多元化。
城市测绘地理信息档案资源中的数据类型,既包括文字与图片表格等形式,还包括不同数据库、不同来源的大量基础数据,以及音像等特殊形式。城市测绘地理信息的数据涉及了城建、航空航天、应急保障、水下测量、在建工程、不动产测量、地图绘制等专业领域,应用领域包括了地图维护、信息监测、科学研究等方面,因此对于数据融合的需求更高。
近年来城市地理测绘信息技术得到了国家的政策扶持并飞速发展。尤其是在城市基础设施建设和城市应急保障领域,数据的融合和协同应用起到了重要的作用。
2.2 多源数据融合在城市测绘地理信息管理中的应用
多源数据融合技术是指在专业数据收集过程中通过计算机科学、大数据平台、数据挖掘与处理等手段将与研究领域相关的信息全部综合到一起获得统一的信息。多源数据融合技术的关键是将不同类别、不同类型、不同来源的数据进行综合并使其形式统一,将多种来源的数据用丰富、多元的形式呈现给有需求的单位。本节将多源数据融合技术在城市测绘地理信息管理中的应用方式进行介绍。
第一,原始数据积累。在计算机技术和数据获取能力较弱的时期,传统城市测绘地理信息数据主要依靠测绘生产部门在日常工作中收集的现实资料和信息为主,这种获取数据的方式消耗极大的人力和物力,并且数据后期需要手动录入或人工整理,令数据的精确度和完整性大打折扣。而多源数据融合发展下,可以借助大数据平台和网络技术的发展,在不同类型和主题的网络平台搜集与城市地理信息相关的有价值的信息和数据,以此作为城市测绘地理信息档案的扩充,更加丰富城市地理测绘信息原始数据积累的途径。
第二,数据挖掘。基于城市测绘技术不断更新,获取了更丰富、形式更加多元化的地理信息技术,加之在多源数据融合技术推动下城市地理信息原始数据的积累方式也更多样化,所以逐渐出现城市测绘地理信息数据内容复杂性和庞大体量的特征。基础数据的丰富如果不能有效的转化为城市发展各行业需要的数据,那么收集基础数据也失去了意义。然而如果仅依靠人工来对大量的基础数据进行挖掘和利用的话,又存在效率低下、误差较大、投入资金较多的问题。多源数据融合技术有助于城市测绘地理信息基础数据和原始数据挖掘分析,可以将基础数据经过分析、整理、开发和利用后有效地提升原始数据的应用广泛性。
第三,数据自动更新储存。目前对于城市测绘地理信息档案部门而言,原始数据及加工处理过的数据在存储方面仍然是档案管理部门工作中的重中之重。档案管理的工作繁琐和储存风险,是该领域内的难题之一。多源数据融合技术对城市测绘地理信息的数据整合高效化和分类入库智能化的实现有显著作用;此外部分城市测绘地理信息档案能够实现云存储和自动更新功能,便于垂直部门在数据管理方面的协同化管理和入库,减少部门间交叉重复工作。
3 城市测绘地理信息档案资源建设多源数据融合能力评估
基于第二章节阐述的城市测绘地理信息档案多源数据融合基础理论体系,结合多源数据融合在信息档案管理工作中的应用,就城市测绘地理信息档案资源建设单位在基础数据获取、数据挖掘分析、数据储存共享3方面的能力构建综合评估指标体系,采用层次分析法为指标赋权,可有效对各级单位的信息档案建设过程中多源数据融合的能力进行分析,及时掌握建设短板,优化发展策略。
3.1 多源数据融合能力评估指标体系
在建立城市测绘地理信息档案多源数据融合能力评估工作时,选取基础数据获取能力、数据挖掘分析能力、数据储存共享能力3个指标作为一级指标,并结合城市测绘地理信息档案资源现代化建设要求和标准,以及多省市建设多源数据融合平台的工作方向,选取9个二级指标细化城市测绘地理信息档案资源建设过程中基础数据获取、数据挖掘分析、数据储存共享3方面的能力评估,依托基础理论研究和各地数据资源建设经验,构建的多源数据融合能力评估指标体系,详见表1。
评估城市测绘地理信息档案基础数据获取能力的3个二级指标依次为历史数据完善程度、地理信息档案资源平台建设水平、数据来源多样化程度。各指标含义如下:
表1 城市测绘地理信息档案资源建设多源融合能力评估指标体系
P11:历史数据完善程度,代表城市测绘地理信息中前十年数据完整程度;
P12:地理信息档案资源平台建设水平,代表城市测绘地理信息档案资源平台建设现代化、智慧化水平;
P13:数据来源多样化程度,城市测绘地理信息档案基础数据获得的渠道,主要考虑统计年鉴、各机构官方网站数据、各科研机构统计数据、其他网络数据等多方渠道的数据获取情况。
评估城市测绘地理信息档案建设平台数据挖据分析能力的3个二级指标依次为城市地理信息数据挖掘能力、城市地理信息数据分析能力、知识图谱应用率。各指标含义如下:
P21:城市地理信息数据挖掘能力,城市测绘地理信息档案建设单位对数据库中海量数据中进行探究、收集、获取的能力;
P22:城市地理信息数据分析能力,城市测绘地理信息档案建设单位对所获取的数据通过人工智能、机器学习、传统统计学及模型等工具进行梳理、整合、运用的能力;
P23:知识图谱应用率:城市测绘地理信息档案建设单位对地理信息数据及技术用节点和关系构建知识图谱并将其运用到档案管理工作的转化率。
评估城市测绘地理信息档案数据储存共享能力的3个二级指标依次为城市地理信息数据储存功能、城市地理信息数据动态更新功能、城市地理信息数据共享能力。各指标含义如下:
P31:城市地理信息数据存储功能,代表城市测绘地理信息档案建设平台对所获取的城市地理信息数据储存工作的安全性、时效性等工作能力;
P32:城市地理信息数据动态更新功能,代表城市测绘地理信息档案建设平台对所获取的城市地理信息数据在所建设平台上分公开、半公开、内部可见的动态更新时效性和精准性;
P33:城市地理信息数据共享能力,代表城市测绘地理信息档案建设平台与所在省市级单位、原国家测绘地理信息局、其他相关联机构或单位之间进行数据共享及应用的能力。
3.2 多源数据融合能力评估工作流程
城市测绘地理信息档案资源建设多源数据融合能力的评估工作采用专家打分法、李克特量表、层次分析法逐步展开。对评估单位的多源数据融合能力评估指标体系中二级指标的分值可通过专家打分法及李克特量表获取。李克特量表常用于构建各类型调查问卷时使用,属于评分加总式量表最常见的一种。在评分过程中通过邀请上级主管部门、同级别兄弟单位、区域内测绘地理信息业务交叉部门的多方专家,以回答李克特量表问卷的形式对被评估单位的二级评估指标进行打分,可采用十级李克特量表构建多源数据融合能力评估问卷,将各指标获得的专家评分均值作为二级指标的评估值。
在获取城市测绘地理信息档案资源建设多源数据融合能力评估指标体系9项二级评估指标分值的基础上,还需通过层次分析法确定一级指标、二级指标的权重。层次分析法是指将于决策总是相关的各元素分解为目标、准则、方案等层次,在此基础上进行定性和定量分析的决策方法。层次分析法在运筹学、定量、定性分析中应用非常广泛。首先通过各指标之间的两两比较构成判断矩阵表,再经过一致性检验后确定各项指标的具体权重。经过对基础数据获取能力、数据挖掘分析能力、数据储存共享能力的判断矩阵表,确定3个一级指标的权重依次为0.426、0.283、0.291;9个二级指标的权重依次为0.181 5、0.120 6、0.124 0、0.120 6、0.080 1、0.082 4、0.124 0、0.082 4、0.084 7。
将专家打分结果处理后的二级指标平均值与对应的权重加权求和,获得各项一级指标评分值,再次加权求和后获得被评估单位多源数据融合能力评估结果。根据等级划分标准的相关研究和国际惯例,将城市测绘地理信息档案资源建设多源数据融合能力划分为优秀、良好、中等、合格、不合格5个等级对应的分数区间为[10,9)、[9,8)、[8,7)、[7,6)、[6,0),见表2。。
表2 城市测绘地理信息档案资源建设多源数据融合能力等级划分标准
3.3 多源数据融合能力评估总结
城市测绘地理信息档案多源数据融合能力评估工作的开展有利于各级单位对资源建设中多源数据挖掘、分析、储存的能力有清晰的定量分析结果,有利于被评估单位在建设城市测绘地理信息档案现代化数据库的过程中及时了解工作的不足和滞后性,根据评估结果及时进行相应的调整和提升策略。
评估总结工作还可将测绘地理信息管理上级主管部门、同级别兄弟单位、测绘地理信息业务交叉部门3个方面打分单独统计进行评估,将不同打分主体单位的评估结果进行横向对比,了解被评估单位在多源数据融合能力建设过程中的具体不足和出现的领域,并针对相应的缺陷进行技术交流和业务学习,解决城市测绘地理信息档案建设工作中现代化滞后、智慧化不足的问题。
4 小结
综上所述,多源数据融合能力在城市测绘地理信息档案资源建设现代化建设中起到关键的作用,对于提升城市测绘地理信息业务档案的管理智能化和成果运用多元化效果显著。研究注重依托城市测绘地理信息档案多源数据融合能力的基础理论构建评估指标体系,并采用定量分析进行能力评估,有助于各级单位及时关注多源数据融合技术的应用,可大幅提升地理信息单位在城市地理信息数据收集、挖掘分析、存储共享等方面功能的实现,真正达到地理信息档案管理工作从实体管理向知识管理的转变,具有重要的现实意义。在未来研究中,可根据相关单位的具体工作进行实例分析,将所研究的评估指标体系和方法付诸实践。