交通设施空间数据查询系统构建
——基于SuperMap大数据地理信息系统
2022-05-21雷强胜
雷强胜 刘 立 俞 博
(重庆市交通规划研究院,重庆 401147)
随着经济社会的发展和物质生活水平提高,城市汽车保有量呈快速增长态势,对城市道路交通造成很大负担,部分交通设施已达到承受极限。在大数据时代,城市道路交通数据呈指数级增长,具有多源、异构、数量巨大等特点[1-3]。快速高效分析数据并将分析结果充分利用,可以提高交通基础设施的使用率及城市交通运行效率,是城市交通工作的重点。SuperMap大数据地理信息系统采用先进的大数据框架平台,能够满足技术人员及管理人员对交通基础设施数据的使用需求[4-5]。文章基于SuperMap大数据地理信息系统构建交通设施空间数据查询系统,为交通设施数据管理提供平台。
1 建设目标
建设交通设施空间数据查询系统的总体目标为实现跨系统数据共享,解决信息孤岛,提升数据管理能力,辅助决策分析,提供统一的数据服务。
(1)为解决查询效率低下、实时性差、缺乏空间查询等问题,基于交通设施空间数据查询系统建造数据仓库,提高交通数据的利用率,为领导的科学决策提供必要的技术支持。
(2)为实现交通海量数据的数据查询、分析性能和数据管理应用水平,创新性地利用大数据管理技术,为交通管理大数据决策、大数据分析、大数据作战、大数据监管和大数据服务打下坚实基础。
交通大数据管理平台界面如图1所示。
图1 交通大数据管理平台界面
2 需求分析
2.1 整合现有交通数据资源
各类交通设施数据分散在不同的应用系统中,各系统的数据接口、数据库结构等缺乏统一标准,数据发布未形成统一的标准,无法实现互联互通和信息共享,丰富的信息资源有待有效的开发利用,限制交通信息化整体效益的发挥,成为交通信息化建设中迫切需要解决的问题。构建交通设施空间数据查询系统,实现已有系统整合、优化,可以有效利用信息化资源。
2.2 整合现有系统需求
目前,已具有多个涉及交通设施数据的专题应用系统,随着信息化深入建设,相关数据系统数量会越来越多,需要对系统进行整合,避免一个用户使用多个系统、多次申请账号、多次登录的问题。
2.3 数据共享的需求
在“共建共享”模式要求下,交通设施空间数据查询系统必须是开放、可共享的。数据仓库的建设不仅能够满足本查询系统,也能够实现数据的对外共享能力。需要考虑数据共享过程中数据权限控制以及数据安全问题。
2.4 深化交通数据开发应用模式
综合运用大数据、可视化及地理信息技术,直观、生动地整合、呈现、分析数据,深挖数据价值,从传统纸质报表转向基于可视化形式,实时对城区交通进行研判、规划、决策。通过构建交通数据仓库,实现对交通行业信息数据资源的深度挖掘,提高数据利用价值。
2.5 提升宏观决策能力
随着大数据的发展,利用数据决策、根据数据说话、使用数据治理成为相关单位开展工作的重要方式,迫切需要建立综合的数据平台,快速、准确、实时地了解交通行业的发展情况,为加快新旧动能转换实施定向调控和精细化管理。通过构建交通数据仓库,综合运用大数据分析、大数据挖掘及大数据可视化等技术对交通情况进行实时监测,能够更全面、准确地反映发展情况,为领导决策提供更精准的应用服务。
3 系统设计原则
3.1 开放性原则
交通设施空间数据查询系统的架构应是开放的,支持各应用系统间的分享硬件资源、软件资源、网络资源、开发接口和关于地理信息功能软件的服务。
3.2 可扩展性原则
系统架构应具备先进性和可扩展性,保证后期需要对系统进行升级改造时,能够保护现有的投资。系统的结构应合理,具有良好的可扩展性,能够比较容易地适应调整、扩充和删减;能够与其他系统的接口兼容,充分利用各系统的特长。
3.3 实用性原则
系统设计应结合实际需求,围绕应用,注重实效方针,利用成熟技术,设计界面美观、布局简洁、功能实用、操作方便的系统,解决用户实际业务问题。
3.4 安全性原则
全面考虑系统运行的安全性,从物理环境(包括机房、网络及设备)、数据层面、应用层面、安全管理制度等方面进行全方位的设计。部署在公有环境的应用涉及的计算资源、存储资源以及地理信息数据和专题数据等信息必须符合相关保密安全要求。
4 系统设计思路
4.1 构建交通大数据仓库
围绕各部门的实际需求,通过数据汇聚、数据清洗、数据转换、数据融合、数据发布等过程,形成权威统一的交通大数据仓库,实现交通大数据全生命周期管理。
4.2 建立标准化、流程化、自动化数据仓库
汇聚各信息系统的多源异构数据种类多、类型复杂,各类数据具有不同的更新频率及更新方式,人工处理的工作效率较低,无法持续投入建设。因此,实现数据仓库自动化运行成为该项目建设的重要内容。
数据仓库建立包含数据汇聚、转换、存储等多个阶段,为了满足处理流程自动化运行要求,需要完成数据汇聚标准化、数据处理流程化、流程运行任务化、任务执行可监控等内容的设计与建设。
4.3 部门协作,开放共享,集成应用
围绕业务工作的整体流程,开展多部门间的协同应用,通过数据仓库及查询系统建设,充分利用数据在业务协同中的价值,通过统一的数据服务接口对外开放应用,实现“数据协同、业务共享”。
5 总体技术路线
5.1 基于大数据计算和存储技术,支持超大规模数据在线处理和管理
交通设施空间数据具有大数据的4V特性。本项目构建的时空信息数据种类多样、数据量大,具有挖掘分析的价值,需要使用大数据技术进行管理。
时空信息数据的存储、管理和分析需借助支持时空大数据的GIS专业软件。传统的GIS软件以数据获取、存储、管理功能为主,添加各种时间维度和空间维度的专题图展示功能,可以实现空间统计、地理分区、路径分析、选址优化等空间分析功能,在城市建设、交通运输、气象预测、区域发展、决策支持等方面发挥非常重要的作用。针对时空大数据,现有数据管理和分析算法难以扩展到大规模的分布式并行计算系统上、无法满足对非结构化的未知数据的探索性分析的需要。因此,需要基于最新的虚拟化计算基础设施(如OpenStack/Docker)和分布式计算架构(如Spark/Hadoop)技术构建GISpark,支撑时空大数据分析。本系统基于SuperMap构建,充分利用SuperMap在空间大数据存储、处理方面的强大功能。
5.2 基于数据仓库技术,实现多源数据融合与联机分析
数据处理系统大致可以分为联机事务处理OLTP、联机分析处理OLAP两类系统。OLTP对实时性要求高,主要处理数据库记录的增删改查等基本的日常事务,通常用于业务应用系统的建设。OLAP系统的实时性和事务性要求不高,数据仓库主要采用OLAP系统建立,支持大数据量的分析操作,侧重决策支持,提供直观、丰富的结果展示形式。
数据仓库需要将各业务应用系统的数据汇聚,数据体量和并发量较大,符合数据仓库系统的特点,基于数据仓库可以形成涵盖时间、空间以及属性的多维数据体系,支持多维数据分析,构建可持续更新的城市指标体系,支撑智能化的业务模型和业务应用。传统的OLTP数据管理方式已经不能满足需求,迫切需要为时空大数据与云平台建立数据仓库系统,以满足大量的数据分析和挖掘工作,提高平台的智能化程度。
5.3 利用Geo-ETL技术,实现数据的汇聚融合
随着数据库技术的应用和发展,研究人员尝试对数据库中的数据进行再加工,形成综合的、面向分析的环境,更好地支持决策分析,形成数据仓库。在数据仓库建设中,业务数据库中的数据向数据仓库迁移的工作量较大,因为原有数据库的数据标准不统一、数据形式不一致。ETL工具为解决数据迁移过程中的问题,将数据进行“净化提炼”,装入数据仓库,是建设数据仓库的重点之一。
建设交通设施空间数据查询系统时,利用Geo-ETL技术从数据源中抽取需要的数据,清洗数据,按照预先定义好的数据仓库模型将数据加载至数据仓库中,完成数据从数据源向目标数据仓库转化的过程。
5.4 基于新一代地图服务技术,实现数据即时发布与个性化表达
大数据分布式计算新一代地图表达技术支持影像、矢量、三维数据的标准化建库、自动化制图和电子地图的一键免切图快速发布和即时浏览,以矢量瓦片方式支持动画、动态和演示模变化,实现地图数据的个性化、动态化表达。
以时空信息为基础,将全市二维、静态、动态等信息资源,通过一体化技术手段进行展示与应用,提供个性化配图功能。用户可以按照不同需求,定制包含不同的个性化地图,配置地图风格,满足各专业部门对不同专题信息的需求。
6 系统设计
(1)组合查询及自定义空间范围查询分析。
整合各类交通汇总数据,提供基于地理信息的查询与分析。综合数据查询结果,以统计表格、统计图、专题图的形式展现;支持对交通数据按照空间要素查询;支持按照定制的区域进行定制分析;支持自定义区划分析,自定义的边界,基于地理信息对数据进行空间筛选和统计分析。
交通大数据查询功能如图2所示。
图2 交通大数据查询功能
(2)空间GIS分析。
系统支持空间和属性分析,通过构建统一的空间地理分析框架,实现交通信息的全面整合,为各专业用户提供灵活、多角度的空间GIS分析,包括缓冲分析、热力分析、空间求交等。
(3)CAD数据上传叠加。
支持带坐标的DWG格式的CAD规划数据上传,可以叠加至现有数据图层,进行叠加展示。
(4)方案分屏查看。
系统支持在地图上叠加规划方案,通过多屏展示方式进行方案对比联动,对多个设计方案或不同的调整结果进行比较。
(5)数据导出。
实现系统数据的导出,包括查询数据结果、专题地图、渲染图等,为用户提供统一数据导出工具。
(6)流量监控及报警。
提供高频访问探测、数据防泄漏功能,自动探测与制止恶意扒取数据行为,主要功能包括流量监测和数据异常告警处理功能。
7 结语
重庆交通设施空间数据查询系统已应用于交通规划、交通管理、交通研究等领域,基于SuperMap大数据地理信息系统的框架对支撑多行业应用起关键作用。