面向地理信息大数据的时空事件关系可视化分析框架
2020-01-03李金磊慈谕瑶郭绍龙燕继红陈宇萍吴艳民李仕漪
李金磊,慈谕瑶,郑 坤,郭绍龙,燕继红,陈宇萍,吴艳民,李仕漪
(1. 中国石油化工股份有限公司勘探分公司,四川 成都 610041; 2. 中国地质大学(武汉)地理与信息工程学院,湖北 武汉 430074; 3. 北京创时空科技发展有限公司, 北京 100083)
地理信息大数据蕴含丰富的时空语义信息,利用可视化方法挖掘其中的时空关系模式可以直观地表示时空关系特征,为智慧城市的发展提供帮助[1]。大量不同类型的地理信息大数据反映了相应事件的空间分布[2]。这些时空事件中隐藏的信息可以进一步探索事件之间的演变过程,反映城市的交通模式[3-4]。
由于移动数据的不断增长,其数据集变得非常庞大,数据内容也变得尤其复杂[5]。传统的方法在挖掘多尺度、多语义的数据关系上存在许多困难。尽管有许多研究提出了一些可视化方法或框架(如TrajGraph[6],TrajRank[7],以分析移动时空模式,但针对时空事件及其背景之间的时空关系可视化方法尚未提出,同时关于时空关系多尺度和多语义特性的数据集解释也并不完整。
为解决上述问题,本文首先定义与分析问题相关的特定的时空事件;然后对时空关系进行抽象定义,并且设计一个可视化系统展现时空背景之间的多语义关系;最后实现交互式多视图界面,结合用户感兴趣的区域与时间段展示时空事件间的关系。
1 时空事件关系可视化
1.1 时空事件提取
时空事件可定义为一个或多个对象发生的具有时空特征的事件,如移动属性(如速度、方向等)的变化、对象之间的相遇等。时空事件根据对象的多少可分为个体时空事件和群体时空事件[8-9]。
时空事件(E)由事件发生的空间位置(S)、时间间隔(T)、事件属性(A)组成,可表示为
E→S×T×A
(1)
目前,大部分研究通过设定空间属性的阈值提取时空事件。其中有通过选择合适的参数进行移动对象相遇探测的研究,如空间窗口(ΔS)和时间窗口(ΔT),比较有代表性的有Flower diagram maps与Growth ring maps,利用环形的图表表达事件在不同地方发生的周期模式。文献[10]提出了一种可交互的过滤工具,帮助分析者提取移动事件并查看结果。文献[11]描述了一种可视化查询工具,根据一个或多个动态属性的值计算和可视化移动特性与距离,以及选择上下文元素和过滤轨迹段等进行分析操作。
然而,上述方法仅胜任提取一些属性相关的事件,并不能提取和表达事件之间的时空关系,以及空间和时间的多尺度及多语义特性。载客事件作为停车事件中一种特殊事件,从基于速度值和载客状态信息的车辆轨迹中提取而得,另外附加背景用于将有意义的载客事件从非有意义中分离,因而,可视化表达应与移动事件提取过程结合在一起,提供不同时空尺度时空关系可视化。
1.2 关系可视化
关系可视化是挖掘时空事件及其背景元素之间关系的重要手段。传统方法大多采用玫瑰图[10]与年轮图[12]等可视化方式表达事件发生的周期性关系,但该方法无法显现移动对象或移动事件与时空上下文之间的时空关系。一些常见的可视化技术对轨迹数据进行分析,诸如时空立方体和静态图,它可用于探索移动物体和时空上下文的元素之间存在的时空关系,但存在一定局限性,当时空关系没有明显聚集现象时,混乱、重叠的视觉元素使轨迹信息难以捕捉。为解决上述问题,文献[6]提出了节点链接图视图,图中存储并展现了对象的移动轨迹,可以用来研究关键区域的时空关系。
受TrajGraph的启发,本文认为节点链接图是一个更好的表达关系的可视化形式。但由于时空关系的复杂性,节点链接图在表示这些时空关系时会存在许多困难:为呈现空间特性,必须将关系图连接到地图中的真实位置或一些其他地理参考;为呈现时间特性,需要一个动态图形来表示不同时刻或时空关系中不同的时间间隔。
2 多视图协同时空关系可视化框架
2.1 时空关系定义
在可视化探索的初始阶段,首先需要定义从轨迹中想要发现的时空事件,接着找到时空事件之间的关系并分析其含义。
时空关系定义:一个或多个对象之间发生的特定时空关系,以及与其他时空背景元素(如空间对象和时空事件)发生的时空关系。此定义涉及物体在空间的位置及被选定对象在一个时间段内的相互关系[13]。本文主要从事件之间的时空关系、事件及背景之间的时空关系两方面表达时空关系。
(1) 事件之间的时空关系。事件1(E1)和事件2(E2)时空关系的一般定义
R(E1,E2)={ΔS,ΔT,A}
(2)
式中,ΔS为E1与E2之间的空间关系;ΔT为E1与E2之间的时间关系;A为E1与E2的属性信息。以乘客上、下车的时空事件为例,首先选择一个事件集合,然后设置上车或下车的事件描述参数,事件E1与事件E2之间的关系如下
R(E1,E2)={{adjacency},{contemporary},{statuschange}}
通过R(E1,E2)可以规范化描述某块区域内乘客上车与下车之间时空关系所需要的时空约束信息,即事件在空间上要相邻,在时间上几乎同时发生,并且车辆载客状态发生变化。
(2) 事件及背景之间的时空关系。事件及其背景之间的关系会随着空间位置或背景要素的改变而发生变化。
事件和时空要素之间时空关系的一般定义为
R(E1,C1)={ΔS,ΔT,A}
(3)
式中,ΔS为事件及其背景间的空间关系;ΔT为事件及其背景间的时间关系;A为事件的属性信息。
2.2 时空关系可视化框架
本文设计了一种可视化框架。该框架包含时空事件提取阶段和可视化阶段,并设计视觉编码高亮表示移动关系中的重要信息。时空事件提取阶段主要包含:①定义需要提取的时空事件;②设置查询约束从时空数据中提取事件;③通过交互探索,设置关系约束条件,使用动态聚集方法提取事件的时空关系。
在可视化阶段,本文提出多视图协同展示的可视化方法,构建的协同视图可以促进更多具有创新性和有效性的分析,帮助分析者选择感兴趣的项目并关注分析的过程,而不会受到干扰[14]。该方法将轨迹与时空事件绘制在地图上进行全局探索,通过图表显示事件间的关系,用户可以通过筛选空间区域及时间范围,提取感兴趣的时空事件及其关系。其中,地图视图使用流型图(flow map)技术,事件以点要素的形式分布,通过玫瑰图表达事件的位置和周期性特征;在时间视图中,分别利用线性图与日历图表示移动事件的统计信息与相应的周期性特征;力导向图可使用户有效地探索重要区域中事件间的关系,在避免节点重叠的同时保持顶点的相对位置,根据实时状态自动完成较好的聚类,方便看出事件之间的亲疏关系。此外,由于事件数量庞大,配合矩阵图可以清晰表达整体间的关系信息。
3 试验分析
基于多视图协同时空关系可视化框架,本文实现了一种可视化原型系统,如图1所示。该系统包含地图视图、关系图视图及时间视图,多视图结合构成一个用户友好的交互界面,用户可以由此探索信息是如何相互关联的。
本文试验得到轨迹数据共计24 000万条,达20 GB,覆盖4000辆出租车,自2013年1月10日至2013年8月25日,时间跨度为83 d。轨迹数据中包含每个车辆唯一的ID号、时间戳信息、车辆位置、车辆的速度大小及车辆的载客信息。
3.1 时空关系提取
提取时空事件中的时空关系,需要发现事件。通过计算对象的位置和时间背景要素之间的距离发现事件是常见的提取方法[11,15]。本文以载客事件为例,通过设置空间距离和时间距离参数提取时空关系。
如图1中的②所示,首先选中需要分析的车辆车牌号码,并设定时间范围;然后,设置需要分析的时空拓扑关系参数,如将距离设置为100 m,时间间隔为1 min,点击执行按钮便会立刻查询该时间段内3辆车之间的时空关系;最后提取车辆的载客事件,即搭载乘客的事件点。
3.2 时空关系可视化
本节以载客事件为例,结合地图视图、时间视图、关系图视图,直观地展示事件间聚集关系、时间关系,表达城市出租车运营状况,反映城市出行需求密集区域的时空变化模式。
车辆ID号为32760、14285、09127发生的载客事件在时间上的分布情况,如图2(a)所示,3辆出租车的分布情况相似,停车事件多集中在下午3点至晚上9点,轨迹间的时间关系可通过时间图了解。结合地图视图分析,出租车32760主要分布在关山街道,出租车14285主要集中在汉口区,而出租车09127主要活动于武昌区。
通过可视化多个车辆载客事件之间的时空关系,可以发现城市热点区域所需用车的时间段。如图2(b)所示,连接图中多数为2个节点相连,少有3个节点,说明3辆车之间载客事件发生相对分散。以探索出租车14285和32760的空间关系为例,结合图2(b),在5月28号中午12点前后时间段内,出租车14285和32760几乎同时搭载到乘客,并且发生在武昌火车站与广州军区医院附近,从一定程度上可以反映该时刻火车站与医院附近乘客较多。从时间分布图中也可以看出在中午时间段内载客事件发生次数也多。依据用户的知识背景,可以进一步选取更多的出租车进行分析。
至于事件及背景之间的时空关系,以珞喻路为例,使用流图与玫瑰图确定载客事件及空间背景要素之间的关系。如图2(a)所示,大多数载客事件发生在早上和晚上,那时正是上下班时间。此外,十字路口附近的载客事件相比于其他路段较多。本文认为,载客事件不仅与街道、时间有关,而且与十字路口和主干道有关。通过研究交通灯的空间分布,可以探索这些事件与交通灯及其他交通设施之间的关系。
4 结 语
本文首先提出了一种新的方法来直观地探索地理信息大数据下时空事件及背景之间的时空关系,给出了事件间时空关系的一般定义,并设计了一种可视化交互工具来提取事件。然后,通过3种相互关联的视图协同显示界面,结合上下文和焦点的交互技术进行深入分析从而探索不同视角、不同尺度的信息,可视化不同维度的结果。最后,基于时空轨迹数据,完成了出租车载客事件的时空关系交互可视化与分析。证明了该方法在分析时空事件及背景间时空关系上的有效性与高效性。在后续研究中,可将该原型系统扩展到分布式计算环境,以适应大规模数据的分析计算,提升系统效率。