居民出行轨迹信息可视化分析系统研究
2013-09-22李明轩张健钦仇培元杜明义严家宝
李明轩 ,张健钦,仇培元,杜明义,严家宝
(1.北京建筑大学,测绘与城市空间信息学院,北京 100044; 2.现代城市测绘国家测绘地理信息局重点实验室,北京 100044;3.中国科学院地理科学与资源研究所,北京 100101)
1 引言
近年来,随着我国城市化速度的不断加快,城市交通问题成为社会关注的热点,城市交通的畅通与否直接关系到城市化水平的高低[1]。因此,城市政府部门都将交通规划作为城市规划的重中之重,开展了大量的交通问题研究,其中以获取居民出行信息为主的交通调查是交通规划的重要基础工作[2]。
传统的居民出行信息分析方法一般通过家访调查、电话询问等人工调查方法获取居民的出行信息,如家庭住址、出行目的、出行次数、出行时间、出行方式、社会经济属性和个人与家庭属性等[3]。然后在计算机辅助计算下,通过相应的统计分析方法和数学模型得到城市交通量、OD矩阵等结果。虽然通过改进数学模型和统计方法能够提高分析结果的质量,但这些调查分析方法仍存在不足,表现在以下几点:
第一,分析方法以数理统计方法为主,面对海量数据很难挖掘其内在规律。
第二,在系统中由于缺少相应的时空数据模型支持,分析过程中很少考虑时间属性,没有在统一的时空体系下研究居民的出行活动。
第三,结果的表达以统计图表为主,没有结合GIS进行多维可视化图形展示,无法直观反映动态变化规律。
此外,随着GPS、手机等设备的普及,居民出行信息的获取方式也日益丰富和便捷,通过这些设备可以得到更加准确和详细的出行轨迹信息[4]。传统的出行分析系统很难对这些数据进行有效的存储和分析,而三维GIS以及时空数据模型为分析出行信息提供了新的思路,国内外也开展了相关的研究[5]。
本文主要讨论基于三维GIS技术的居民出行信息可视化分析系统的设计和建立。先从GIS数据模型的建立入手,研究建立一种管理和分析居民出行位置信息的时空数据模型。在此基础上进行分析系统的结构和功能的设计,并介绍使用居民调查数据和定位数据进行出行分析的原型系统的开发工作。最后对所做的研究进行总结,提出下一步的工作方向。
2 居民出行者GIS时空数据模型
2.1 时空数据概念模型
交通调查获取的居民出行信息记录了城市出行者一天完整的出行内容,包括空间、时间和属性多个方面的信息。通过记录的时间信息可以按出行活动的先后顺序将其排列起来,形成完整的出行轨迹。结合交通调查的特点,本文提出的居民出行者GIS时空数据模型概念模型如图1所示。
图1 出行者时空数据模型的概念模型
出行者的属性信息包含所属家庭信息和相关的个体信息,出行者的行为活动全部以出行表示。每一个出行用出行目的、出行方式和出行路径加以描述。其中出行路径又可以用多个出行的时刻及对应的位置来描述。能够看出时刻1即为本次出行的出发时间,位置1为出发位置,时刻n为到达时间,位置n为到达位置。
2.2 逻辑模型
设计逻辑模型的目的是从概念模型转换出现阶段关系型数据库能够处理的数据库逻辑结构,使这些结构能够满足用户在功能、性能、完整性、一致性和可扩展性等方面的要求。将概念模型转化后得到的出行者逻辑模型的关系映射如图2所示。模型中主要有三种实体类型:出行者、出行和路径。出行者类型(PERSON)中的属性包括出行者关键字(Pid)、出行者姓名(Name)、性别(Sex)、收入(Salary)、家庭角色(Role)、工作地点(Wplace)和职业(Occupation)等。其中Pid为主键,用以标识不同的出行者。出行类型(TRIP)中的属性包括出行关键字(Tid)、出行日期(Date)、出行者关键字(TPid)、出行序列号(Tnum)、出行目的(Ttype)和出行方式(Tmode)等。其中Tid为主键,用以标识不同的出行活动。TPid与PERSON类型中的主关键字Pid一致,用以将出行活动与发生该出行的出行者关联。Tnum用于记录出行者的多个出行活动发生的先后顺序。
图2 出行者逻辑模型中的关系映射(PK:主键)
路径类型(PATH)用来表示出行活动的行进路径,由于获取的出行路径实际上是由若干离散的点组成的,因此该类型中每条记录表示出行活动中某一时刻的位置信息。其属性包括路径点关键字(PAid)、出行关键字(PATid)、时刻(PAtime)和位置(PAlocation)等。其中PAid为主键,用以标识不同的路径点。PATid与Trip类型中的主关键字Tid一致,用以将路径点与该次出行关联。按PAtime属性排序得到路径点的时空先后顺序。
3 居民出行信息可视化分析系统设计
根据交通规划和分析的需求,以及前述提出的时空数据模型要求,系统的功能结构和数据流程如图3所示。
图3 系统的功能结构和数据流程图
研究中获取的原始数据可以分成三类:基础地图数据、人工交通调查数据和定位的位置数据。每种数据的内容、结构和获取时的存储格式各不相同,需要采取不同的数据导入、组织和管理方式。根据获取的原始数据格式和后续系统开发的要求,地图数据采用ArcGIS软件提供的Personal Geodatabase数据模型存储在本地的Access数据库中。调查数据和位置数据则用前述的居民出行数据模型保存在Oracle数据库中。各种数据间的关联和操作在系统中实现。数据导入系统并重新组织后,需要提供基本的数据操作和查询功能,并在此基础上设计出行数据的分析系统,包括传统的出行分析方法和可视化的分析方法两种。通过这两种分析方法得到的分析结果既要包括传统的OD矩阵、出行时间、出行距离等,也要包括时空路径、出行趋势等可视化信息。具体系统功能包括:
(1)数据管理;数据的导入,组织和维护。能将三种类型的数据导入数据库,并根据设计的数据模型对数据进行处理。最后,能对导入的数据进行维护,进行数据的更新和删除。
(2)数据查询操作;该部分主要提供有关数据查询的相关操作。包括常规查询操作,如获取指定出行者的个人信息、指定时间的出行轨迹、某次出行的出行目的等;对查询结果的显示,尤其是提供出行轨迹的时空路径显示功能。
(3)出行信息分析;该部分提供两大方面的功能。一是基于传统的数理统计方法的出行分析功能,可以从中获取出行OD数据,出行次数、出行方式、出行时间等信息。二是基于可视化分析方法的出行分析功能,包括路网的交通量分配,出行的动态趋势等。
(4)分析结果的显示和输出;分析的结果通过图形或者表格的形式显示在用户屏幕上,也可以根据要求打印成相应的统计文档。
4 原型系统开发
研究采用C#作为开发语言,结合Oracle数据库和ArcEngine,开发了基于三维GIS的居民出行信息可视化分析原型系统,实现对几类主要居民出行信息的存储、管理和三维可视化显示,并对居民出行轨迹进行相应的行程识别分析。
4.1 数据处理
居民出行轨迹信息可视化分析系统的数据处理除了一般的净化处理、格式化存储之外,主要针对各地理底图建立相应的路网结构和三维场景,并在出行轨迹信息这一部分进行了居民出行调查数据和定位数据两大类数据的处理。
(1)居民出行调查数据
居民出行调查数据一般通过问卷调查的形式采集,其中涵盖了多个交通区块的居民出行信息及居住地、出发地、出行方式、出行目的、出行距离等多种属性信息。系统将调查数据与交通区块矢量地图和路网数据进行属性关联和空间融合,并对形成的这种映射关系点对进行最短路径处理,从而赋予调查数据矢量地图特征,进而按照不同属性特征对居民出行进行动态分段处理,使之随着时空特性变化而变化。
(2)居民出行定位数据
居民出行定位数据根据设备的定位方式不同,主要包括手机网络定位数据和GPS定位数据两种。系统采用的手机定位数据为2008年1月份部分北京用户的手机位置数据,虽然手机定位精度较低,但由于其可在室内应用且非常便利,并能基本反映受访者的活动范围,尤其在交通调查中主要以交通小区作为活动调查单元时,手机定位完全满足实际需要,因而主要对其进行了相应的基站信息处理。
另一方面,系统从相关单位获取了部分采用浮动车出行(出租车和公交车)的定位数据,其中主要包括车辆编号、日期时间、经纬度、方向和速度等信息。但由于天气和高大建筑物遮挡影响以及地理底图矢量化过程和空间坐标系转换的关系,系统预先根据定位数据与地理底图的空间和属性关系,对这些居民出行定位数据进行了路网匹配处理,确定并得到它们在道路上的实际位置,以及在时空路径中相对准确的位置。
4.2 可视化分析
(1)时空路径分析
时空路径分析是根据实际需要显示单个或者多个出行者不同阶段或日期的时空轨迹信息,进而分析个人出行或者全部出行之间的规律。首先从数据库中查找一个人一天出行的路径点数据,按照时间顺序排列。之后将位置点转化为具有X、Y、Z坐标值的三维点。最后采用线性插值的方法将这些点连成轨迹线,实现单个或多个居民出行时空路径的显示,如图4(a)和图4(b)所示。
图4 居民出行时空路径可视化分析
(2)时间切片分析
时间切片分析是指定需要的研究时间,通过底图平面与轨迹相交,得到个体空间分布在该时刻的切片,以便直观地展示居民活动在某一时刻的分布规律。
一方面,系统通过修改地图平面的Z值,可以实现地图在时间轴上的移动,与时空路径相交形成时间截面,从而观察某一时刻所有居民出行的空间分布,如图5(a)所示。另一方面,系统中添加了一个工具条,用来选择需要移动的地图平面以及指定时间截面的时间,并形成这个时间的所有居民出行切片,如图5(b)所示。
图5 居民出行时间切片分析
另外,系统还可以综合考虑出行者和出行时间,以便直观地表现出行者与道路之间的关系。通过设置居民出行对象和时空路径截面时间,从而形成这些所选出行者在这一时间的道路分布图,如图5(c)所示。
(3)行程识别分析
行程识别分析是把时空分布上离散的轨迹点划分成停留点和移动点两大类,从而得出居民出行的行停位置和行停区间,进而一方面从停留位置和区间信息挖掘出有关停留时间、停留活动目的等信息,另一方面从出行位置和区间信息挖掘出如出行方式、出行时间、出行距离等信息。系统通过对居民出行定位信息划分行停速度阈值范围,并根据其时空特性进行聚类分析,赋予每条居民出行定位数据记录的行停属性,从而对居民出行时空路径划分出各个行停区间,如图6(a)所示。其中,用深色表示时空路径的停留活动区间,用浅色表示时空路径的出行活动区间,如图6(b)所示。
图6 居民出行行程识别分析
5 结论
通过三维GIS技术支持,并结合时空数据模型,可以改善出行信息和分析结果的表现形式,同时还能够提供可视化的分析方法,提高分析结果的准确性。此外,还可以将多种出行调查数据相互融合,提供更为翔实的出行信息。由于数据和其他条件的限制,原型系统中人工调查数据和手机位置数据还未能很好的结合,特别是手机位置数据缺少居住地、工作地、出行目的等出行属性的描述。并且数据量偏少,不具有很好的代表性。因此,下一步的研究方向是加强各种出行数据间的联系,并考虑与GPS数据结合。同时完善和扩充系统中居民出行分析的方法和功能,改进相关算法,提高数据的处理速度和系统的稳定性。
[1]刘学军,徐鹏.交通地理信息系统[M].北京:科学出版社,2006.
[2]张卫华,陆华普.城市交通规划中居民出行调查常见问题及对策[J].城市规划学刊,2005(05):86~90.
[3]王秉刚.中国水泥混凝土路面技术现状与发展[J].西安:长安大学出版社,2007.
[4]Yu,H.,Shaw,S-L,Representing and Visualizing Travel Diary Data:A Spatio temporal GIS Approach,Proceediugs of ESRI International User Conference[C].2004 ESRI International User Conference,San Diego,CA.
[5]Shaw,S-L,Yu,H.A GIS-based time-geographic approach of studying individual activities and interactions in a hybrid physical-virtual space[J].Journal of Transport Geography,2009,17,141~149.
[6]Tryfona,N.Jensen,C.Conceptual data modelling for spatiotemporal applications[J].Geoinformatica,1999,3,245~268.
[7]Hornsby,K.,Egenhofer,M.Identity-based change:a foundation spatio-temporal knowledge representation[J].International Journal of Geographical Information Systems,2000,14,207~224.
[8]Renolen,A.Modelling the real world:conceptual modelling in spatiotemporal information system design[J].Transactions in GIS,2000(4),23~42.
[9]Donggen Wang,Tao Cheng.A spatio-temporal data model for activity-based transport demand modeling[J].Geographical Information Science,2001,15(6),561~585.
[10]Hägerstrand,T.What about people in regional science[J].Papers of the Regional Science Association,1970,24(1),7~21.