基于多源数据融合的江苏省水运出行服务分析
2021-02-09周君
周君
交通水运行业作为整个交通运输行业的一个重要组成部分,在交通运输发展中起到的积极作用越来越显著。本次研究利用AIS数据、VITS数据、船闸数据、港口数据等进行数据融合,分析江苏省内、省外船舶OD及水运货运OD特征,建立江苏省的船舶、企业、港口、船闸、船舶行驶OD等基础数据库,为整个航道网络水运货运量运输组织提供参考依据。
一、引言
各种交通数据之间各有特色,之间又有着千丝万缕的联系,在大量数据汇聚的“交通互联网”包含着人、车、路、城市之间联系,而这种最基础的交通联系,即回答“人往何处”的问题,回到乘客OD出行的问题。OD出行需要精确的描述乘客出行的出发地、目的地、交通方式、出行路径、路网状况等,需要对大量的乘客进行个性化分析;然而单一的数据源很难兼顾精度与广度,也就影响了需求分析精度和交通项目决策的科学性。为了弥补单一数据源精度广度不能兼顾的缺陷,本项目将对多源大数据进行融合分析,实现更多的分析需求,使分析达到更高的精度;通过不同数据汇聚,构建完整的“交通互联网”,抽象出完整的交通OD信息,供交通规划、决策和管理者使用。
二、多源数据简介
目前交通系统中存有大量交通数据,通常包括静态数据与动态数据。按采集时间不同,获得动态数据能描述断面历史与实时的交通状态特征。按采集地点变化,获得的交通数据能描述整个路网交通流空间分布特征。按采集方式差异,人工调查数据能直接解析调查区域交通出行特征与规律,但数据量有限且主观性强、更新周期长;车检设备数据能提供检测地点的交通流特征,但精确性与布设密度有关;浮动车GPS数据能提供行驶路段区间的运行参数特征或单个车辆的实时运行特征,但稳定性、连续性差;手机信令、公交IC卡数据,获取方便、内容完整、更新连续,能提供交通出行的精细化过程,但巨量数据分析与处理过程繁琐。因而,不同的交通数据在时间、空间、侧重点及用途上都表现出差异性,能以不同程度描述目标路段交通流运行特征。综合分析、处理多源交通数据就能得到全面、可靠与互补的交通信息。
三、水运OD获取及研究
(一)水运数据的获取
近几年,随着各类行业内的需求涌现出许多业务应用系统,从交通运输水运行业管理部门到各省交通运输厅、港行管理局、航务管理局,业务数据以数量级的增长趋势日益明显。为更好地从各类水运数据中提取数据,实现交通水运信息化,提高交通水运行业的科学管理和组织服务水平,同时提高水路运输的效率、安全性、整体效益,切实解决制约水运行业发展中的瓶颈问题,需要获取水运航道数据;港口、码头、船闸等水运基础设施数据;江苏省内河航道船舶VITS数据;港口吞吐量包括分装(卸)货港分货类的吞吐量;港口吞吐量核查;经济指标调查数据等。
本次研究利用AIS数据、VITS数据、船闸数据、港口数据等进行数据融合,分析江苏省内、省外船舶OD及水运货运OD特征,建立江苏省的船舶、企业、港口、船闸、船舶行驶OD等基础数据库,为整个航道网络水运货运量运输组织提供参考依据。其主要处理方法如下:
省内船舶及水运货运OD特征:江苏省船闸数据包括江苏省内河过闸船舶名称、时间、运输货物起讫点、货种、货运载重等信息,船闸数据货运起讫点数据不准确,会影响水运货运OD的精准性;VITS数据是江苏省内河运行的船舶轨迹数据,准确记录船舶名称、经纬度、运行时间等信息,通过参数设定,可以判断船舶运行状态、OD等。通过将VITS数据与船闸数据融合,利用VITS数据校准船舶起讫点数据,获取准确的江苏省内水运货运OD。
省外船舶及水运货运OD特征:江苏省港口数据包括江苏省港口港区名称、货运起讫点、进出港、内外贸、货种、货运量等信息,港口起讫点主要是人工上报数据,数据描述比较粗糙,无法细致描述水运货运的运行OD;AIS数据是沿江、沿海船舶运行GPS数据,其准确记录船舶名称、经纬度、时间、运行状态等信息,可以判断船舶的实际运行OD。将港口数据与AIS数据进行融合,借助AIS校核港口起讫点数据,可以准确获取江苏省与省外、世界港口货运OD空间分布特征。
(二)水运数据预处理
1. 轨迹数据重构
结合航道走向、AIS数据、VITS数据的邻近时刻、经纬度等信息,借助GIS对VITS缺失数据进行轨迹重构,补全完整的船舶运行轨迹。
2. Date时间格式转化
利用P y t h o n语句将V I T S数据的时间格式TIMESTAMP(12小时制)转为DATE(24小时制)重新进行时间存储。
3. OD甄别
结合船舶的轨迹数据,对疑似停靠点进行判断,利用区间距离、停泊时长来区分船舶是在船闸处停泊、临时停泊还是真正意义上的靠港停泊。
4. 关键参数标定
利用数理统计、聚类分析的方法,将速度小于0.5千米/时、区间行驶距离大于10千米、停泊时长大于3小时的判断为真正意义上的靠港停泊,即本研究中所指的OD。
5. 利用时空参數(区间距离、停泊时间)计算OD
AIS数据、VITS数据可以实时回传船舶在江河运行的实时位置、速度等信息,为跟踪船舶时空位置信息提供关键数据支撑。利用时空数据计算OD的主要技术路线如图1。
距离判断。每一条船,根据经纬度变化,确定下一条数据与上一条数据的距离(此处需要用经纬度换算到实际距离)。若距离小于10km,则认为船没有行驶,位置为P(i)。若距离大于10公里,则认为船停泊在下一个位置,位置为P(i+1)。
时间判断。提取P(i)位置的最小时间对应的经纬度和时间,和最大时间对应的经纬度和时间。将最大时间和最小时间做差得到△t。如果△t<3,则认为船仅为短时停靠,删除该条数据。如果△t>3,则认为船舶抵达码头,保留数据。
遍历表格。遍历整个数据表,最后得到的结果是每个船在每个位置的起始、结束对应的经纬度和时间。
6. 结合经纬度、时间字段进行数据融合
在Oracle中利用经纬度、时间字段进行数据关联,匹配在相同时间、位置出现在船闸数据和VITS数据、港口数据和AIS数据的船舶,实现船舶OD与货运数据融合,为准确获取江苏省省内、省外水运货运OD奠定数据基础。
(三)水运数据OD矩阵获取
通过设定行驶区间距离L大于10千米,停泊时间大于3小时两个参数,运用Python对AIS数据、VITS数据进行处理。本次主要是对系泊AIS数据、以2开头的内河客船类数据、以3开头的内河液货船类数据进行处理,共获得客船类OD。
(四)省内水运货运OD矩阵特征
江苏省境内水运以京杭运河为主要货运输送通道,沿线南通市、泰州市、扬州市、无锡市、苏州市货运量较高,城市间货运联系强度大,承担连接苏南、苏北、省内、省外货运重要的集疏运功能。如图2所示。
(五)省外水运货运OD矩阵特征
1.港口货运量总体特征
江苏省苏州港、连云港、常州港镇江港、南通港、无锡港、泰州港、南京港、南京港、盐城港、扬州港十大港口港区全年港口装卸货水运货运量17.5亿吨/年,其中与江苏省内港口间货运量为3.5亿吨/年,占全省货运总量20%;与省外(去往中国其他省市、世界港口港区)港口间货运量14.0亿吨,占全省货运总量80%。本小节主要分析江苏省与省外(去往中国其他省市、世界港口港区)港口间OD及货运量分布特征。
在江苏省与省外间货运量14.0亿吨货运量中,从世界港口港区进入到江苏省港口的进港货运量9.5亿吨,占江苏省与省外货运量的68%,由江苏省港口出发至全世界港口的货运量为4.5亿吨,占32%。江苏省进港货运量远大于出港货运量,进港货运量是出港货运量的2倍。
2.港口进出港货运OD特征
进港货运特征分析
通过省外进港货运OD分析,江苏省进港货物主要来自浙江省、河北省、上海市、山东省等临近省市;国外货物主要来自南边的澳大利亚、新西兰。国内浙江省与苏州市联系强度位居首位,国外澳大利亚与连云港市间货运联系最高。
出港货运特征分析
通过省外出港货运OD分析,國内主要发往大连市、上海市、厦门市、浙江省、广州市;国外主要发往日本、韩国。
四、结束语
本文所提出的水路运输OD获取方法,能对综合运输系统中水路运输的发展趋势进行预测,从而找出交通量增长与经济发展的关系,为区域综合交通规划提供重要的参考依据,为我省中长期综合交通运输体系规划提供重要数据支撑。
作者单位:江苏省交通通信信息中心