APP下载

城市浮动车数据定位误差分布研究

2016-05-25赵长相

关键词:定位点浮动正态分布

李 军,游 弋,赵长相

(中山大学 工学院 智能交通研究中心,广东 广州 510006)

城市浮动车数据定位误差分布研究

李 军,游 弋,赵长相

(中山大学 工学院 智能交通研究中心,广东 广州 510006)

提出了计算城市浮动车定位误差的方法,分析了定位误差数据的分布情况和特征,给出并验证浮动车定位误差的概率分布函数,给出不同等级道路的浮动车定位误差分布规律。通过出租车载客状态和地图匹配的路径来推导浮动车的参考位置并计算误差,然后分别运用多种误差分布密度函数进行拟合,发现最适合的定位误差概率密度函数。以广州市浮动车数据为例进行了验证,结果表明偏p-范分布最适合复杂城市路网的浮动车误差分布,可作为浮动车数据进一步应用的基础。

交通运输工程;浮动车数据;GPS定位误差;误差分布;函数拟合

0 引 言

城市道路交通信息的采集和分析是掌握城市交通运行状况的基础工作之一。浮动车数据采集技术利用GPS车载设备固定的送回车辆号码、时间、位置等数据,用于研究车辆速度和行驶时间等信息。浮动车数据采集方法成本低、实时性强、而且覆盖范围广,已经成为当前比较广泛应用的采集交通信息的方法[1-3]。

但是浮动车采集数据过程中,由于GPS卫星定位系统本身固有的缺陷,如卫星信号较弱、信号传播错误、地面接收设备影响等都会使GPS定位产生误差,在城市高楼较密集的地区,以及高架桥、隧道等地更容易产生误差[4-5]。GPS误差来源一般可分为与GPS卫星有关的误差,包括卫星星历误差和卫星钟差等;与信号传播有关的误差,包括电离层误差和多径路误差等;以及与接收设备有关的误差,包括接收机钟差、接收机的位置误差等[6]。其中,有些误差是可以通过建立误差改正模型或差分技术等方法来加以修正,例如卫星星历误差;而有些误差,比如多路径误差,既不能建立改正模型也不能用差分技术消除,在现阶段还没有一种十分有效的方法能完全消除,一般是通过选择更高精度的接受设备和良好的观测条件来削弱[7-9]。但是一方面目前城市浮动车的车载GPS定位设备还难以达到很高的精度,另一方面城市路网密集,路况复杂,更加难以保证开阔的观测条件[10]。

另外,城市浮动车采集到的大量数据需要存储,而在广州市,作为浮动车的出租车共计17 000余辆,数据上传间隔为20~120 s。数据量虽大,但采样率低,不足以提供高精度的连续的采样信息,使得部分路段发生信息的缺失[11-13]。

因此需要对浮动车误差进行统计和研究,分析定位误差的特点,这样有助于采集更准确的城市道路信息,更好地利用浮动车数据。

目前国内外研究对于误差统计常用的分布有正态分布、瑞利分布、p-范分布等[14]。正态分布是被采用最多的一种,这种方法简单常见,但只适用于对误差粗略的估计,当数据量不大,影响精度的因素不多且彼此不独立时,正态分布就不能得到很好的结果[15-18]。有研究者提出当GPS观测误差的分布情况为单峰或对称时,近似服从p-范分布,如果选择正确的参数值,则分布比正态分布拟合更加接近正确的情况,但这个命题并未得到深入的检验,需要做进一步的研究来确定[19]。

笔者计算并统计了定位点同匹配路段间的误差值,分析了城市浮动车数据定位误差分布特征。分别用正态分布、p-范分布和曲线左右两侧分别服从不同参数的偏p-范分布来拟合误差分布密度函数,推测出满足条件的定位误差概率密度函数。

1 误差分析

1.1 误差计算

笔者以2011 - 07- 06 T 00:00—24:00的全部浮动车数据作为统计研究对象,选定了广州火车站到天河城、公园前到江南西、康王北到中山大学南门这3个OD对,这3个OD对间的出行路径包含了高架路、过江通道、普通道路。

首先要做数据筛选。因为对于一个OD对,乘客都是在O点上车D点下车,所以在O点时车辆状态从会空车切换至重车,在D点时车辆状态会从重车切换至空车。因此在提取路径时要检验数据的车辆状态和有效性[20],标识为重车状态的数据更容易形成完整的OD对。

接下来是提取OD间的出行路径。选定某一OD对,提取该OD对的GPS数据。具体做法是先选择一辆车,在这辆车采集到的数据中根据坐标位置找到起点位置的定位点,再按照时间序列提取这辆车的GPS点数据,对于每一个数据都要判断其有效性和车辆状态,提取处于重车状态的数据。对于处于非重车状态的数据则判断其位置是否在终点范围内,若满足则提取该条数据并保存以上提取的全部数据作为一条OD出行链[12]。用同样的方法提取该OD对所有车辆的数据。

3个OD对一共提取到6 877条数据,其中广州火车站—天河城数据3 937条,公园前—江南西数据2 172条,康王北—中山大学南门数据768条。

这里定义的浮动车定位误差基于两个前提假设:①车辆总是行驶在道路上;②电子地图道路数据的精度是足够高的。这样就可以将采样点的位置和电子地图之间的差值作为误差值[21]。为了得到定位误差的值,首先将浮动车数据定位点匹配到路段上,然后统计浮动车数据定位点到匹配路段的最短直线距离,就得到误差值。

笔者使用权重式(1)进行路段匹配。倘若置信区域内有多条候选匹配路段,选择最大匹配权重值的路径作为匹配目标道路[22],匹配示意如图1:

(1)

式中:di为定位点i到待匹配路段的最短距离;θi为定位点i的浮动车航向同待匹配路段的夹角,0°≤θi≤90°;R为限定的定位点最大误差距离,R=70 m。

为保证路径的准确性,在已知匹配路径的情况下对路径进行了人工确认,以确保得到正确的匹配路径,作为误差计算的依据。

路径匹配完成后,即确定了每一个定位点在哪条路径上,就可以统计该定位点到路径上的距离。具体做法是先确定一条路径,把属于这条路径的数据都提取出来,统计这些数据的GPS位置和这条路径在电子地图上的垂直距离,距离的大小就代表误差的值[18]。按照这种方法统计出3个OD对的所有误差值。这里认为定位点到路段的距离有正负之分,以匹配路段道路中线为基准,位于行驶方向右侧的定位点,令误差值为正;位于行驶方向左侧的定位点,令误差值为负。这里不考虑由于车道数不同对车辆位置偏离的影响。

1.2 误差特征分析

浮动车定位点数据误差统计如图2。通过统计分析可知,浮动车定位点误差走向近似于钟形曲线,图像呈现中间高两边低,并且主要分布在中间部分。误差分布主要集中在-5~10 m这个范围内,并且这个范围内的数据占总数据的53.29%。众数为3.80 m,误差平均值是5.59 m,样本方差为204.27 m2。

图2 浮动车定位点误差统计Fig.2 Error statistical chart of floating car positioning point

1.3 误差分布检验

对浮动车定位点数据误差进行正态分布K-S检验,由于峰度系数和偏度系数都不为0,因此样本数据不符合正态分布。

假设浮动车定位误差服从一元p-范分布,其密度函数为:

(2)

参数计算结果为:E(x)=5.59m;p=0.94;σ=14.29;λ=1.57。

虽然样本数据不服从p-范分布,但是由分布图可以看出,样本数据分布左右并不对称,因此假设样本数据的分布为偏p-范分布,即众数左右两侧的数据分别服从不同参数pi(i=1, 2)的p-范分布;i=1代表左侧,i= 2代表右侧。

设众数左右两支的概率密度分别为:

(3)

(4)

式中:M0为众数,此处为3.8;E(x1)为左侧分支的均值;E(x2)为右侧分支的均值;p1为左侧分支p-范分布的参数,p1>0;p2为右侧分支p-范分布的参数,p2>0;σ1为左侧分布的标准差;σ2为右侧分布的标准差。

方差参数σ2的估计式为:

(5)

参数p的估计式为:

(6)

式中:n为样本个数;i=1,2,3,4,…,n。

左右两侧的参数计算结果如表1。

表1 偏p-范分布计算结果

表2 计算结果

按照道路等级不同对数据进行分类,分别得到快速路、城市主干道和一般道路的定位误差数据,用偏p-范分布进行拟合,误差统计如图3,计算结果如表2。

图3 定位点误差统计Fig.3 Error statistical chart of positioning points

2 结 语

笔者在路网密集、路况复杂的城市道路中,并且在GPS采样数据有效点稀疏,导致部分路段采集到的信息不连续的条件下,对浮动车采样数据的定位误差做了统计和分析,提出数据定位误差可能服从的分布类型并做了检验,通过以上的计算和分析推测出了满足一定条件的分布,并求出相应的概率密度函数。研究的不足之处在于尚未考虑车道数不同对车辆位置偏离车道中心线的影响,同时也误差分布拟合的精确度有待进一步提高,这些方面还需要更加深入和进一步的研究。

[1] ZHAO Yue,LIU Jian,CHEN Runqiang,et al.A new method of road network updating based on floating car data [C]// Vancouver Canada:2011 IEEE International Geoscience and Remote Sensing Symposium (IGARSS) ,2011:1878-1881.

[2] GAO Bin,COIFMAN B.Vehicle identification and GPS error detection from a LIDAR equipped probe vehicle [C]// Toronto, Canada:Intelligent Transportation Systems Conference,2006:1537-1542.

[3] 庄立坚,韦清波,何兆成.基于浮动车数据的出租车运营管理特性建模与分析[J].重庆交通大学学报(自然科学版),2014,33(4):122-127. ZHUANG Lijian,WEI Qingbo,HE Zhaocheng.Taxi operation and management characteristics based on floating car data [J].JournalofChongqingJiaotongUniversity(NaturalScience),2014,33(4):122-127.

[4] 章威,徐建闽,林绵峰.基于大规模浮动车数据的地图匹配算法[J].交通运输系统工程与信息,2007,7(2):39-45. ZHANG Wei,XU Jianmin,LIN Mianfeng.Map matching algorithm of large scale probe vehicle data [J].JournalofTransportationSystemsEngineeringandInformationTechnology,2007,7 (2):39-45.

[5] BIERLAIRE M,CHEN Jingmin,NEWMAN J.A probabilistic map matching method for smartphone GPS data [J].TransportationResearchPartC(EmergingTechnologies),2013,(26):78-98.

[6] HU Xiaowen,YANG Dongyuan,FENG Junjia,et al.Map matching algorithm for GPS data with irregular and relatively long intervals [C]// Chengdu:The First International Conference on Transportation Engineering (ICTE).USA:American Society of Civil Engineers,2007.

[7] 李洋,张晓冬,鲍远律.多权值概率论实时地图匹配[J].电子测量与仪器学报,2012,26(2):166-170. LI Yang,ZHANG Xiaodong,BAO Yuanlv.Algorithm on real-time map-matching of multi-weights probability [J].JournalofElectronicMeasurementandInstrument,2012,26(2):166-170.

[8] 于泉,孙玲,荣建.基于浮动车数据调查方法的交叉口延误计算[J].重庆交通大学学报(自然科学版),2009,28(2):283-286. YU Quan,SUN Ling,RONG Jian.An approach of signalized intersection delay calculation based on floating vehicles data survey method [J].JournalofChongqingJiaotongUniversity(NaturalScience),2009,28(2):283-286.

[9] GREENFELD J S.Matching GPS observations to locations on a digital map [C]// Transportation Research Board 81stAnnual Meeting.Washington,D.C.:Transportation Research Board,2002.

[10] 赖云波,孙棣华,廖孝勇,等.基于道路缓冲区分析的地图匹配算法[J].计算机应用研究,2011,28(9):3312-3314. LAI Yunbo,SUN Dihua,LIAO Xiaoyong,et al.Algorithm of map- matching based on road buffer analysis [J].ApplicationResearchofComputers,2011,28(9):3312-3314.

[11] 孙棣华,张星霞,张志良.地图匹配技术及其在智能交通系统中的应用[J].计算机工程与应用,2005,20:225-228. SUN Dihua,ZHANG Xingxia,ZHANG Zhiliang.Map matching technology and its application in ITS [J].ComputerEngineeringandApplication,2005,20:225-228.

[12] 王应东.GPS 误差分析和精度控制[J].测绘与空间地理信息,2011,34(6):235-236. WANG Yingdong.GPS error analysis and precision control [J].Geomatics&SpatialInformationTechnology,2011,34(6):235-236.

[13] RAHMANI M,KOUTSOPOULOS H N.Path inference from sparse floating car data for urban networks [J].TransportationResearchPartC(EmergingTechnologies),2013(30):41-54,.

[14] MIWA T,KIUCHI D,YAMAMOTO T,et al.Development of map matching algorithm for low frequency probe data [J].TransportationResearchPartC(EmergingTechnologies),2012(22):132-145.

[15] AYALA D,LIN Jie,WOLFSON O,et al.Communication reduction for floating car data-based traffic information systems [C]//2010 Second International Conference on Advanced Geographic Information Systems,Applications and Services (Geoprocessing),IEEE,2010:44-51.

[16] 田世艳.基于GPS的城市道路交通状态实时判别技术研究[D].广州:华南理工大学,2012. TIAN Shiyan.StudyontheTechnologyofTrafficIdentificationforUrbanRoadBasedonGPS[D].Guangzhou:South China University of Technology,2012.

[17] 陈骥,王炳兴.基于正态分布点值化的区间主成分评价法及应用[J].统计研究,2012,29(7):91-95. CHEN Ji,WANG Bingxing.Interval principal component analysis based on the point-estimation of normal distribution and its application [J].StatisticalResearch,2012,29(7):91-95.

[18] 郑文兵.正态分布的哲学本质及其社会经济应用意义[J].统计与决策,2012(7):23-26. ZHENG Wenbing.The philosophy essence of normal distribution and its social and economic significance [J].StatisticsandDecision,2012(7):23-26.

[19] 刘刚,张尚立,周国梅.飞行器定位误差的统计分布[J].数理统计与管理,2007,26(4):565-569. LIU Gang,ZHANG Shangli,ZHOU Guomei.The research on statistical distribution of the flight error [J].ApplicationofStatisticsandManagement,2007,26(4):565-569.

[20] 孙海燕,胡宏昌.P-范分布及其抽样分布[J].应用概率统计,2003,19(4):424-428. SUN Haiyan,HU Hongchang.P-norm distribution and its sampling distribution [J].ChinesejournalofApplicationofAppliedProbabilityandStatistics,2003,19(4):424-428.

[21] 胡宏昌,孙海燕.P-范分布参数σ的估计[J].武汉大学学报:信息科学版,2002,27(5):483-485. HU Hongchang,SUN Haiyan.Parameterσestimation ofP-norm distribution [J].GeomaticsandInformationScienceofWuhanUniversity,2002,27(5):483-485.

[22] 蓝悦明,贾媛.GPS观测值误差分布的研究[J].测绘通报,2008(4):12-13. LAN Yueming,JIA Yuan.The study of error distribution of GPS observed values [J].BulletinofSurveyingandMapping,2008(4):12-13.

Error Distribution of Floating Car Positioning Data in Urban Areas

LI Jun, YOU Yi, ZHAO Changxiang

(Research Center of Intelligent Transportation System, School of Engineering, Sun Yat-sen University, Guangdong 510006, Guangzhou,P.R.China)

A method to calculate the position errors of floating car in urban area was presented, and the probability distribution function to verify the position errors of floating car was proposed according to the analysis on the characteristics and the distribution of positioning error data. The distribution rule of the position errors of floating car on different levels of road was also obtained. The referential positions of floating cars were deduced and the errors were calculated through the loading status of taxis and the map-matching routes; several error distribution functions were respectively selected for data fitting and the most appropriate location error probability density function was found out. A case study of Guangzhou floating car data was carried out. The results show that the partialp-norm distribution is the best fitting form for the error distribution for the floating car of road network in the complex metropolis area, which can be used as the basis for further application of floating car data.

traffic and transportation engineering; floating car data; GPS positioning error; error distribution; function fitting

2014-04-25;

2014-11-11

国家自然科学基金项目(51178475)

李 军(1968—),男,湖北江陵人,副教授,博士,主要从事交通规划与政策方面的研究。E-mail:stslijun@mail.sysu.edu.cn。

10.3969/j.issn.1674-0696.2016.01.31

U491.1+2

A

1674-0696(2016)01-162-05

猜你喜欢

定位点浮动正态分布
电连接器柔性浮动工装在机械寿命中的运用
关于n维正态分布线性函数服从正态分布的证明*
数独小游戏
论资本账户有限开放与人民币汇率浮动管理
复杂零件的曲面反求算法及3D打印修复方法研究
一种用于剪板机送料的液压浮动夹钳
汽车大灯定位方案设计研究
带有浮动机构的曲轴孔镗刀应用研究
我的结网秘籍
基于对数正态分布的出行时长可靠性计算