基于组合赋权理论的高速公路多源信息融合算法
2016-01-08杨彬彬,李锐,张健等
基于组合赋权理论的高速公路多源信息融合算法*
杨彬彬1,2李锐3▲张健1,2王浩淼1,2葛志鹏1,2
(1.东南大学城市智能交通江苏省重点实验室南京 210096;
2.东南大学现代城市交通技术江苏高校协同创新中心南京 210096;3.河海大学土木与交通学院南京 210098)
摘要智慧高速信息化系统的多元信息采集系统提供了大量的多源异构交通数据。对这些数据进行分类识别与融合分析,并获得精度更高、可靠性能更好的数据尤为迫切。为更好地研究该问题,笔者分析了手机、卫星定位和路侧交调信息采集手段的技术特点,构建多源采集数据的融合环境,利用主、客观赋权法分别对3种采集手段进行赋权。在此基础上,采用Kendall一致性系数判断主、客观赋权法的一致性,并利用Spearman等级相关系数修正主、客观赋权法之间的不一致性,以组合主、客观赋权法的思想构建高速公路区间行程车速融合算法,兼顾主客观信息对权值的影响。通过案例分析,发现融合车速计算误差在±10 km/h内的精度可达96%,保证了多源信息融合后的高速公路区间行程车速的准确性与可靠性。
关键词智能交通;数据融合算法;组合赋权法;区间行程车速;多源采集
中图分类号:U491.1文献标志码:A
收稿日期:2014-05-22修回日期:2014-09-05
作者简介:第一杨彬彬(1989—),硕士研究生.研究方向:交通运输规划与管理.E-mail:binlinglove@163.com
通讯作者:▲李锐(1984—),博士、讲师.研究方向:智能交通系统.E-mail:liruihhu@163.com
Fusion Algorithm Using Combination Weighting Approach
for Highway Multi-Source Information
YANG Binbin1,2LI Rui3▲ZHANG Jian1,2WANG Haomiao1,2GE Zhipeng1,2
(1.JiangsuKeyLaboratoryofUrbanITS,SoutheastUniversity,Nanjing210096,China;
2.JiangsuProvinceCollaborativeInnovationCenterofModernUrban
TrafficTechnologies,Nanjing210096,China;
3.CollegeofCivilandTransportationEngineering,HehaiUniversity,Nanjing210098,China)
Abstract:With the use of diversified information collection system by the Intelligent Highway Information System, numerous types of multi-source heterogeneous traffic data exist today. This paper analyzes the technical characteristics of the cellular data, GPS, the information from roadside equipment, and then empowers this three data collection systems with a subjective and an objective weighting approaches, respectively. Subsequently, the paper examines the consistency of the subjective and objective weighting approaches and corrects inconsistencies by using Kendall Consistency Coefficient and Spearman Rank Correlation Coefficient, respectively. Through case studies, the results demonstrate that the accuracy of the fused speed fluctuation is within ± 10km/h and it can be as high as 96%. The fused travel speed support the highway management department in decision making and efficient scheduling with high accuracy and reliability.
Key words:intelligent transportation; data fusion algorithm; combination weighting approach; interval travel speed; multi-source collection
*国家重点基础研究发展计划(973计划)项目(批准号:2012CB725405)、江苏省基础研究计划(自然科学基金)项目(批准号:BK20140851)
0引言
大力推进智慧高速信息化系统建设,是现时中国高速公路发展的必然趋势。为了最大限度地保证交通信息数据的全面性、准确性、及时性和有效性,现有高速公路信息化系统建设都在不断地完善多元交通信息采集系统建设。目前,高速公路信息化系统已有或新建的信息采集系统包括:手机信息采集系统、卫星定位信息采集系统、收费车辆移动感知系统、视频监控系统、交通情况调查设备采集系统(简称“路侧交调采集系统”)、气象信息检测系统等。多元交通采集系统保证了数据获取的全面性,但面对这些繁杂而大量地数据,分类识别数据并进行数据融合是必须面对的难题。通过数据融合系统,对来自多元采集系统的数据进行识别判断、综合处理和融合,得出比从任何单个数据源更加全面、准确、可靠的信息,从而有效弥补单个数据源所固有的不足,产生高覆盖、高精度的交通信息,切实满足指挥调度和公众服务的需求。等业务应用平台的需求。因此,构建交通信息集成管理和应用服务平台、融合多元采集方式数据是快速提升智慧高速信息化水平的必要方式。
在无线传感器网络中,按照数据处理的层次,数据融合可分为数据层融合、特征层融合和决策层融合[1],笔者主要研究数据层融合。数据的融合方法包括概率统计方法、神经网络、贝叶斯推理和卡尔曼滤波等方法,多位学者已借助这些融合算法对各自研究内容进行了数据融合计算[2-4],但是这些融合方法运算量大且计算较为复杂,论文从实际操作的角度出发,利用多元采集方式的车速数据组合赋权融合方法,融合主观赋权法和客观赋权法的权重,对高速公路车辆区间运行速度值进行融合计算。在此融合算法中,如何能够很好地确定主、客观权重之间的关系至关重要。温惠英[6]、宋海洲[7]、席荣宾[8]、zhou YE[9]等人分别从不同角度研究了主观权重和客观权重之间的权值关系。但是真正利用真实交通数据、尤其是利用我国高速公路车辆区间运行速度数据进行权值融合的研究还不完善,需要进一步深入研究。笔者兼顾主观权重和客观权重,采用组合赋权法研究不同采集手段对于高速公路车辆区间运行速度的权重分配,进而研究高速公路车辆区间运行的融合车速数据。
1多元采集方式数据融合环境
1.1多元采集方式的特点分析
在智慧高速信息化系统建设环境中,手机信息采集手段、卫星定位信息采集手段、路侧交调采集手段3大手段都能采集相关数据以获取动态车速信息。但是每种采集手段都有自己的技术特点和适用情况,这将给不同手段间的数据融合带来严重的阻碍。
无线通信网络已全覆盖江苏高速公路沿线,手机拥有率和使用率也达到相当高的比例,在样本量、覆盖范围以及实施成本和周期上,手机信息采集手段具有优势。以城市高架快速路的线圈数据作为基准数据,对手机车速数据的精度进行分析[7-8,10-11],发现车速误差在±10 km/h内的精度可达70%~80%。但在交通拥挤条件下,车速误差通常可达100%。因此,在交通拥挤的情况下,手机获取的车速信息置信程度不高。
路侧交调采集系统是利用交通调查设备来采集车辆交通状态信息的系统。受限于设备的布设密度,该采集系统获取的样本量在不同的路段不一致,在布设密度较大的路段,路侧交调采集手段的车速检测误差可控制在5%以内。
卫星定位信息采集系统是高速公路营运管理信息化的重要体现,且卫星定位信息采集系统所采集到的车辆运行状态准确率较高。但是,在现有的智慧高速信息化系统中,卫星定位系统只能够收集运管局的“两客一危”车辆卫星定位数据,在高速公路交通流量中所占比例不大,无法获取稳定、充足的样本量,所以该数据并不能够完全、独立的作为高速公路交通状态数据的判别手段,需要与其他来源的数据进行融合,提高数据精度。
1.2融合环境的建立
笔者以2 km为研究区段长度,将高速公路连续分割,组成一系列的交通运行情况监控区段。上述3种信息采集手段的布设环境差异很大,导致数据采集的样本量、精度,以及适用情况有着明显的不同。分割后的监控区段内,如果高速公路交通拥挤,手机采集手段获取的车速信息误差太大,使用效果不佳,所以,车速信息融合决策前,须初步判断监控区段拥挤情况,以判断手机采集手段数据的可信度。
在多元采集系统实际部署情况下,发现监控区段可以划分为3种环境:环境一,无任何路侧交调系统;环境二,有2个及以上的路侧交调系统;环境三,有1套路侧交调系统,监控区段环境分类示意图见图1。其中环境三所占比例最大,是信息化系统建设必须保证的最低限度的布设环境。
图1 监控区段环境分类示意图
上述3种环境中,环境一,没有路侧交调采集系统。从而无法有效地对路段拥挤情况进行初步判断。这时,虽然营运管理部门获取了手机采集系统的车速信息,但依然无法准确判断交通运行情况,需其他相关措施进行复核帮助决策。
环境二,拥有2套及以上的路侧交调采集系统,可通过信息化系统联网获取高准确率地路段车速信息,保障指挥调度等决策及时有效地执行。但这种布设环境目前比例还很小,主要存在于交通事件频发等重点监控路段。
环境三,拥有1套路侧交调采集系统,可采集通过该点处的地点车速、交通量、车头时距等数据。对采集的地点车速进行分析,可初步判断路段交通运行情况:①检测时段内,个体车速波动小,平均车速高,车速分布方差小,这时候,交通运行通畅;②个体车速波动比较大,车速分布方差大,这时候,交通运行情况为拥挤形成或消散过程中;③检测时段内,个体车速波动较小,平均车速低,车速分布方差小,这时候,交通运行情况为已经拥挤。依据表1对交通运行情况进行初步判断。
表1 基于路侧交调采集手段的数据参考表
2高速公路车速信息融合
为有效利用多元采集手段的数据,又尽可能消除多元采集手段的差异对数据融合的影响,本文采用组合赋权法确定每种采集方法的权重,得到融合计算量。
组合赋权法包括乘法组合法和线性组合法。但乘法组合法具有“倍增效应”,使得大者越大,小者越小,仅适用于指标个数较多,权数分配比较均匀的情况。本文采用主、客观权重的线性组合法获取组合权重,其通用公式
(1)
式中:δ为偏好系数,0≤δ≤1。传统线性组合法最大的缺点就是δ的大小依然是由评价人员的主观决定。曾宪报[12]根据对组合赋权法的事前检验,即检验组合方法的排序位次在给定显著水平是否具有一致性的基础,来确定组合赋权的偏好系数δ的大小。本文利用对主、客观赋权方法的一致性检验,来决定偏好系数δ的大小,进一步削弱主观因素对权重的不利影响。
2.1主、客观赋权法的选取
文中主观赋权法采用Delphi法,通过咨询东南大学物联网交通应用研究中心相关专家后,对3种采集手段分交通拥挤情况进行权重赋值;本文的客观赋权方法选取熵值法,利用原始指标数据信息,以指标值之间的差异大小反映指标的“信息价值”来确定权重[5]。
2.2组合赋权法的一致性检验
在组合主、客观权重之前进行一致性检验,以检验主、客观赋权法的结果是否合理,其衡量标准是:权重结果之间能否相互印证,即它们是否具有一致性。
首先,采用Kendall一致性系数检验法[13]进行初步检验。其具体步骤如下。
第一步。将2种赋权方法所得到的权重结果转化为排序矩阵。其中,权重最大者的排序值为1,次重为2,其余依次类推。
第二步。假设Z0:2种赋权方法不具有一致性; Z1:2种赋权方法具有一致性。
第三步。计算检验统计量并对假设进行检验。当n≤7时,检验统计量为:
(2)
式中:S为Kendall一致性系数;Tj为第j种采集方式排序值之和。给定显著水平α,查“Kendall一致性系数s临界值表”得临界值sα。如果s≤sα,则接受Z0;反之,拒绝Z0,接受Z1。(当n≥7时,检验统计量公式不同。本文n=3,在此就不讨论n≥7时的情况。)
若2种赋权方法符合一致性检验,即意味着这2种赋权结果相差不大。可以计算这2种赋权方法的权重算术平均值,作为组合权重系数。即为
wi=0.5ai+0.5bi
(3)
式中:ai为主观权重值;bi为客观权重值;而wi为组合权重值。
若这2种赋权方法不符合一致性检验,即意味着赋权结果相差甚大,不宜采用算术平均值法。这时可用Spearman等级相关系数[10,13]来衡量2种方法之间的相关程度,并进行加权处理,得到2种赋权方法的线性组合偏好系数δ。其步骤如下:
第一步。计算Spearman等级相关系数。衡量2种方法之间的相关程度,其计算公式为
(4)
第二步。将ρ进行归一化处理,得到权向量Z=(v1,v2),
(5)
第三步。计算组合权重
wi=v1ai+v2bi
(6)
式中:v1+v2=1;ai为主观权重值;bi为客观权重值;wi为组合权重值
2.3案例分析
选择1个拥有2套,及以上交调采集系统的监控区段,利用交调系统可获得高精度的区间平均行程车速。以该行程车速作为基准数据进行融合车速的精度分析。在监控路段内,各采集系统的采集周期为2 min,手机信息采集手段覆盖了60%的车辆信息、卫星定位采集手段覆盖了10%的车辆信息、交调设备采集手段覆盖了85%的车辆信息。笔者选择1个由交通运行通畅到交通拥挤,然后采取措施,交通拥挤逐渐消除直到交通运行通畅的时段,该时段采集耗时100 min。
利用Delphi法对3种采集方式进行赋权,权重值表见表2,利用熵值法计算得到多元采集方式的客观权重表见表3,
表2 Delphi法权重表
注:①运行情况A为交通通畅;运行情况B为拥挤正在形成或消散;运行情况C为交通拥挤;②车速1为手机采集手段所获取的信息;车速2为路侧交调采集手段所获取的信息;车速3为卫星定位采集手段所获取的信息。
对2种赋权方法的一致性进行检验。根据车速指标的权重排序表(见表4)。进行Kendall一致性系数和Spearman等级相关系数验证,可发现Delphi法A,C 2种情况下与熵值法符合一致性,即意味着这2种赋权结果相差不大,可以计算这2种赋权方法的权重算术平均值,作为组合权重系数。
然而,Delphi法B情况与熵值法不一致。这种情况下,利用式(5)修正2种赋权方法的不一致。可得ρ=0.75,v1=4/7,v2=3/7,利用式(6)计算组合权重系数。
主、客观组合赋权法得到的组合权重系数表,见表5。
表4 组合赋权法的权重排序表
表5 组合权重表
利用组合权重系数计算区间平均车速融合值,再与基准车速值进行对比,对比分析100 min内车速误差情况,得到融合区间车速与基准区间车速的对比图,见图2。
图2 融合区间车速与基准区间车速比较
由图2可见,组合赋权法得到的融合区间车速值与基准区间车速值相差不大,具有良好的一致性。在监控区段交通运行通畅的情况下,融合区间车速与基准区间车速能够保持很好的一致性,因此,在交通运行通畅条件下,该融合算法适用性较好;而在监控区段正在形成拥挤或拥挤消散的过程中,融合车速与基准车速差异波动较大;在监控区段交通运行拥挤的情况下,融合车速基本上都比基准车速大。
统计分析100 min监控时段内数据,可发现,误差在±10 km/h内的的时段有48个,占总时段(共50个时段)的比例为96.0%;误差在±5 km/h内的时段有43个,占总时段(共50个时段)的比例为86.0%。融合后车速与基准车速的对比分析结果表明:约95%的时段计算精度控制在±10km/h内,可满足高速公路营运管理部门指挥调度决策需求。
3结束语
笔者利用主、客观赋权法计算多元采集方式的车速权重,并利用组合赋权法融合区间车速信息。对比分析融合区间车速与基准区间车速,可发现,使用该算法计算多元采集手段的融合区间车速,其融合后的车速准确率高,误差较小,其计算误差在±10 km/h内的精度可达96.0%。对比单一赋权方法(计算误差±10 km/h内的精度,主观赋权法不足70%,客观赋权法不足85%)可知,组合赋权融合算法在精度方面具有较大提升。
然而,根据案例分析可知,融合后的区间车速普遍大于基准区间车速,是否可利用其他主、客观赋权方法进行多方式组合赋权,以提高计算精度,还有待于进一步的研究。
参考文献
[1] Nakamura E F,Loureiro A A F,Frery A C.Information fusion for wireless sensor networks: Methods,models,and classifications[J].ACM Computing Surveys (CSUR),2007,39(3):9.
[2]胡小文, 杨东援. 基于数据融合的路段行程时间估计[J]. 交通信息与安全, 2011,29(4):92-98.
HU Xiaowen,YANG Dongyuan. Link travel time estimation based on data fusion[J].Journal of Transportion Information and Safety, 2011,29(4):92-98. (in Chinese).
[3]姜桂艳,李琦,常安德.数据融合技术在交通事件检测中的应用综述[J]. 交通信息与安全, 2011, 29(3):138-144.
JIANG Guiyan,LY qi,CHANG ande.A Review of Application of Data Fusion Technology in the Field of Traffic Incident Detection[J].Journal of Transport Information and Safety, 2011,29(3):138-144.(in Chinese).
[4]杨光祖.基于多种激光雷达数据融合的障碍检测技术的研究[D]. 北京:北京工业大学,2013.
YANG Guangzu.Reserch on obstacle detection technology based on laser radar data fusion[D].Beijing:Beijing University of Technology,2013.(in Chinese).
[5]肖艳玲,刘晓晶,刘剑波.基于熵值法的员工绩效指标权重确定方法[J].大庆石油学院学报,2005,29(1):107-109.
XIAO Yanling,LIU Xiaojing,LIU Jianbo.The Method of Giving Weight for Performance Indicator Based on Entropy Method[J].Journal of Daqing Petroleum Institute,2005,29(1):107-109.(in Chinese).
[6]温惠英,沈毅贤.基于层次分析法的物流配送车辆导航路径规划求权方法[J].公路交通科技,2008,25(8):114-118.
WEN Huiying,SHEN Yixian.A Method of Computing Weight of Logistics Navigation Route Planning Based on Analytic Hierarchy Process[J].Journal of Highway and Transportation Research and Development,2008,25(8):114-118.(in Chinese).
[7]宋海洲, 王志江.客观权重与主观权重的权衡[J]. 技术经济与管理研究, 2003(3): 62-62.
SONG Haizhou,WANG Zhijiang. Research of balancing the objective and subjective weights[J].Technoeconomics and &Management Research,2003(3):62-62. (in Chinese).
[8]席荣宾,黄鹏.组合赋权法确定权重的方法探讨[J]. 中国集体经济, 2010(19):75-76.
XI Rongbin,HUANG Peng. Weighting method research of combination weighting approach[J].Chinese Collective Economy,2010(19):75-76.(in Chinese).
[9]Zhou Y F, WU F J. Combination weighting approach in multiple attribute decision making based on relative entropy[J]. Operations Research and Management Science, 2006,15(5):48-53.
[10] 杨飞.基于手机切换定位的道路行程车速采样提取技术研究[M].北京:科学出版社,2013.
YANG Fei.Road travel speed sampling extraction technology research based on mobile handover positioning[M].Beijing: Science Press,2013.125-127.(in Chinese).
[11]Cheng P,Qiu Z, Ran B. Traffic estimation based on particle filtering with stochastic state reconstruction using mobile network data[C].Proceedings of the Transportation Research Board 85th Annual Meeting,Washington DC. TRB,2006.
[12]曾宪报.组合赋权法新探[J]. 预测,1997(5):69-72.
ZENG Xianbao.New research on combination weighting method[J].Forecasting, 1997(5):69-72.(in Chinese).
[13]罗积玉,邢瑛.经济统计分析方法及预测附实用计算机程序[M]. 北京:清华大学出版社, 1987.
LUO Jiyu,XING Ying. Economic statistical analysis methods and forcasting[M].Beijing:Tsinghua University Press,1987. (in Chinese).