基于FCM-SVM方法的时空航路网 交通状态识别研究*
2018-08-29李桂毅胡明华张洪海
李桂毅 胡明华 张洪海
(南京航空航天大学民航学院 南京 211106)
0 引 言
随着我国航班量快速增长,航路交通拥挤越发严重,大面积航班延误现象频繁.解决航路网交通拥挤问题应首先研究别航路网交通拥挤态势的发展,识别航路网络拥挤瓶颈和关键节点,进而提出交通拥挤缓解、管控措施.
针对空中交通拥挤方面的研究,Monechi等[1]采用复杂网络理论构建航路网拥挤分析模型,基于航班历史数据对航路网交通拥挤传播问题进行了分析.Lucasa等[2]基于复杂网络理论,从宏观层面对机场节点以及航线间的拥挤传播问题开展了研究.徐肖豪等[3]从空中交通拥挤的概念、拥挤识别、拥挤预测等方面综述了空中交通拥挤问题的研究现状、当前的研究热点及未来的研究方向.Bongo等[4]采用多准则决策方法优化提出最优空中交通管控措施,缓解空中交通拥挤问题.Zhao等[5]从机场、终端区、航路、扇区等方面建立了空中交通拥挤评价指标体系,采用证据理论评价了空中交通拥挤态势.李善梅[6]研究了交叉航路交通拥挤问题,采用灰色聚类方法,识别交叉航路拥挤态势.Daniel[7]从空中交通复杂性等角度系统研究了空中交通拥挤问题,分析了空中交通拥挤形成机理.
在地面道路网络交通拥挤方面,董春娇等[8]基于SVM方法对城市路网交通流参数进行了分析,构建了城市路网交通拥挤状态判别模型.廖瑞辉等[9]基于云技术和支持向量机理论,采用交通流参数建立了道路交通拥挤预警模型.任其亮等[10]将路网交通拥堵划分为路段拥堵和交叉口拥堵,运用层次分析法和模糊综合评价方法,对城市路网交通拥挤程度进行了分级.廖瑞辉等[11]提出了城市交通路网拥挤指数概念,应用历史交通流数据建立了城市路网交通拥挤指数模型,研究了不同时间段城市路网交通拥挤指数变化规律.王建玲[12]针对城市交通网络,从局部到整体提出了一套拥挤识别的理论方法,包括路段拥挤状态识别、交叉口拥挤状态识别、城市交通网络拥挤状态识别,构建了城市路网拥挤度识别模型.Rempe等[13]基于浮动车数据和时空聚类分析方法,建立了城市路网时空拥挤模式识别模型,分析了时空路网的拥挤特性.He等[14]通过分析城市路网车辆速度参数,提出了基于路网路段拥挤指数和路网拥挤指数的路网交通拥挤评估方法,对北京城市路网拥挤规律进行了分析.
上述研究成果为深入研究航路网络交通拥挤问题奠定了较好的基础,航路网络交通拥挤态势识别问题尚未开展深入研究,航路网交通模式不同于地面路网,交通状态划分模式同地面存在较大的不同.空中交通系统可获取实测的飞行航迹数据,可借助飞行航迹数据实现航路网络交通态势自动识别,对解决航班大面积拥挤与延误问题具有现实意义.本文借鉴地面路网交通态势识别理论,基于飞行航迹数据,从中观交通流层面研究航路网交通态势智能化识别方法,从而找出航路网交通状态时空特性和拥挤瓶颈.
1 航路网交通状态等级划分
1.1 航段交通状态评估参数
航路网同地面路网类似,也是由不同航段构成,通过航段交通拥挤态势评估,进而可评估航路网交通拥挤态势.飞行航迹数据由航管雷达获得,采用GIS工具可提取交通状态评估参数.选取航路网络航段交通流量、航段交通密度和航段交通接近度作为航路网交通状态评估参数.
1) 航段交通流量 航段某断面15 min时间片内通过的飞行架次,单位为架/15 min,反映航段单位时间内断面流过的交通量大小.
2) 航段交通密度 航段单位长度内某一瞬时存在的飞行架次,单位为架次/km,反映航段飞行密集程度.
3) 航段交通接近度:航段15 min时间片内航空器之间的接近程度,计算方法为
(1)
(2)
1.2 航段交通状态等级划分
FCM(模糊聚类)是基于目标优化的聚类算法,通过迭代使样本距离模糊聚类中心的距离加权和最小,从而实现样本模式的划分.
(3)
式中:U为每个数据点与相应聚类中心的隶属度;uο为第r个模糊聚类中心;μθ∈[0,1]为第m个数据点属于第r个聚类中心的隶属度;δθ为第m个数据点到第r个聚类中心的欧式距离;φ为加权指数,值越大,聚类的模糊性越强.
航段交通状态等级划分原理为基于交通状态评估参数,构建航段交通状态评价矩阵T见式(4),进行FCM聚类分析,设置聚类中心数O为4,将航段交通状态划分为4级,分别为拥挤态、稳定态、畅通态、少交通量态,结合隶属度μθ划分航段交通状态等级.
T=(QstKstPst)
(4)
式中:T为航段交通状态评价参数矩阵;Qst为航段交通流量;Kst为航段交通密度;Pst为航段交通接近度;下标s,t为航段序号和时间片序号.
2 航路网交通状态识别
2.1 SVM(支持向量机)算法基础
SVM是一种基于统计学习理论的机器学习方法,通过模型参数控制器学习能力和泛化能力,能够较好解决非线性、高维数、局部极小点等问题,是当前机器学习领域研究热点.SVM最优分类函数见式(5).
f(x)=sgn(w·x+b)=
(5)
式中:αi=1,2,…,n为拉格朗日乘子.
αi≥0,i=1,2,…,n
(6)
(7)
式中:xr和xs为两个类别中的任意一对支持向量.
非线性SVM是通过非线性变换将非线性问题转换为某个高维空间的线性问题实现,即把线性空间中的内积(xi·xj)变成新空间中的内积(φ(xi)·φ(xj)).记核函数K(xi·xj)=(φ(xi)·φ(xj)),非线性SVM见式(8),拉格朗日乘子αi可以通过式(9)求解.
(8)
αi≥0,i=1,2,…,n
(9)
常用的SVM核函数有3类:
1) 多项式核函数.
K(x,x′)=(γ(x,x′)+1)q
(10)
2) 径向基(RBF)核函数.
(11)
3) Sigmoid核函数.
K(x,x′)=tanh (ν(x,x′)+c)
(12)
2.2 航路网航段交通状态识别模型
航路网航段交通状态识别模型主要采用基于数据驱动的思想,通过大量的数据训练模型,学习分辨航路网交通拥挤特征,最终实现航段交通状态的识别.
步骤1采集航路网飞行轨迹数据,计算航路网航段交通状态评估参数,获得航路网交通状态评估参数样本.
步骤2基于航路网FCM交通状态等级划分模型,采用FCM聚类分析的方法划分航段交通状态等级,将航路网航段交通状态划分为四级,分别为拥挤态、稳定态、畅通态、少交通量态,构建航路网航段交通状态评价矩阵T,作为航路网交通拥挤状态识别实验样本.
步骤3将航段交通状态评估参数及对应状态等级作为航段交通状态识别模型的训练集,分别训练多项式核函数、径向基核函数、Sigmoid核函数的SVM识别模型.
步骤4依次将不同核函数的SVM识别模型识别当前航段的交通状态等级,选取识别准确率最高的结果作为最优结果,最后识别航路网拥挤航段.
步骤5计算航路网拥挤指数,识别和监控航路网交通拥挤态势.
2.3 航路网交通拥挤指数
航路网交通拥挤指数(CI)为航路网特定时刻的拥堵强度量化后的相对数,反映航路网拥堵程度.航段航空器飞行总里程指航段平均流量与航段长度的乘积,反映该航段上所有航空器飞行的总里程,从空间角度代表了航路网中该航段的重要程度.
(13)
ηs=qs×ls
(14)
式中:τs为航段s交通状态等级;ηs为航段s航空器飞行总里程;qi为航段s交通流量;ls为航段s长度;λ为航路网中包含的航段数.
3 实证分析
选取我国中南地区比较繁忙的A599,R343,R474,R399,B330航路部分航段构成的航路网为例进行实证分析,验证模型的有效性,见图1.航路网由9条航段构成,基本参数见表1.采集航路网2014年3月1 -3日的飞行航迹数据,以15 min时间间隔,计算航段交通状态评估参数,建立交通状态评价参数矩阵T.
利用交通状态评价参数矩阵T,进行FCM聚类,聚类类别数设为4,从而将航路网航段交通状态划分四个等级,得到航路网9条航段3 d288个时间片共2 592个交通状态样本的拥挤等级,其中交通拥挤态、稳定态、畅通态、少交通量态样本数量分别为195,514,817,1 066.航路网航段交通态势聚类结果见图2.
图1 选取的中南地区航路网络示意图
航段名称航段位置航段长度/km所属航路1BSE-LBN170A5992LBN-GYA260A5993NNG-LBN100R3434LBN-MAMSI130R3435BSE-NNG135R3996NNG-GYA350R4747MAMSI-GYA250B3308MEPAN-BSE80A5999NL-NNG100R474
图2 航段交通状态聚类结果
采用Matlab2010b以及LIBSVM工具箱,选取航路网1日864组航路网交通状态参数和拥挤等级作为SVM航路网交通状态识别模型的训练样本,分别采用多项式核函数、RBF核函数、Sigmoid核函数训练SVM航路网交通状态识别模型;2日864组航路网交通状态参数作为测试样本,识别航路网航段交通拥挤等级,测试模型的识别效果.采用多项式核函数、RBF核函数、Sigmoid核函数的识别结果见表2,可知采用RBF核函数的识别模型识别正确率最高,平均绝对误差最小,为此识别模型采用RBF核函数最优.
表2 不同SVM核函数识别结果
图3为采用RBF核函数的交通拥挤态势识别结果,其中最佳参数惩罚因子γ=0.19,RBF核函数方差σ=73.52,可知模型识别准确率为99.2%,识别效果良好.基于RBF核函数的航路网交通拥挤状态识别模型能够利用交通状态评价参数快速准确识别航段交通状态等级.
图3 航段交通拥挤态势识别结果(RBF核函数)
限于篇幅,选取航段1和航段3分析航段交通拥挤特性.图4为航段1和航段3的交通状态等级与航段流量的关系,由图4可知,航段交通状态等级同航段流量存在对应关系,变化趋势基本相同,航段交通拥挤等级时间序列能够反映航段交通拥挤态势.航段1的交通拥挤状态发生在9时与10时之间,航段3的交通拥挤状态发生在12时与13时之间,且航段1交通拥挤程度较低,大部分时段处于交通畅通状态,而航段3拥挤程度较高.两航段0时至8时的交通状态都处于少交通量、畅通状态,符合航班运行的实际情况.
图4 航段1和航段3交通状态等级与 航段流量之间关系
采用“航段拥挤等级比例”概念识别航路网中拥挤航段.航段拥挤等级比例指统计时段内航段各拥挤等级所占时长的比例,可直接量化航段的拥挤占比情况.表3为航段交通拥挤等级比例,可以直观识别航段拥挤程度,其中航段4拥挤程度最严重,其拥挤态占比为40.63%,航段8次之,其拥挤态占比为13.54%;航段2和航段6交通拥挤程度最轻微,其交通拥挤态占比分别为0、1.04%,少交通量态占比分别为55.21%、42.71%.航段1、航段3、航段9拥挤程度也较低.航段4拥挤程度最高是因其为繁忙的R343航路的部分航段,交通负荷较大.通过对航路网拥挤航段识别,可为航线规划、流量管理提供决策支持.
表3 航段交通拥挤等级比例 %
图5为2日航路网拥挤指数识别结果,可知航路网整体状态为轻微拥挤,共有19个时间片的交通拥挤指数处于稳定态和拥挤态之间,全天占比19.8%,时段处于09:00—23:00.高峰时段,交通拥挤指数出现显著波动,符合航班实际运行特征.航路网交通拥挤指数可用于航路网整体运行态势监测和预警,对交通流量管理、空域精细化管理、管制运行策略制定具有一定的应用价值.
图5 航路网3月2日拥挤指数识别结果
4 结 束 语
本文建立了航路网交通状态识别模型,借助飞行航迹数据验证了模型的有效性.研究结果表明:①航段交通状态评价参数可较为准确地评价航路网航段交通拥挤态势,FCM-SVM交通状态识别模型可快速识别航段拥挤状态等级,识别率达99.2%;②提出了航路网航段拥挤等级比例和航路网拥挤指数概念,可快速识别航路网拥挤航段,从航路网整体维度实现航路网交通拥挤态势监测和预警,可为交通流量管理、空域精细化管理、管制运行策略制定提供决策支持;③模型利用实测飞行航迹数据识别航路网交通状态,可客观真实反映实际运行情况,具备一定的行业应用价值.本文的研究尚未考虑恶劣天气、突发事件对交通拥挤态势识别的影响,这是未来研究的重要方向.