APP下载

基于分形插值的空中交通流量短期预测

2022-10-14王飞韩翔宇

航空学报 2022年9期
关键词:交通流量插值分形

王飞,韩翔宇

中国民航大学 空管学院,天津 300300

随着空中交通需求的持续快速增长,以航班个体为控制对象的传统空中交通管理模式在大型复杂任务求解的复杂性、实时性和鲁棒性等方面面临不可逾越的瓶颈。未来空中交通管理模式将从“单个航班控制”向“交通流群体管理”方式发生革命性改变。

空中交通流量(简称流量)是描述空中交通流的核心指标之一。流量预测是对未来一段时间、在某一空域范围内航空器数量的估计。根据预测时间范围的不同,流量预测又可分为中长期预测和短期预测。流量中长期预测服务于流量管理的战略阶段,一般以年、月、日为单位,为制定发展战略、空域规划、航班时刻表调整等提供参考。流量短期预测服务于流量管理的战术阶段,一般以小时、分钟为单位,对未来24小时内交通流量的预测,动态实时性很强,对空管运行更具指导作用和实际意义。空中交通流量短期预测对于空中交通流优化与管理的有效性和精准性具有导向作用,是空中交通流量管理中迫切需要解决的基础性问题。

在研究初期,由于交通密度小,外部人为和天气干预对飞行计划造成的扰动较小,主要通过预测航空器的4D航迹来分析进入和离开扇区的时间,从而统计出一段时间内扇区的流量。这一阶段的预测方法虽然经历了从确定型到概率型的改进,但是以单个航班为控制对象依然存在弊端:一方面难以解决大规模的计算难题,另一方面忽略了大量航空器所构成的交通流因交互作用而形成的内在非线性特征和演化规律。随后,在“交通流群体管理”理念指引下,以时间序列为手段,诸多学者发现空中交通流具有混沌、分形等典型非线性特征,应用混沌理论进行流量短期预测也取得一些成果。杨阳建立了流量时间序列混沌特性动态识别方法,提出了基于人工神经网络的空中交通流量时间序列预测算法,取得了较好的预测效果,但是神经网络模型的参数敏感性、过度拟合、消耗时间长等问题没有得到本质上解决。王超等研究了基于改进加权一阶局域法的混沌交通流量时间序列预测模型,但是相空间重构过程中诸如嵌入维数、延迟时间等参数的选择主观性较大,导致结果并不稳定。

不同于混沌,分形理论是基于部分与整体的自相似性,从部分出发来确立整体的性质,沿着微观到宏观的方向展开的。现实社会中,绝大多数系统并非严格意义上分形系统,而是统计意义的分形系统。分形预测模型有两大类:一类是分形分布模型,适用于随着特征线度增大也呈现增长趋势的数据预测,比如股票价格、居民消费价格指数、宏观交通量等,通常以年、月、日为统计单位进行中长期预测;另一类是应用分形自仿射特征的分形插值模型,通过构建迭代函数系(Iterated Function Systems,IFS)来拟合数据,并外推实现预测,适用于具有明显周期性的数据,比如电力负荷、城市用水量、地面交通流等,通常是以小时(h)、分钟(min)为统计单位进行短期预测。

与电力负荷、地面交通流类似,空中交通流每天的变化具有一定的相似性或周期性,但应用分形插值模型预测空中交流的研究尚未见诸于报导。本文以流量时间序列为研究对象,首先应用重标极差(Rescaled Range Analysis,R/S)方法识别其分形特征,然后应用分形插值模型建立每个相似日流量数据的IFS,并通过加权求和构建预测日的IFS,进而实现流量预测。

1 基于R/S的Hurst指数计算方法

应用分形插值模型的前提是时序数据具有自相似性或统计上自相似性。R/S方法通过分析时序数据不同时间尺度的统计特性变化规律来研究自相似性特征。该方法将原始时间序列划分为若干个子序列,对每个子序列按照式(1)计算,即可得到该时间序列的Hurst指数。

(1)

式中:为所考察的时间序列的时间区间,每个时间区间内的流量值组成子时间序列,如[2,5,7,…,9];分别为第个子时间序列的极差和标准差;为一个常数,由模型拟合自动确定;表示Hurst指数;(,)为第个子序列累计离差;表示原始时间序列中的第个数值;表示第个子时间序列的均值。

绘制lg~lg()曲线图,应用回归分析计算斜率,即为Hurst指数。当=0.5表示观测序列是随机变化的,无规律可循,不可预测;否则说明观测时序具有分形特征,即具备自相似性,可以短期预测。

2 分形插值预测方法

分形插值函数是根据给定的插值点构造相应的IFS,使得该IFS形成的吸引子通过全部插值点。根据吸引子定理和分形拼贴定理,利用该IFS从此函数空间的任一初始点开始迭代,得到的吸引子都为通过该组插值点的函数图象。这就为应用分形插值模型进行预测奠定了理论基础。

2.1 分形插值模型

将一维小时流量时间序列按照时间先后顺序进行排序,通过添加数据序号构建二维流量数组{(,)∈R,且<,…,<,=1,2,…,}。如将一维[2,5,7,…,9]转换为二维[(1,2),(2,5),(3,7),…,(100,9)],通过构造IFS{R,,=2,…,},使得吸引子是内插数据的连续函数:[,]→R绘制的图像。可见,确定分形插值函数的核心就是计算出,具体表达式为

(2)

并且满足

(3)

(4)

式中:(,)为二维数组某个点的坐标,表示序号,表示对应的流量值;为IFS中第个仿射变换关系;为仿射变换矩阵的元素;为变换后的常数。将垂直比例因子∈(-1,1)作为自由变量,则可得到

(5)

可见,只要计算出,即可确定中的相关参数和分形插值函数,再根据确定型和随机型迭代算法,进行多次迭代,将形成一条稳定的IFS吸引子曲线,不仅通过插值点,也与原曲线充分逼近。此时的IFS本质上是对历史数据进行插值操作,针对多组历史数据将多个IFS加权求和形成1个IFS,用于生成预测数据的吸引子图像,进而实现数据预测。

2.2 垂直比例因子计算方法

垂直比例因子关乎插值图形的形状,对插值结果有极大影响。文献[24]采用在[0,1]区间随机取值,该方法虽然简单,但没能有效利用相邻插值区间的差异性,无法精准刻画插值函数形状。文献[25]中解析法是基于等间距的离散点集给出的,而实际应用中存在大量非等间距的点集,因此应用受限。本文采用可应用于非等间距的离散点集、能反映数据点分布性质的计算方法——解析法。

(6)

3个中间变量的计算式为

(7)

式中:满足

++1

(8)

2.3 相似日分形预测方法

空中交通流每天24个小时流量走势也具有一定相似性,因此可利用过去几个相似日的流量数据,预测未来24小时流量值。具体步骤如下:

选择个相似日。相似日的选择方法有多种,以预测日为起点,向前顺次选择连续天作为相似日。每个相似日数据是由24个数值组成的时间序列。

针对每个相似日数据,确定插值点集合。通常情况,将数据极值点、拐点设置为插值点,由于24个小时数据计算量不大,本文将24个数据点均作为插值点。

建立每日流量数据的IFS。根据式(2)~式(8),可确定所有天的IFS。

对已求得的个IFS进行加权求和,得到1个统计意义上IFS。权重选取可按照“近大远小”的原则进行赋值,赋予离预测日越近的相似日IFS越高的权值。

在加权IFS基础上,从任意一点开始迭代即可得到吸引子,即由历史数据拟合而成的预测日流量数据曲线。

吸引子曲线上的点坐标极有可能不是整数,不符合流量数据的要求。针对1~24中每一个整数横坐标,设定参数,计算横坐标在[-,+]范围内所有点的纵坐标的均值,将其取整即为预测的

根据式(9)计算均衡系数和平均绝对相对误差。数值越大预测效果越好,数值越小预测效果越好。

(9)

(10)

3 算例分析

采集三亚01号扇区2017年9月22日—10月27日运行数据,除了9月30日因采集技术原因导致数据异常外,一共35天运行数据。期间并没有出现明显的强干扰事件,可以认为本文使用的数据为常态下的运行数据。前34天数据用于分析与预测,第35天10月27日(星期五)数据用于验证预测结果准确性。

3.1 Hurst指数计算

以60 min为统计尺度构造流量时间序列,并采用R/S分析法绘制的lg~lg()曲线如图1所示。计算出的Hurst指数为0.333 6,分形维数为1.666 4,说明所研究时间序列数据具有分形特征,可以应用分形理论进行研究。

图1 Hurst指数拟合曲线Fig.1 Fitting curve of Hurst exponent

3.2 相似日选择

01和04号扇区属于高低扇,虽然存在合扇运行的可能,但是所使用的历史流量数据统计是按照独立01号扇区范围(含高度范围)进行统计,预测的流量值也是针对独立01号扇区范围的。因此,所研究的01号扇区范围和航路航线结构是固定不变的,无论选择哪一天作为相似日,都是具有相同的空域结构。

通常,离预测日越近,其数据影响越大,可以选择预测日前几天作为相似日。选择10月20日—10月26日共7日数据,每天的流量变化趋势如图2所示。

图2 空中交通流量曲线Fig.2 Curves of air traffic flow

从图2可以看出,每日的24小时流量虽然部分时段的极值分布有差异,但整体变化趋势是一致的,说明每一天的小时流量分布具有相似性,预测日的数据变化趋势也应与此类似,利用相似日数据进行预测是可行的。

3.3 预测结果

应用10月20日—10月26日数据,采用解析法生成7个IFS。由于分形系统受近期影响较大,而航空公司同在星期五的飞行计划相似度也较高,因此将10月20日(同为周五)和10月26日(最近一天)生成的IFS权重设置高一些,其余IFS权重小一些,从而将7个IFS加权求和,形成统计意义上的1个IFS。从任意已知点出发,采用确定型迭代方法,经过4次迭代,即可获得预测日流量的吸引子图像,如图3所示。

图3 预测流量的吸引子图像Fig.3 Attractor image of forecast flow

根据该吸引子计算得到的24个小时流量预测值如表1所示,变化趋势如图4所示,预测绝对误差如图5所示,计算出的为0.957 4、为0.086 7,预测结果较好。产生误差可能的原因,一方面原始数据集合不是严格意义上,而是统计意义上的的分形集合,另一方面原数据有噪声。

表1 预测流量值Table 1 Predicted flow value 架次

图4 小时流量预测结果Fig.4 Hourly flow forecast results

采用随机因子法计算垂直比例因子,得到的预测结果为0.957 1、为0.079 8,与解析法并没有显著差异。

图5 预测绝对误差Fig.5 Absolute error of prediction

3.4 相似日数量影响

以预测日为起点,顺序选择之前的1~14日作为相似日,研究不同相似日数量对预测结果的影响,如图6所示。

图6 不同相似日数量对应的预测结果Fig.6 Forecast results corresponding to different characteristic days

从图6可以看出,采用的相似日数量在7日以内时,预测结果的和数值不稳定,7日以上时预测结果的和数值变化不大。对于本算例而言,选择12个相似日,对应的和最优,分别为0.959 9和0.093 2。

3.5 统计尺度影响

在流量管理实际工作中,除了预测统计尺度为60 min的流量之外,往往还需要预测统计尺度为30 min和15 min的流量。按照相同的方法,计算的Hurst指数分别为0.392 9和0.380 3。选择7天临近相似日,预测结果如图7和图8所示。在小统计尺度条件下,由于有部分真实值为0,导致为无穷大,因此本部分只采用来分析预测结果。

图7 30 min流量预测结果Fig.7 Flow forecast results per 30 min

图8 15 min流量预测结果Fig.8 Flow forecast results per 15 min

从图7和图8可以看出,预测结果能反映流量整体变化趋势,但随着统计尺度变小,数值波动性变大。计算出的分别为0.925 9和0.875 7,说明统计尺度变小,预测准确性有所下降。

3.6 相似日影响

航班具有周计划的特点,在同一航季周期内,理论上,相同周天具备相似场景。因此,除了选择临近相似日,也可以选择相同周天相似日。本文预测日10月27日是周五,选择9月8日—10月20日共7个周五作为相似日,最近的3日权值取0.2,其余天取0.1,计算得到为0.954 0,为0.106 5,与临近相似日预测结果差别不大。究其原因,由于航班运行过程中受到诸多不确定因素影响,即便是相同飞行计划也可能产生不同的运行结果,航班计划与实际运行状况存在差异,航班计划相似性并不直接导致相同周天小时流量分布相似性,因此相同周天相似日也能获得较好预测结果,但并没有明显优于临近相似日预测结果。

3.7 不同预测方法比较

传统的时间序列预测方法有自回归模型(Auto Regressive,AR)、移动平均模型(Moving Average,MA)及自回归移动平均模型(Auto Regressive and Moving Average,ARMA),采用临近7日相似日数据进行预测,结果如表2所示。从表2可以看出,传统时序预测方法预测结果明显劣于本文方法,说明对于非线性分形时序数据,本文方法有更好的适应性。

表2 不同方法预测结果比较

4 结 论

验证了空中交通流具有非线性分形特征,应用分形插值模型构建了流量时序的IFS,并在此基础上实现了流量预测,得到以下结论:

1) 应用分形插值模型建立相似日的IFS,从而进行24小时流量的短期预测是可行的和有效的。非严格分形集合是产生预测误差的主要原因。

2) 相似日数量对于预测结果有一定影响,针对本文算例,相似日数量在7日以上时,预测效果相差不大。临近相似日和相同周天相似日的预测结果没有显著差异。

3) 统计尺度越小,数据波动性越大,预测效果越差。对于这一类数据,可考虑采用分解集成方法,有效降噪后再进行预测。

4) 相对于AR、MA和ARMA等传统时序预测方法,分形插值法对于非线性分形时序数据预测具有更好适应性。

5) 由于每天的空中交通流量时序数据具有较好的周期性,采用分形插值方法取得了较好预测效果,然而对于周期性较差的时序数据,分形插值方法的适用性还需进一步验证。

猜你喜欢

交通流量插值分形
无定河流域降水量空间插值方法比较研究
像科幻电影般变幻莫测
分形
福州市PM2.5浓度分布的空间插值方法比较
不同空间特征下插值精度及变化规律研究
燕山路与曹雪芹西道交叉口运行有轨电车可行性研究
无人车对交通流的影响分析
绝美的分形艺术
交通流量增长下的空管安全预警系统研究
分形的意蕴