基于多维数据的高速公路服务水平实时判别方法
2018-09-10赵文忠耿立艳梁毅刚张占福
赵文忠,耿立艳,梁毅刚,张占福
(1.河北曲港高速公路开发有限公司,河北保定071000;2.石家庄铁道大学经济管理学院,石家庄050043;3.石家庄铁道大学四方学院,石家庄051132)
0 引言
高速公路服务水平的准确、实时判别,不仅需要对交通流进行实时预测,而且要根据实际情况对道路服务水平进行合理划分及准确判别,这既有利于出行者根据道路信息合理安排出行路线,也对后期的高速公路交通控制管理有至关重要的作用.高速公路的服务水平判别方法的关键是采用合适的服务水平划分及判别方法.美国利用车流密度对高速公路的服务水平进行划分[1],德国将平均速度作为干线公路服务水平的评价指标,日本则将流量与通行能力的比值作为服务水平划分的依据[2].王华荣等[3]使用灰色系统理论评价道路服务水平;韩斌[4]基于交通量的预测实现了对高速公路服务水平的分析.以上成果仅根据现有交通流参数的影响实现对高速公路服务水平的划分及判别,得到的高速公路服务水平并不具有实时性,且并未实现对多种交通信息的整合,难以保证交通信息发布的时效性.高速公路服务水平的实时预测主要是预测交通流参数,国内外学者提出的不同交通流短时预测模型,均可用于高速公路交通流预测.Ghosh等[5]利用自回归移动平均(ARIMA)模型预测公路交通流.Vlahogianni等[6]验证了神经网络在交通流预测方面的有效性.傅贵等[7]构建了基于支持向量机的短时交通流量预测模型,并证明了其可行性和有效性.熊志华等[8]采用粒子群优化的多维混沌时间序列预测道路网多个断面的交通流,获得了较好的多断面短时交通流预测效果.
综上所述,目前对高速公路服务水平的划分与判别方法和交通流参数短时预测方法结合起来的研究较少,此外,现有研究中,大多数高速公路交通流参数预测方法仅考虑其随时间的变化趋势,而对天气、出行日期等不定性因素引起的变化欠考虑.本文在考虑多种影响因素的基础上,构建基于多维数据的高速公路服务水平实时判别模型,实现对高速公路服务水平的参数预测及实时判别,为实时交通信息的融合与处理提供理论基础,为基于大量数据的智能交通管理与控制提出方法依据.
1 高速公路服务水平实时判别模型
1.1 高速公路服务水平划分模型
高速公路服务水平划分模型利用模糊C均值(Fuzzy C-means,FCM)划分高速公路水平.设有n个样本的数据集X={x1,x2,…,xn},将样本分为c类,1<c<n,对任意xi∈X,其特征向量xi=(vi,ki),vi,ki分别表示第i个样本的速度、密度.根据目标函数最小化获得高速公路各类服务水平的聚类中心,以隶属度函数定义的目标函数为
约束条件为
式中:uij为第j个样本对于第i类的隶属度函数,为c×n阶模糊分类矩阵;为2×c阶聚类中心矩阵;ah为第h个高速公路服务水平聚类中心的特征向量且;m为模糊加权指数;,为第j个样本xj到第i类ai的欧氏距离;J(U,A)为各类样本到高速公路各类服务水平聚类中心的加权值,根据聚类准则求得
以上算法的实现步骤如下:
Step 1设定q为迭代运算次数,给出迭代标准ε>0,隶属度矩阵计算公式如式(8)所示.如果存在,使得,则令
Step 2设聚类中心的迭代运算为
Step 3用1个矩阵范数||∙||比较a(q+1)与a(q),若满足式(10),则停止迭代,得到高速公路各类服务水平的聚类中心矩阵为A=[a1,…,ah,…,ac];否则,q=q+1,转Step1.
1.2 高速公路服务水平判别参数预测模型
最小二乘支持向量机(LS-SVM)是一种改进型支持向量机,它将支持向量机的二次规划问题转化为求解线性方程组问题,不仅提高了求解问题的速度与收敛精度,而且获得了很好的推广性能[9].本文的高速公路服务水平划分由交通流速度和密度两个因素确定,从而高速公路服务水平的预测需确定交通流速度和密度两个参数.考虑时间、天气及出行日期等多因素,选用LS-SVM预测交通流速度和密度两个参数.以速度为例建立预测模型.
式中:φ(xi)为高维特征空间映射函数,实现对输入变量的变换;ω为权矢量;b为常数.根据结构风险最小化原则,用于函数估计的LS-SVM问题可以表示为
定义拉格朗日函数为
定义核函数K(x,xi)=φ(x)φ(xi),结合库恩—卡特条件,将式(12)转化为1组线性方程为
根据式(14)可求δ*=[δ1*,δ2*,…,δl*]和b*,则 LSSVM函数估计模型为
构造LS-SVM模型时,引入RBF核函数,即
根据上述方法可得到速度的预测结果函数,同理可得密度的预测结果.
1.3 高速公路服务水平判别模型
利用高速公路服务水平划分模型获得各个分类聚类中心,基于高速公路服务水平判别参数预测模型,预测交通流速度和密度两个参数,并建立高速公路服务水平判别模型预测其服务水平.高速公路服务水平判别模型为
式中:xp表示第p个高速公路服务水平预测样本数;vp和kp分别表示第p个高速公路服务水平预测样本的速度与密度;ag为第g类高速公路服务水平的聚类中心;vag和kag分别表示此类服务水平聚类中心的速度与密度;β1和β2分别表示速度与密度对服务水平分类的影响权重,且0≤β1≤1,0≤β2≤1,β1+β2=1.
2 实例计算
2.1 数据来源及处理
河北省初步建立了全省交调数据中心,建成交通情况调查站663个.交调站配备了线圈、微波、视频等具有连续采集数据和数据远程传输的自动交调仪器,自动实时采集道路交通量、车速等数据指标,然后通过网络将数据传输到统一的数据中心,完成调查实时数据的接收.本文从“河北省公路交通情况调查系统”下载得到河北省高速公路10个观测站2016年8~10月,周期为5 min的单方向交通流数据264 960组;2016年11月1日、2016年11月6日全天,周期为5 min的单方向数据5 760组;以及2016年11月22日某一观测站的全天,周期为5 min的单方向数据288组;共计271 008组样本,进行实例验证.设备的采集间隔为5 min,采集的速度及密度数据都是瞬时数据,其中速度定义为车辆在某瞬时行驶的快慢和方向的矢量,单位为km/h;密度定义为某瞬时单位长度1条车道上的车辆数,单位为pcu/km.由于观测站收集数据时会产生少量的错误数据,采用阈值分析和基本的交通流理论对数据进行适当的筛选与处理,最终获得的有效样本的训练数据237 360组,预测数据6 048组.如果速度和密度的任何一个值为0时,便认为是错误数据,应进行剔除.
选取2016年10月1日的部分基础数据进行展示,如表1所示.
表1 某高速公路某观测站样本原始数据Table 1 The sample of raw data of an observation station of a highway
为了计算方便,对交通流速度与密度样本进行标准化处理,作为高速公路服务水平划分的基础样本数据.以速度为例,其标准化公式为
式中:i=1,2,…,n;n为样本数量;vi为第i个样本数据的速度;vmin为n个样本中的速度最小值;vmax为n个样本中的速度最大值.同理,可得密度的标准化样本数据.
2.2 高速公路服务水平的划分
高速公路服务水平划分模型中,确定划分分类数c和模糊度参数m.根据河北省高速公路交通流的历史数据状态特征,将高速公路服务水平划分为4类:{优、良、中、差},即c=4.m为模糊度参数,取m=2.
以标准化后的237 360组交通流速度、密度数据作为服务水平划分的样本数据集,由高速公路服务水平划分模型,得到样本数据的服务水平聚类中心A.图1为样本数据及各服务水平聚类中心示意图.矩阵A的4行分别表示优、良、中、差4种服务水平的聚类中心,每行的2列分别表示速度与密度.将A进行反归一化处理,得到高速公路服务水平各分类的聚类中心矩阵A'.
图1 基础数据及高速公路服务水平聚类中心示意图Fig.1 Basic data and schematic diagram of the cluster center of the highway service level center
2.3 高速公路服务水平判别参数的预测
利用高速公路服务水平判别参数预测模型进行参数预测时,考虑月、日、小时、分钟、天气、出行日期、速度和密度等多维因素.从出行日期特征及天气角度选取2016年11月1日(工作日)、11月6日(非工作日)全天,周期为5 min的数据作为的预测数据集.每个观测站576组数据,10个观测站共计5 760组数据.表2为某高速公路某观测站的预测数据.
表2 某高速公路某观测站预测数据Table 2 The forecasted data of an observation station of a highway
根据高速公路服务水平判别参数预测模型获得某观测站576组高速公路服务水平参数速度、密度预测值.选用平均绝对偏差(MAD)和平均绝对百分比误差(MAPE)评价模型的预测性能.表3为工作日与非工作日高速公路服务水平参数预测误差.图2为工作日速度预测结果与实际变化趋势图,误差为MAD=4.95,MAPE=7.18%;图3为工作日密度预测结果与实际变化趋势图,误差为MAD=2.55,MAPE=18.35%;图4为非工作日速度预测结果与实际变化趋势图,误差为MAD=4.68,MAPE=5.92%;图5为非工作日密度预测结果与实际变化趋势图,误差为 MAD=3.85,MAPE=20.92%.速度的平均误差MAD=6.00,MAPE=8.83%;密度的平均误差 MAD=1.56,MAPE=11.70%.由此,工作日和非工作日得到的速度与密度预测结果曲线均与实际变化曲线基本吻合,整体变化趋势与实际值相符,预测效果较好,验证了所提出预测模型的有效性.
2.4 高速公路服务水平的判别
利用高速公路服务水平参数和高速公路服务水平各个聚类中心,根据高速公路服务水平判别模型,获得2 880组工作日和2 880组非工作日的服务水平预测值.表4和表5分别为某高速公路某观测站工作日和非工作日服务水平判别预测数据.为了更好地展示结果的多样性,本文在同一观测站2016年11月22日(工作日,小雪)的全天,周期为5 min的数据,共288组,进行高速公路服务水平的预测和判别.因当天为小雪天气,对人们的出行质量会产生一定的影响,预测的整体服务水平偏低.最终的结果展示在表6中,过程同上.
表3 工作日与非工作日高速公路服务水平参数预测误差Table 3 The forecasted errors of service level parameters of highway on working and non-working day
图2 工作日速度预测值与实际变化趋势图Fig.2 Variation tendency diagram of the forecasted and actual velocity on workday
图3 工作日密度预测值与实际变化趋势图Fig.3 Variation tendency diagram of the forecasted and actual density on workday
图4 非工作日速度预测值与实际变化趋势图Fig.4 Variation tendency diagram of the forecasted and actual velocity on non-workday
图5 非工作日密度预测值与实际变化趋势图Fig.5 Variation tendency diagram of the forecasted and actual density on non-workday
表4 某高速公路某观测站工作日服务水平预测数据Table 4 The forecasted data of service level of an observation station of a highway on working day
表5 某高速公路某观测站非工作日服务水平预测数据Table 5 The forecasted data of service level of an observation station of a highway on non-working day
表6 某高速公路某观测站11月22日服务水平预测数据Table 6 The forecasted data of service level of an observation station of a highway on Nov.22nd
3 结论
基于大量交通流监测数据的实时高效的高速公路服务水平预测,对提高出行服务质量和高效交通管理控制策略具有重要的理论价值和实践意义.本研究基于多维交通大数据,提出了高速公路服务水平划分模型、判别参数预测模型,进而构建了高速公路服务水平实时判别模型.以河北省高速公路数据为例,验证了高速公路服务水平实时判别及预测模型的有效性.