基于“两客一危”数据的高速公路服务区路段车辆行驶模式研究
2017-06-09高悦尔阚小溪崔紫薇
高悦尔,阚小溪,胥 川,崔紫薇
(1. 华侨大学建筑学院,福建 厦门 361021; 2. 西南交通大学交通运输与物流学院,四川 成都 610031; 3. 华侨大学数学科学学院,福建 泉州 362021)
基于“两客一危”数据的高速公路服务区路段车辆行驶模式研究
高悦尔1,阚小溪1,胥 川2,崔紫薇3
(1. 华侨大学建筑学院,福建 厦门 361021; 2. 西南交通大学交通运输与物流学院,四川 成都 610031; 3. 华侨大学数学科学学院,福建 泉州 362021)
基于“两客一危”数据,以沈海高速公路厦门段为例,通过浮动车的GPS时空图发现高速公路服务区路段车辆行驶特征,同时选取车辆的平均速度、 最低速度、 速度方差等车辆运行特征指标进行层次聚类,得到服务区路段车辆的行驶模式. 研究结果表明,高速公路服务区路段存在3种行驶模式,即进出服务区、 正常行驶和交织减速,基本可以代表车辆在服务区路段的实际运行状态.
“两客一危”数据; 高速公路; 服务区路段; 行驶模式; 层次聚类
0 引言
随着社会经济的发展,人们生活水平提高,机动车保有量呈现逐年递增的趋势,但道路基础设施建设却远远无法满足机动车增长的需求. 因此,人们着眼于运用新的智能交通手段来监测道路交通状态,为驾驶员提供准确的预报,以提高道路的使用效率. 根据国家相关规定,要求“两客一危”(“两客一危”车辆,是指从事旅游的包车、 三类以上班线客车和运输危险化学品、 烟花爆竹、 民用爆炸物品的道路专用车辆)重点营运车辆必须全部纳入企业监控和政府监管平台,因此,“两客一危”数据具有一定的权威性和可靠性. 由于高速公路服务区路段与一般路段之间存在不同的车辆运行状态,通过建立“两客一危”车辆数据分析模型,识别高速公路服务区路段不同车辆的行驶模式,可以剔除非正常行驶车辆数据,例如进出服务区车辆数据,对高速公路交通状态进行判别.
国内外学者对高速公路交通展开了大量的研究与实践. 在数据方面,主要包括收费数据[1]、 出租车数据[2]和“两客一危”数据[3]等; 在研究对象上,已有的研究主要从路段来展开,包含对高速公路路段平均速度估计[4]、 路段行程时间预测方法[5]和行程时间可靠度模型[6]等方面的研究; 在研究内容上,已有研究主要是对高速公路交通状况进行判别. 李琦[7]以专用车辆检测器、 感应式交通控制系统、 道路收费系统、 车辆跟踪定位系统等多种数据源为基础,对交通数据的多模式获取以及交通状态监测与预测等方法进行了创新性研究; 尹春娥等[8]在宏观交通流模型和状态空间模型的基础上,基于贝叶斯理论,提出了一种基于混合粒子滤波的交通参数估计方法; Pascale等[9]提出了一项利用重型车辆数据识别典型速度模式的研究,通过探测数据识别的速度模式与先前识别的历史速度模式的对比,对异常事件进行了检测.
综上所述,国内外学者在高速公路交通流及状态判别方面取得了诸多研究成果. 但大多是从高速公路的整体层面进行研究,对于高速公路上重要服务设施的研究较少. 由于高速公路服务区的特殊职能,即为驾驶员提供休息、 就餐,为车辆提供加油、 维护和修理等服务的场所,导致了服务区路段车辆的行驶模式呈现出不同于一般高速公路路段的特征,影响了高速公路交通状态的判别. 为了实现更加准确的高速公路交通状态判别,文章基于“两客一危”数据对服务区路段的车辆行驶模式进行研究,以进一步挖掘服务区路段非正常行驶的车辆数据,为高速公路交通状态判别提供数据基础.
1 研究方法
考虑到服务区路段车辆可能存在不同的行驶模式,研究采用聚类方法对其进行分析. 聚类方法是一个将数据集划分为若干组或类的过程,并使得同一个组内的数据对象具有较高的相似度,而不同组中的数据对象则是不相似的. 相似或不相似的度量是基于数据对象描述的取值来确定的,通常是利用各对象间距离来进行描述[10].
研究采用层次聚类分析法,层次聚类分析法包括单连锁法、 全连锁法、 平均连锁法、 质心连锁法、 中值连锁法和Ward法,已有研究通常采用的是Ward法. Ward法又称离差平方和法[11],即以平方欧式距离作为两类之间的距离,先将集合中每个样本自成一类,在进行类别合并时,计算类重心间方差,通过合并离差平方和增加幅度最小的两类,再依次将所有类别逐级合并[12]. 具体算法如下:
图1 数据处理流程图Fig.1 Data processing flow chart
则k个类的类内离差平方和为:
为了对车辆的行驶模式进行判别,在对高速公路服务区路段车速进行聚类之前,对服务区路段车辆行驶特征进行分析. 研究通过浮动车的GPS时空图对车辆的运行轨迹进行分析,得到高速公路服务区路段的车辆行驶特征. 同时,通过已有数据的分析,参考倪捷等[13]关于车速分布指标与线性一致性关系的研究,选取车速的均值、 方差、 标准差、 偏度、 峰值、 最大值、 最小值进行多次分析,发现车速的最小值、 平均值、 标准差较适合作为聚类分析的特征指标进行聚类分析,最终对二者结果进行对比验证,得到高速公路服务区路段车辆行驶模式. 具体流程图见图1.
2 研究对象和研究范围
2.1 研究对象
选取沈海高速厦门段作为研究路段,如图2所示. 该路段主要位于厦门市境内,全长约44.9 km,为双向8车道. 小汽车最高限速为120 km·h-1,大客车、 货车最高限速100 km·h-1,最低限速60 km·h-1. 其中共包含2个服务区,5个互通出入口. 该研究路段建成通车后,车流量逐年增长,经济效益十分明显,是闽南各地区交通联系的重要纽带之一.
数据主要涵盖沈海高速公路厦门段范围内的“两客一危”数据. 随机选取了2016年4月18—19日共两个工作日的数据文件,共约101 352条,每条数据包括车辆编号、 车辆类型、 当前日期、 当前时间、 里程数、 行程车速、 瞬时车速等. 由于“两客一危”数据来源于不同业务系统,容易出现数据的无效和缺失,在开展研究之前,对数据进行了清洗.
2.2 研究范围的确定
对于选取多少基本单元来进行服务区路段运行模式的研究没有一个明确的范围和控制,因此需要分析服务区对车辆的影响范围. 考虑到东孚服务区周边有海沧枢纽,对车辆的运行状态会产生一定的影响,因此选取龙掘服务区附近的“两客一危”数据,对其运行轨迹进行分析,如图3所示.
由图3可知,车辆一般在里程32~35 km内呈现出减速再加速的运行状态,并且较多车辆运行速度的最低点在33.5 km附近出现,此处恰好是龙掘服务区的位置所在. 当进出服务区车辆较多的时候,可能会产生交通流的交织,从而使得一部分在高速公路上正常行驶的车辆在服务区附近也出现了减速再加速的运行状态. 但与进出服务区的车辆速度相比,其速度并未为零. 因此,可以判定龙掘服务区对周边车辆的影响范围大致是3 km左右,即32~35 km之间.
图2 研究路段示意图Fig.2 Research expressway section
图3 服务区路段车辆速度-里程图Fig.3 Vehicle speed-mileage diagram in service section
3 服务区路段车辆行驶模式研究
3.1 基于GPS时空图的车辆运行特征分析
为分析服务区路段车辆运行特征,选取服务区路段“两客一危”数据进行GPS时空图分析,发现其运行轨迹差异. 根据服务区的影响范围分析,结合课题已有的研究成果,选取龙掘服务区影响范围里程32~35 km,30 min内的车辆GPS数据,即选取3×3时空单元格内的车辆样本点进行分析.
3.1.1 驶入服务区车辆的运行特征
选取相应的“两客一危”数据,绘制相应的GPS时空图,如图4所示,红色表示未进入服务区的车辆,绿色表示进出服务区的车辆,蓝色表示在该时间段内仅进入服务区的车辆,后续运行轨迹不包括在该时空范围内. 由图4可知,驶入服务区的车辆在进入服务区之前,会有一个明显的减速趋势. 但与路段拥堵时车辆的减速不同,驶入服务区的车辆速度将减速到0.
图4 驶入服务区车辆GPS时空图Fig.4 GPS space-time diagram of vehicle entering the service area
3.1.2 驶离服务区车辆的运行特征
选取相应的车辆数据,绘制相应的GPS时空图,如图5所示,其中紫色表示在该时间段内仅驶出服务区的车辆,前面的运行轨迹不包括在该时空范围内. 由图5可知,驶离服务区的车辆在离开服务区时会有一个明显的加速趋势. 其在匝道上达到了规定车速后,汇入高速公路主线. 与此同时,车辆在服务区的停留时间是随机的,但进出服务区车辆的加减速特征都比较明显.
图5 驶离服务区车辆GPS时空图Fig.5 GPS space-time diagram of vehicle leaving the service area
3.2 基于聚类分析的车辆行驶模式研究
由于所采用的是“两客一危”车辆GPS数据,不同车辆的GPS数据记录时间和里程等数据均不相同,导致车辆的GPS数据变化趋势不明显,进而影响后续的聚类分析和速度-里程变化曲线图的绘制. 因此在聚类分析之前,对服务区路段车辆数据进行了预处理,即在GPS原始数据的基础上进行曲线拟合,得到指定里程点车辆的速度信息.
3.2.1 聚类分析对象的选取
根据服务区的影响范围分析,同时考虑到车辆进出服务区是随机的,因此进出服务区的车辆数量适中即可,将工作日2 d内经过该路段的“两客一危”车辆作为聚类分析的样本数据,随机选取30辆车的速度-里程数据,对其速度的最小值、 均值、 标准差进行分析,作为每辆车的特征指标进行聚类. 在聚类完成之后,聚类结果已经收敛,同一类别内的数据对象具有较高的相似度,选取各聚类变量中心即这组数的平均数进行对比,以便更清晰直观地反映出各类别之间的差异.
3.2.2 聚类分析结果
采用Ward法进行层次聚类. 在聚类过程中,选择聚类冰柱图与树状图显示出整个聚类的过程. 其中冰柱图横轴为个案,纵轴为聚类个数. 冰柱图中最长的冰柱长度表示当前的聚类步数,画一条横线在纵轴,即可直观看出将这些数据聚成的类数. 树状图则是展现了聚类分析中每一次类合并的情况. 在横轴上画一条垂直线与图中横线相交,根据相交的线段即可判断分类个数[14].
通过SPSS软件分析得到层次聚类冰柱图与树状图,如图6所示.
图6 层次聚类图Fig.6 Hierarchical clustering diagram
由图6可知,车辆被分为了3类. 依据聚类的结果再分别做出各类车辆的速度-里程变化曲线图和各类车辆聚类中心对比图,其中各类中心用各个特征指标的均值表示,如图7、 8所示.
图7 服务区路段各类车辆的速度-里程变化Fig.7 Speed-mileage changes of various types of vehicles in the service section
3.3 各类车辆运行模式特征
图8 各类聚类中心对比图Fig.8 Comparison of the center of clustering
与其他类型的浮动车相比,“两客一危”车辆的速度较低,但由以上各曲线图可知,“两客一危”车辆的3类运行特征仍呈现出较大的差异.
1) 类别一表示较为异常的运行特征. 由图8可知,此类运行车辆的平均速度低,最小速度值均小于20 km·h-1,而且速度标准差偏大,主要车速区间为[0, 30]. 同时,由图7(a)可知,此类车辆的运行特征呈现出明显的减速后又加速的行驶状态,且行驶速度的最低点在33.5 km附近出现,此处恰好是龙掘服务区的位置所在. 此类车辆的运行特征与GPS时空图中车辆进出服务区时驶入和驶离的行驶特征相似. 因此,可以确认第一类车辆为进出服务区的车辆.
2) 类别二表示较为通畅的运行特征. 由图8可知,此类运行车辆的平均速度高,最小速度值大,速度标准差小,主要车速区间为[60, 80]. 同时,由图7(b)可知,此类车辆的运行特征呈现出匀速的行驶状态,车辆运行平稳,无明显减速和加速的趋势. 因此可以确定第二类车辆为高速公路上正常行驶的车辆.
3) 类别三表示较为拥堵的运行特征. 由图8可知,此类运行车辆的平均速度较高,最小速度值较小,速度标准差较大,主要车速区间为[40, 80]. 同时,由图7(c)可知,第三类车辆的运行特征呈现出明显的减速再加速的行驶状态. 但不同于类别一的是,其最小速度均大于40 km·h-1,且车速在33.5 km(龙掘服务区位置所在)之后会有明显的提升. 考虑到高速公路服务区路段进出服务区的车辆过多时,会出现交通流互相干扰的情况,从而导致服务区附近的后续车辆行驶车速较低,直至驶过服务区后交通流顺畅,车速才会迅速提升,恢复到高速公路路段的正常行驶车速. 因此可以确定第三类车辆为服务区路段附近车辆较多时发生拥堵行驶的车辆.
4 结语
通过GPS时空图绘制得到车辆在服务区路段的停车及驶离特征,再通过层次聚类分析车辆经过服务区的不同行驶模式,最后挖掘非正常行驶的车辆数据. 利用“两客一危”数据对高速公路服务区路段车辆的行驶模式进行分析, 得到以下3点结论.
1) 高速公路服务区路段与正常路段的行驶模式不同,存在着进出服务区、 正常行驶和交织减速的行驶模式.
2) 车辆进出服务区时,大致需要经过减速再加速的行驶过程. 未进入服务区的车辆则以匀速状态平稳行驶. 同时在服务区路段车辆较多时,还可能会产生交通流的交织,造成路段的拥堵.
3) 通过GPS时空图以及聚类分析可以看出,聚类分析在高速公路车辆行驶模式的分析中,具有一定的可行性. 对于今后利用高速公路海量GPS数据判别车辆在不同路段的运行模式研究具有重要的指导作用.
高速公路服务区路段的行驶模式分析需要大量且全面的数据支持,本研究只选取了服务区路段的“两客一危”数据, 且样本数量有限. 未来可以增加高速公路服务区路段的其他数据(例如出租车数据、 收费数据),同时增加研究的样本量做进一步深入研究,通过对车辆GPS大数据的处理,以期为出行者提供更加准确的高速公路交通状态信息.
[1] 杨庆芳, 马明辉, 梁士栋, 等. 基于收费数据的高速公路交通状态判别方法[J]. 华南理工大学学报(自然科学版), 2014, 42(12): 51-57; 76.
[2] 汪帆, 李岩, 刘建蓓, 等. 基于GPS车速数据驱动模型的高速公路极限匝道间距识别[J]. 公路交通科技, 2016, 33(9): 127-135.
[3] 刘凇男. 基于浮动车技术的高速公路地图匹配算法研究[D]. 长春: 吉林大学, 2013.
[4] 何兆成, 卢瑞琪, 聂佩林. 基于浮动车定位数据的高速公路区间平均速度估计[J]. 公路交通科技, 2011, 28(6): 128-135.
[5] 唐俊. 基于浮动车数据的高速公路路段行程时间预测方法研究及系统实现[D]. 广州: 中山大学,2011.
[6] 张岚岚. 高速公路行程时间可靠度计量方法研究[D]. 长春: 吉林大学, 2015.
[7] 李琦. 基于多源数据的交通状态监测与预测方法研究[D]. 长春: 吉林大学, 2013.
[8] 尹春娥, 宋小娜, 刘海朝. 基于混合粒子滤波的高速公路交通参数自适应估计方法[J]. 公路交通科技, 2015, 32(5): 141-146.
[9] PASCALE A, DEFLORIO F, NICOLI M,etal. Motorway speed pattern identification from floating vehicle data for freight applications[J]. Transportation Research Part C, 2015, 51(51):104-119.
[10] 郭军华. 数据挖掘中聚类分析的研究[D]. 武汉: 武汉理工大学, 2003.
[11] 赵骅, 朱莉华, 刘丹. Ward 系统聚类法在多变量分层抽样技术中的运用[J]. 统计与决策, 2006(23): 67-68.
[12] 杨志恒. 基于 Ward 法的区域空间聚类分析[J]. 中国人口·资源与环境, 2010, 20(3): 382-386.
[13] 倪捷, 刘志强, 王运霞. 双车道公路线形一致性分析及评价[J]. 中外公路, 2009(1): 4-7.
[14] 李昕, 张明明. SPSS 22.0 统计分析从入门到精通[M]. 北京: 电子工业出版社, 2015.
(责任编辑: 洪江星)
Research on vehicle driving pattern in expressway service section based on “long-distance bus and truck” data
GAO Yueer1, KAN Xiaoxi1, XU Chuan2, CUI Ziwei3
(1. School of Architecture, Huaqiao University, Xiamen, Fujian 361021, China; 2. School of Transportation and Logistics, Southwest Jiaotong University, Chengdu, Sichuan 610031, China; 3. School of Mathematical Sciences, Huaqiao University, Quanzhou, Fujian 362021, China)
Based on the data of “long-distance bus and truck” data, taking the Xiamen section of Shen Hai expressway as an example, the vehicle driving characteristics in expressway service section are found by means of the GPS spatial- temporal diagrams of the floating car. At the same time, the average velocity, the minimum velocity and the velocity variance of the vehicle are selected to carry out hierarchical clustering to get the vehicle driving pattern in the service section. The results show that there are three kinds of driving pattern in expressway service section, namely, in and out of service areas, normal driving and weaving deceleration, which can represent the actual running state of the vehicle in service section.
“long-distance bus and truck” data; expressway; service section; driving pattern; hierarchical clustering
10.7631/issn.1000-2243.2017.03.0398
1000-2243(2017)03-0398-06
2017-03-27
高悦尔(1983-),博士,讲师,主要从事交通运输规划与管理方面的研究,gaoyueer123@gmail.com
国家自然科学基金资助项目(51608209); 华侨大学高层次人才科研启动项目(600005-Z15Y0035)
U491
A