基于高平峰划分的宁波公交调度优化

2021-12-29王惠敏杨青萍林婉婷朱铭慧王立洪

宁波工程学院学报 2021年4期

王惠敏,杨青萍,林婉婷,朱铭慧,王立洪

（宁波大学数学与统计学院,浙江宁波 315211）

0 引言

随着社会经济的快速发展和人口的倍增，我国机动车拥有量急剧上升，交通问题日益严重[1]，“优先发展城市公共交通”战略成为共识[2]。据《统计公报》显示，2015年至2019年宁波常规公交客运量连续下降，究其原因，一方面在于近年来由于地铁、网约车等交通方式的崛起，给公交运营带来了一定的冲击；另一方面在于宁波公交运营排班中全面智能化有所欠缺，高峰期发车间隔最高达30 min，且发车间隔不规律，无法灵活应对由于上下班、节假日等造成的潮汐交通现象，以致公交运营出现高峰期出行供应不足和平峰期资源浪费的问题；此外，因高峰期交通拥堵，公交运行速度较低，准点率下降[3]，公交对乘客吸引力不足。截至2018年底，宁波市民选择公交出行比例仅占21.70%。据国内外研究表明，高峰期发车间隔应少于10 min，过久的发车间隔无法满足乘客出行需求，过短的发车间隔会导致交通拥堵且造成资源浪费，如何合理调度公交是提升公交运营服务水平的重要课题。

国内对于公交调度研究中多采用遗传算法，目前已有人提出基于遗传算法以乘客等车时间成本最小和收益最大为目标研究公交智能排班方法[4,5]；孙志田、张建梅等人提出在传统遗传算法中加入优先级编码方式以及染色体结构，以提高传统遗传算法效率[6]；刘继国[7]在基于遗传算法的公交排班系统研究中表明遗传算法能有效解决公交调度问题。

目前鲜有针对宁波地区公交调度的研究，本文将分析宁波公交高平峰状况，通过建立数学模型研究如何在兼顾“提升乘客满意度”和“降低运营成本”下对公交调度进行优化。

1 数据获取及预处理

申请宁波市数据开放平台[8]账号，以获取宁波市公交GPS数据、公交线路和公交站点等相关信息，并从宁波市数据开放平台申请由宁波市经信局提供的市民卡消费记录信息数据接口，登录账号通过数据接口用Python爬虫技术获取自2015年6月19日至2018年6月19日宁波市民卡消费记录信息共355 523 000条作为乘客数量的原始数据，约19.77 GB，数据类型包括交易流水、消费时间、消费金额、线路编号、车辆编号、站点编号等，见表1。

表1 宁波市民卡消费记录信息部分示例

对原始数据中缺失值、重复值及离群值进行数据清洗和整理，由公交线路标识号在市民卡消费记录信息数据中筛选出覆盖宁波主城区公交线路数据，随机挑选7条线路进行研究，共30 458 400条，统计所选线路对应日期中各时段的有效数据条数作为公交上车客流量数据，以“1路”公交线路为例，上车客流量在1 603人(2018年1月10日)至6 777人(2017年10月4日)之间波动。

2 公交在高平峰转换期的调度

本文将通过建立数学模型进行相关研究：给出公交线路上客流量高平峰的划分方法和预测方法，设计优化的高平峰公交调度方案，并用宁波公交客流量数据做实例分析。

2.1 公交车不同时段的高平峰划分

对于划分公交线路上不同时段的高平峰，采用费歇最优分割法，算法设计步骤见表2，即对每个时段的上车人数所组成的序列进行分段，每一分段为一类，通过计算损失函数，寻找一个分割，使类内样品之间差异最小，而类间样品差异最大[9-11]。

表2 费歇最优分割法设计步骤

定义阈值即高平峰划分标准，本文认为最直观的划分依据为客流量大小，由于各时段上下车人数高度相关，因此用上车人数作为客流量数据，定义阈值μ为各时段内客流量均值，当天内某个时段客流量大于μ时定义为高峰期，小于μ时为平峰期，公式为：

其中，n为时段数，ri为第i个时段的上车总人数。

2.2 运用遗传算法对公交车发车时刻表的规划

对于公交调度问题，分别考虑不同高峰期和平峰期下的客流情况，采用遗传算法进行规划，见图1。遗传算法是一种以数学方式通过计算机仿真，模拟自然选择及遗传历程中的繁衍、突变以及杂交的现象来寻求最优解的搜索算法[4-7]。

图1 遗传算法流程图

适应度函数是用来判断群体中个体的优劣程度，由目标函数来评估，乘客满意度由乘客总等车时间决定，公交公司满意度由运营利润决定，因此通过两方面来建立目标函数，一是使调度周期内乘客的总等车时间最短，二是公交运营利润最大。

①计算调度周期内乘客总等待时间

在发车间隔内乘客到达站点的等车时间服从均匀分布，因此乘客总平均等待时间为：

rij为第j站等第i趟车客流量，tij为在第j站第i趟车发车间隔。

将乘客等车时间换算成工资成本，设w为乘客平均每分钟工资，则乘客总时间成本为：

②计算公交运营利润

公交运营成本由车辆油耗费及乘务员工资构成，公交运营利润为票价收益与成本之差。

Cb为运营成本；Lr为运营利润；p为票价；L为运行一趟的里程数；m为发车次数；n为公交站点数；t为运行一趟的时间；pc为每公里行驶成本；pt为乘务员每小时工资。

为找到使乘客等车时间最少与公交运营利润最大的最优平衡点，将乘客等待时间转换为工资成本如公式(3)，此时乘客等待时间成本和公交运营利润为同一量纲，分别赋予不同的加权系数，则将双目标规划优化问题转变为单目标优化问题：

③目标函数的约束条件

i车辆平均满载率的约束

ii最大最小发车间隔的约束

iii相邻两车发车间隔时间在一定限度内

通过目标函数(6)来确定适应度函数，即：

Q为车容量；H（x）为适应度函数；y为单目标函数值；Cmin为一代群体中所有目标函数的最小值。

2.3 对未来某一天的高平峰时段划分预测

对于未来某一天公交线路上客流量的预测，采用BP神经网络预测模型，模型设计步骤见表3，BP神经网络是一种按照信号正向传播和误差逆向反馈的多层前馈神经网络，经过充分训练的神经网络可获取客流量样本特征，以对未学习的样本进行预测[12-14]。

表3 BP神经网络预测模型设计步骤

3 宁波市公交运营实例分析

3.1 数据分析

对选取的7条线路所有日期各时段的客流量进行高平峰划分，实验结果表明，公交线路上客流量极少出现剧增或骤减的情况，运营情况相对稳定，公交线路上客流量高平峰据不同的日期属性（工作日、周末、节假日）呈现出周期性和时序性。

周期性表现：不同工作日高峰期和平峰期时段相似；周末高峰期时段集中在下午1点到5点；不同节假日高峰期时段出现较早，客流量大且持续时间长。

时序性表现：不同工作日一天内高平峰时段交替出现，呈现出早高峰和晚高峰状态。

选取“1路”公交线路2017年10月11日星期三（工作日）、2017年10月14日星期六（周末）与2017年10月4日星期三（中秋节）不同日期属性各时段的上车客流量数据进行可视化来表明其周期性与时序性，如图2所示。

图2 “1路”公交不同日期属性下的客流量对比图

3.2 高平峰的时段划分

下面以宁波市“1路”公交2017年11月1日星期三（工作日）的数据为例进行模型验证，共计2 187条，公交运营时间从早上6点开始到晚上11点结束，将相邻两个整点划分为一个时段，共划分为1~17共17个时段，即时段数为n=17，建立费歇最优分割法模型，得到“1路”公交时段分类数与损失函数关系曲线见图3。

图3 2017年11月1日“1路”公交时段分类数与损失函数关系曲线图

当k≤5时增加一段分类数线段斜率绝对值较大，损失函数下降明显，当k＞5时增加一段分类数线段斜率绝对值较小，对损失函数值改善微弱且增加分类的复杂程度，因此将17个时段划为5个时区最优，总客流量2 187人，由(1)式设阈值129人/时，结果见表4。

表4 2017年11月1日“1路”公交高平峰划分结果

3.3 公交发车间隔规划

3.3.1 运用宁波市实际数据进行仿真模拟

取每月工作22天，每日工作8小时，设乘客平均工资为31.05元/时[15]；乘务员平均工资为41.94元/时[16]。据刷卡记录，刷普通卡票价为2元人数占75%，刷老年卡免费人数占18%，刷学生卡票价为0.60元人数占7%，平均票价约1.54元/人；公交乘客数日均约4 000人。至2018年，宁波市主城区标准运营车辆7 315.80辆，新能源纯电动公交车占比约21.25%，以波谷时段充电为主，谷电电价约0.29元/度，充电损耗5%~10%，实际续航约120千米，开空调续航约减少28%，即电费成本约0.64元/千米，普通柴油燃油成本约2元/千米，则一辆公交平均行驶成本约1.71元/千米。此条线路里程数约12.80千米，运行一趟约1.33小时。将上述数据代入(5)式得，发车次数最多为92次时，公交运营不亏损。

为确定最优发车次数，计算不同发车次数与乘客等待时间成本见公式(3)、公交运营成本见公式(4)、平均成本的关系曲线见图4，因发车次数只能取整，由此可知在保证公交运营不亏损的范围内随着发车次数的增加平均成本降低，因此取发车次数为92次。为提升公交运营服务水平，提高乘客等待时间成本权重，设(6)式加权系数α=0.70，β=0.30，经过大量试验，选定交叉概率0.70，变异概率0.10%，迭代次数2 000，建立遗传算法模型，经过迭代算法趋于稳定，规划结果见表5：

图4 发车次数与成本关系曲线图

表5 2017年11月1日“1路”公交发车间隔规划结果

此模型优化的各时段发车间隔结果比实际公交运营平均发车间隔缩短了5~15 min。

3.3.2 稳健性与灵敏度分析

对实际情况下可能出现较大波动的影响因素进行稳健性检验，因此对客流量、油耗费及乘务员工资进行稳健性检验，控制其他影响因素不变，分别将客流量、公交行驶成本及乘务员工资数据在合理范围内波动，模型仍能平稳运行，说明模型有较强的稳健性。

对于灵敏度，分别考虑速度、票价以及发车次数对模型的影响，控制其他变量，在合理范围内进行调节，比较适应度函数值及各时段发车间隔，得到公交调度模型对发车次数的灵敏性较高。

3.4 对未来一天的高平峰划分预测

将客流量对应日期属性特征进行独热编码处理作为输入变量，客流量为输出变量，在试凑范围内分别计算不同的隐藏层节点数下的平均判定系数见表6，当隐藏层节点数为6时，平均判定系数趋近于1，说明回归平方和在总误差平方和比例越大，模型拟合程度越好。

表6 不同隐藏层节点数下的平均判定系数

设定学习速率为0.01，最小均方误差为10-8，最大的训练次数为1 000次，运用2017年8月7日至2017年12月28日“1路”公交线路不同时段的上车客流量数据作为训练样本，对数据归一化处理后建立模型，来预测2017年12月29日“1路”公交不同时段的客流量，并计算各时段的实际客流量与预测客流量的差值以检验预测误差，结果见图5。