APP下载

基于梯度提升决策树的城市轨道交通网络运营态势综合评估方法*

2022-08-23段力伟冉松民陈瑞雪邝雅静董少帅欧光继

城市轨道交通研究 2022年8期
关键词:全网城轨决策树

段力伟 冉松民 陈瑞雪 邝雅静 董少帅 欧光继

(1.重庆交通大学交通运输学院, 400074, 重庆; 2.重庆交通大学信息科学与工程学院, 400074, 重庆∥第一作者, 副教授)

城市轨道交通(以下简为“城轨”)网络运营态势是对城轨网络的客流规模、运行效率、运营安全以及工作负荷的综合反映。城轨网络运营态势评估即通过分析影响城轨运行的各项因素得到城轨网络化运营管理与服务的水平,进而判断城轨网络是否处于安全稳定的运营状态。

目前,已有对城轨大客流预警需求的研究和分析[1],通过确立预警指标和阈值进行城轨运营安全评估[2],采用云模型对预警指标进行融合来确定预警阈值[3],以及通过图像识别[4]、支持向量机[5-6]及时间序列分析法[7]等技术或方法对可能带来安全隐患的短时大客流进行预警。而这些文献多为对客流预测的分析和预警方法的研究,仍缺少对城轨运营网络运营态势整体的综合评估分析,存在评估指标体系建设不够全面等问题。在已有研究的基础上,本文通过分析城轨网络运营态势的影响因素,确立多维度评估指标体系,划分了4个预警等级,综合使用梯度提升决策树算法对城轨运营网络进行运营态势等级评估。

1 指标体系和预警等级的建立

1.1 运营态势评估指标体系

按全面性、科学性、实用性的选取原则,城轨网络运营态势预警指标体系包含客流、效率、安全及工作负荷等4个一级指标,以及20个二级指标。

1.1.1 客流指标

客流指标主要涵盖影响运营态势的客流规模因素指标,以及由此导致的线网及站点的客流风险指标。

客流指标包含4个二级指标:全网客流总量Q1,即从全网各车站乘坐城轨到达目的地的客流总量;全网换乘客流总量Q2,即全网所有换乘站内进行换乘的客流总量;线路客流量不均衡系数K1;站点进站负荷系数K2。

其中:

(1)

式中:

n——全网线路总数;

qi——第i条线路在统计时间和统计范围内的客流量,i=1,2,…,n。

(2)

式中:

u——全网车站总数;

qj——统计时间内第j个车站的进站客流量,j=1,2,…,u。

1.1.2 效率指标

效率指标主要反映城轨网络运行效率,其包含4个二级指标:列车正点率Z,列车停站时间不均衡系数K3,一次滞留乘客数Q3,AFC(自动售检票)系统的故障设备数T1。

其中:

(3)

式中:

m——统计时间内,全网实际开行的列车数;

mf——始发晚点列车数;

md——到达晚点列车数。

(4)

式中:

tj,停——列车在第j个车站的停站时间。

1.1.3 安全指标

安全指标主要为影响列车运行安全和乘客乘车安全的各项因素指标。

安全指标包括9个二级指标:列车临时停车总次数E1,列车发生故障的总次数E2,全网信号设备发生故障的总次数E3,全网自动扶梯发生故障的总次数E4,全网供电系统发生故障总次数E5,全网屏蔽门发生故障总次数E6,网络中突然发生重大安全事故的总次数E7,人员纠纷等不安全事件发生总次数E8,安检发现危险物品的总检出次数E9。

1.1.4 员工工作负荷指标

员工工作负荷指标为主要考虑影响列车运行安全关键岗位人员的工作时长因素指标。

员工工作负荷指标包含3个二级指标:在统计时间内列车驾驶员平均工作时长ta,驾驶员工作时长最大值tm,行车调度员在统计时间内的平均工作时间占有率th。

其中:

(5)

式中:

tz——第z个驾驶员当日的工作时长;

N——全网列车驾驶员人数。

(6)

式中:

tp——行调员在统计时间内的平均工作时长;

tj——统计时间。

1.2 预警等级划分

根据运营态势评估指标体系及《城轨运营期间安全评估规范》,将城轨网络运营态势预警等级划分为四级,如表1所示。

表1 城轨网络运营态势预警等级

2 运营态势综合评估模型的构建

2.1 梯度提升决策树的原理

GBDT(梯度提升决策树)算法由Jerome Friedma于1999年提出[8],其在训练过程中确定一系列合适的决策树作为弱学习器,并将弱学习器线性组合成为强学习器后对测试样本进行判断。

对于训练集M={(x1,y1),(x2,y2),…,(xN,yN)},GBDT算法的具体模型表示形式为:

(7)

式中:

FS(x)——预测函数;

x——训练集数据;

T(x;Φs)——第s个决策树变量;

Φs——第s个决策树参数;

S——决策树个数。

模型的迭代步骤如下:

步骤1:确定初始的提升树为F0(x)=0。

步骤2:采用向前分布算法,第v步的算法模型为:

Fv(x)=Fv-1(x)+T(x;Φv)

(8)

式中:

Fv-1(x)——v-1步的预测函数模型。

步骤3:通过要求得到的预测值F(x)使得损失函数L最小,来确定第v个决策树参数Φv,即:

(9)

式(9)中,L为平方误差损失函数,即:

(10)

通过不断迭代,使得最后得到的输出结果不断逼近训练值。

2.2 基于GBDT算法的城轨运营态势评估

本文以训练集中的4个预警等级、2个样本特征指标(Q1及E1)为例,叙述GBDT算法模型通过拟合残差进行学习的过程。

城轨网络运营态势评估模型首先通过训练集M={(x1,y1),(x2,y2),…,(xN,yN)}找到目标函数。其中,x为特征指标值,xi∈X⊆Rn;y为预警等级对应值,yi∈Y={1,2,3,4}。随后,使得x映射到y的损失函数L最小,来确定决策树参数,得到下一棵决策树;最后,将所有决策树节点值进行累加,得到输出的评估结果。以Q1、E1指标为例,根据初始数据生成决策树1,树的每一个节点相应有一个输出值;然后,根据树1的残差生成决策树2,当决策树节点值为0时,结束迭代。将对应决策树节点值进行累加得到模型预测结果。过程见图1,如预警等级Ⅰ的评估值y=树1左节点+树2左节点=1。

图1 GBDT算法通过拟合残差的迭代过程

3 案例验证

根据城轨网络运营态势评估指标体系,本文以重庆轨道交通客流量综合分析平台的数据为基础,对评估模型进行验证。

选取全网客流总量Q1、屏蔽门故障次数E6、列车停站不均衡系数K1以及行调员平均工作负荷占有率th作为典型评估指标,绘制预警等级评估结果与典型评估指标的时间曲线如图2所示。

图2 预警等级评估值与典型评估指标的时间曲线

图2可反映重庆城轨网络当日的运行态势。在运营初期(06∶30—07∶15),城轨网络客流基本保持平稳,预警评估等级维持在Ⅰ级。在07∶15,发生屏蔽门设备故障,且客流量呈现递增趋势,预警等级评估模型的评估等级变为Ⅱ级。预警等级评估提升的原因并不是客流量的大幅上升,而是运营过程中出现的设备故障。如果关键设备发生故障,则会导致客流流速减缓,并带来大量乘客滞留的风险。07∶25屏蔽门故障设备被修复,但由于城轨网络运营时间临近早高峰,客流量持续上升,预警等级评估结果维持为Ⅱ级,城轨网络出现客流短时间聚集等状况,有运营风险加剧的趋势。

城轨网络运营态势的预警等级在多维评估指标的影响下是变化的。客流规模(Q1、Q2、K1、K2)并非是判断运营态势的唯一因素,城轨网络运行效率(Z、K3、Q3、T1)、安全状态(E1~E9)及员工工作负荷(ta、tm、th)都是影响城轨网络运营态势的必要因素。

4 结语

及时掌握城轨网络运营态势,进行多维度的综合评估与预警,是保障城轨网络运营安全、提高运营效率的有力保障。本文通过分析城轨网络运营态势的影响因素,提出了预警评估指标体系,基于梯度提升决策树算法建立城轨网络运营态势评估模型,并以重庆轨道交通网络为实例,进行了预警等级评估验证。验证结果表明:运营态势评估结果能基本反映城轨网络运营现状及发展趋势;模型具有可行性;进行城轨网络运营态势评估有助于保障城市轨道交通网络的运营安全,提高运营效率。

猜你喜欢

全网城轨决策树
基于决策树和神经网络的高血压病危险因素研究
《唐宫夜宴》火遍全网的背后
城轨CBTC系统改进方案的分析探讨
双十一带货6500万,他凭什么?——靠一句“把价格打下来”,牛肉哥火遍全网
城轨车辆基地行车进路自动控制系统的研制
决策树和随机森林方法在管理决策中的应用
电力系统全网一体化暂态仿真接口技术
决策树多元分类模型预测森林植被覆盖
基于可靠性的城轨车辆维修模式及应用
两新党建新媒体用户与全网新媒体用户之间有何差别