APP下载

基于集成学习的列车轮径预测方法

2021-03-18樊泽园宋晓娟林立李雪

运输经理世界 2021年4期
关键词:个数列车误差

樊泽园、宋晓娟、林立、李雪

(1.山东交通学院,山东 济南250307;2.轨道交通安全技术与装备实验室,山东 济南250307)

0 引言

当前中国列控车载系统普遍运用速度传感器进行测速定位,其计算精度直接受到轮径值变化的影响,若不及时更新系统存储的轮径值则会增大测速定位误差,影响行车安全。

铁路行业内关于列车轮径校准的研究,有基于多传感器融合实现轮径校准[1,2]。文献[3]则提出基于灰色算法进行轮径值的预测。BP神经网络是目前应用最广泛的基本神经网络,有较强的非线性映射能力及预测精度,可根据历史数据自动提取有用知识。而神经网络集成的提出则能解决BP存在收敛速度较慢、泛化能力较差、极易获得局部极小点问题。

1 速度传感器工作原理分析

速度传感器通过脉冲计数获得测量周期内的车轮转数并乘以轮周长来计算列车行驶速度,其具体公式如下:

式(1)中:n为本次测量周期的脉冲计数值;T为本次测速周期;d为车轮直径;N为车轮旋转一圈传感器发出的脉冲测量值。

在式(1)中,轮径值d是影响其计算精度的关键参量。d随着列车行驶距离的增加变小,所以必须及时更新系统存储的车轮轮径值,降低测速测距误差。

本文针对铁路局存储的列车走行公里报表,引入智能算法提取有用数据进行分析建模,寻找列车轮径值y和列车行驶距离x之间的对应关系,即

在学习阶段,通过训练生成映射关系f,在预测阶段根据新输入的列车行驶里程来求得当前的列车轮径值,实现智能预测。

2 Bagging集成BP网络的预测方法

集成学习用于提高机器学习泛化能力,Bagging算法是其典型算法,并衍生成多个BP子网络,其核心思想是:给定1个训练集和1个学习算法,对训练集进行T次重采样,每次采样从训练集中取m(m<n)个样本进行训练,训练结束后将取样放回到训练集,经过训练后得到多个训练预测函数f1,f2…fT。最终的集成学习器预测函数f是经过加权平均合成的,并对新的输入数据进行预测。算法的具体步骤如下。

第一步,数据预处理:原始样本数据集O={(x1,y1),(x2,y2)…(xn,yn)},采用极差标准化法对样本归一化处理,如公式(3),使输入数据值在[0,1]范围内。

式(3)中:xi0为归一化后的第i个输入值;xi为第i个原始输入值;xmax为原始输入最大值;xmin为原始输入最小值。然后对数据集重采样T次,生成不同的训练子集。

1.2.1 标本采集 该孕妇接受检测前的遗传咨询并签署同意书,根据孕周行羊膜腔穿刺,在B 超探头引导下行羊膜腔穿刺术抽取羊水30ml进行培养以及染色体微阵列分析(chromosomal microarray analysis, CMA)。

第二步,根据不同的训练子集,并行训练不同的BP子网络,经过训练学习后能够得到不同的预测函数ft。

第三步,最终将各个子学习模型的预测函数进行加权平均获得集成学习器的预测函数

式(4)中:ωt为第t个预测函数在集成中所占的权重。权重值ωt大小则根据子网络的泛化能力决定,利用未抽到的样本集计算子网络的相关系数R,R越大,ωt就越 大,且=1。

第四步,通过学习得到映射关系f(x),就可以输入新的列车行驶里程xnew,从而预测当前位置对应的列车轮径值ynew。

3 BP子网络的设计

针对本文研究对象,设计BP子网络为一个单输入单输出的三层神经网络,其输入层是列车行驶里程x,网络输出为列车轮径值y,隐含层选取Sigmoid函数,输出层为线性激活函数,w=(w1,w2…wj)是输入层到隐含层的权值向量,v=(v1,v2…vj)是隐含层到输出层的权值向量。

那么本文将最优化误差平方和作为误差准则,即

式(5)~式(6)中:N为样本个数,εi为误差绝对值,y′i为第i个实际输出,yi为第i个理想输出。

选用均方根误差(RMSE)作为评价指标,其公式如下列式(7)所示。

用相关系数R来评价子网络的泛化能力,并确定集成学习中各个子网络的权值ωt的大小,则第t个子网络的相关系数为:

本文分别采用自适应学习率的梯度下降法、BFGS拟牛顿Levenberg-Marquardt算法、弹性梯度下降法进行训练学习,隐含层神经元的个数由经验公式进行确定,即

式(8)中:a,b分别为输入层和输出层单元个数,α∈(1,10),故子网络隐含层的神经元个数可取范围为[2,10]。

4 实验仿真

本文以上海铁路局提供的CRH2型动车组的列车车轮尺寸相关数据为基础,研究行车里程与轮径值动态变化的映射关系,其标准直径为mm,随着列车的运行轮径值会单调变小。对于原始数据集D,共有152组相关数据,其部分数据如表1所示。

表1 车轮相关数据(部分)

随机选取112组数据作为原始训练集O,剩余作为测试集来验证算法的泛化能力。并在Matlab环境下进行算法编程与仿真验证,对训练集O进行6次重采样生成不同的子训练集Ot,从而训练生成6个不同的BP子网络。利用函数newff来创建BP子网络,隐层采用tansig函数,输出层采用purelin函数,随机产生网络的权值、阈值,目标误差设为10-5,最大迭代次数设为500。对于隐层神经元个数,通过比较不同神经元个数下的子网络收敛误差来确定最佳神经元个数,以BP子网络1为例进行说明,其训练函数设为trainlm,其最佳神经元个数是8。对不同的BP子网络,采用不同训练算法。最后用本文的Bagging集成BP网络算法进行网络集成,并将其预测效果同单个BP网络的预测效果、灰色预测法进行对比分析。

在图1中将灰色预测法、Bagging集成BP子网络的强预测器的测试集预测误差绝对值同6个BP子网络的预测误差绝对值的平均值进行比较,从中看出本文算法的预测误差绝对值明显比另外两种算法要小,且误差波动范围小,说明本文算法的预测精度较高,验证了本文算法的有效性,其预测结果接近列车轮径的真实值。

根据铁路局车务段存储的列车轮径值相关记录数据,提出运用Bagging算法集成BP网络的智能算法实现列车轮径值的预测更新。实验证明运用Bagging算法集成学习可以提高集成学习器的泛化能力,避免神经网络普遍存在的过拟合现象,并获得比灰色预测、单一BP神经网络更好的预测效果;能够较好地根据行车里程对列车轮径值的进行预测,从而在列车行驶过程中进行预测,自动更新车载系统的轮径存储值,提高速度传感器的计算精度,减少人为工作量,并保证行车安全。

5 结语

猜你喜欢

个数列车误差
城际列车
怎样数出小正方体的个数
登上末日列车
关爱向列车下延伸
怎样数出小木块的个数
穿越时空的列车
最强大脑
怎样数出小正方体的个数
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用