基于随机森林的动车组轴温故障识别
2018-06-20张士存张杜玮顾佳
张士存 张杜玮 顾佳
摘 要:随着高铁的高速发展,动车组运行安全面临越来越大的挑战,作为动车组重要组成部分的转向架受到的关注日益增加。本文利用随机森林算法根据动车组轴箱的温度识别轴箱是否故障,及时提醒动车组司机和随车机械师确认并进行降速等处置措施,保障列车运行安全。
关键词:动车组;轴箱温度;随机森林;故障识别
中图分类号:TP333.35 文献标识码:A 文章编号:1671-2064(2018)08-0050-02
近些年,我国的高铁事业得到迅猛发展,技术越来越成熟,速度越来越快,特别是我国自主设计研发的‘复兴号动车组更是以350km/h速度试运营,如何保障列车安全运行成为极其重要的挑战。动车组转向架在列车运行过程中起承载、转向、缓冲、牵引、制动等作用,它的各种参数直接决定了列车的稳定性和舒适性[1]。而高速列车轴箱轴承是高铁转向架的关键部件,其性能好坏直接影响列车的安全行驶,经过以往研究发现轴箱发生故障后直接表现是其温度异常变化,通过实时监测温度的异常温升等变化情况,可以对列车轴箱故障进行预警,保障列车运行安全[2]。
1 随机森林简述
随机森林算法是机器学习中最具有广泛影响力的算法之一,它不仅应用于分类还能进行回归预测,也可以用来聚类,它适合多个特征变量,且变量之间可以是多重共线性的,不会出现过拟合,适合大样本数据训练,可以并行执行,比神经网络时间复杂度小。
优点:(1)在数据集上表现良好,随机森林不容易陷入过拟合;(2)随机森林具有很好的抗噪声能力;(3)它能够处理很高维度的数据,并且不用做特征选择,既能处理离散型数据,也能处理连续型数据;(4)训练速度快,可以得到变量重要性排序;(5)可以并行计算;(6)实现比较简单。
2 动车组轴箱故障预警模型
动车组列车中,转向架是重要组成部分之一,轴箱是转向架的关键部位,本文的目的是通过列车基本数据和轴箱温度数据对列车运行过程中轴箱故障进行识别和报警。
2.1 建模思路
列车原始数据中,没有真正发生故障的数据,在只有正常样本的情况下,只能对列车在正常运行时的轴温建模,得出轴温的模型值,当轴温实际温度与模型温度值差异大时认为轴温所在轴可能出现异常,进一步检测后续轴温状况,差异值继续增大,可认定轴温异常所在轴发生故障。建模思路如图1所示。
(1)将所得数据提取特征,进行建模,利用回归模型回归一条标准曲线得出列车在正常时的模型。(2)根据模型误差,确定上下容忍边界,在实际温度在边界内的认为是正常值,否则为异常值。(3)确定预警值,监测到异常点温度连续超过标准曲线累计达到某一值,认为预警值。
2.2 实例建模
2.2.1 样本说明
抽样选择某车型某段时间的全量数据,数据包间隔30秒,样本数共428732例,模型交叉验证训练集和测试集按照0.7比例划分。验证样本数据:选择某车(车内预警)样本,样本数共3658例。
2.2.2 数据预处理
(1)数据清洗。剔除掉样本数据中重复数据和无效数据。(2)数据标准化。样本各指标的单位不同,为消除量纲影响,对数据进行标准化,所采用方法为最小—最大规范化:
其中νi代表标准化后的新数据,max和min分别代表原始指标数据中的最大值和最小值,νi表示原始指标数据。
2.2.3 建模结果
(1)回归模型。评价回归模型的指标主要有R2,RMSE(均方根误差),R2代表模型拟合的好坏,越接近1,表示模型拟合越好;RMSE(均方根误差),代表真实值与预测值之间的误差,RMSE越小,表示真实值与预测值差距越小,预测效果越准确。随机森林回归结果R2=0.92,RMSE=6.235。在采用随机森林回归建立列车运行正常的轴温模型建立之后,真实值与模型值差的绝对值的最大值为阈值,因此,模型的容忍边界设定为[-8,8]。落在上边界外认为异常,在测试样本中,回归模型识别的异常点如图2所示:异常温度值发生部位为8位轴端,共288个,显而易见尖峰点为传感器误报,其余发生在后半段,异常轴温与回归模型差距逐步拉大,需要选择过滤规则。(2)过滤模型。过滤模型规则:温升:轴温上升趋势越高,差值越大,发生故障风险越大,10min不间断温升大于7。轴端温升:轴端相对外温温升大于78(根据附录数据探索得出),排除外温影响。过滤后的异常数据如表1所示:过滤后的数据比车上预警时间提前了5分钟,但是预警点多了6个。
3 结语
预警的控制策略是轴端温度大于阈值,本文认为只靠轴温值大于阈值来判定预警是不合理的,本模型认为预警需要綜合考虑。在本文中通过随机森林回归拟合轴温,找出异常温度值后结合外温、不间断温升来定故障点是可行的,在后续数据本身质量和模型仍需近一步优化。
参考文献
[1]尹怀仙,王凯,张铁柱,等.基于PSO-BP神经网络的城轨列车转向架轮对轴箱故障预测[J].复杂系统与复杂性科学,2015,(4):97-103.
[2]汤武初,王敏杰,陈光东,等.高速列车故障轴箱轴承的温度分布研究[J].铁道学报,2016,(7):50-56.