基于多元非线性回归算法的动车组变压器温度预测研究
2021-03-22闫优俊
闫优俊
(中国铁路呼和浩特局集团有限公司,内蒙古 包头 014000)
0 引言
为防止动车组运行故障和异常的发生,目前各动车组运营单位均采用以走行里程为主的计划预防修模式[1]。这种维修策略存在欠维修和过度维修的弊端,对运营维护的周期和成本没有进行科学合理地卡控[2]。
动车组各系统装配了大量传感器用于监测自身的运行状态[3],然而对动车组运行故障和异常的判断却仅依据海量车载数据中筛选出的超过标准的异常数据。先进的数据分析技术为动车组检修模式的转变提供了新的思路[4]。如传感器采集的车载数据隐含着动车组运行状态的动态信息,利用这些动态信息对动车组未来一段时间的运行状态进行预测分析,从而科学地安排检修维护周期,提升动车组安全保障能力,实现节支降耗、降低运营成本。
目前,中车长春轨道客车股份有限公司和中车青岛四方机车车辆股份有限公司等单位均已建立了数据分析平台,尝试利用动车组车载信息无线传输系统数据开展动车组部分部件的故障模型研究[5]。本文基于动车组远程数据传输系统(wireless transmission data system,WTDS)传输的车载变压器数据,使用多元非线性回归算法[6-9],建立动车组变压器温度预测模型,并以CRH5A型动车组变压器温度数据为例,验证了本文算法的准确性及实际应用效果。
1 变压器温度预测模型的建立
目前,各动车组运营单位均以变压器运行温度峰值作为评判变压器状态的重要参数,因此本文以变压器温度峰值作为预测的目标函数。由于变压器温度的影响因子有多个,因此选择能够表征多参数关系的多元回归算法。
采集n组变压器温度数据(将每日的变压器温度数据作为一组),其中每组温度数据含有m个温度数值;变压器温度峰值所对应的影响因子为k个,且每日变压器温度数据所对应当日影响因子的数据记为xi,j(i=1, 2, …,k;j=1, 2, …,n)。
考虑到变压器温度传感器或者网络故障引起的变压器温度突变会对目标函数的拟合结果造成精度缺失,在预测模型建立前需对车载数据进行数据清洗[10],即对于传输的m个运行温度数据T,设定筛选变量ε。
数据筛选完成后,对于变压器温度峰值数据yj及变压器温度峰值yj-1对应的k个影响因子的数据xi,j-1构建多元非线性回归方程:
式中:βt——变压器温度峰值各影响因子的回归系数,x=1, 2, …, 2k+1;μj——随机扰动项;xi,0——初始迭代值。
对于动车组变压器影响因子的选择,大多数学者认为变压器运行时的内部温升主要由动车组输入功率决定,其产生的热量通过绝缘油及散热器以传导、对流及辐射的方式扩散到环境中[11],因此将负载电流和环境温度作为变压器温度预测的影响因子。这种预测模型过于理想化,其将外界对变压器的干扰基本排除;然而在运行实际中,外界因素对变压器温度的影响很大,动车组在不同季节、不同运行线路、不同的检修条件下所表现出的温度峰值明显不同。运行中变压器温度的峰值变化是一个连续的、相互影响的过程,可以由前日变压器的运行状态并结合当日的运行实际情况对当日变压器的温度峰值进行表征,因此本文将变压器检修项目信息、运行线路状况、行车信息、外界温度、天气状况及前一天变压器运行状态作为变压器温度峰值预测的影响因子。
为保证拟合的回归方程可以有良好的精度,根据残差的平方和最小原则[12-13],有
式中:ej——回归方程的残差。
为防止yj中的离群值xout(对应的残差具有较大的方差值)降低预测精度[14],需对xout进行剔除处理,使用奈尔检验法检验离群值,则有
式中:μ——yj的平均值;σ——yj的标准差;Rn——离群值判定标准值。
由式(2)~式(4)得到βt和μj,则预测值yn+1可以表达为
2 变压器温度峰值预测结果及应用
选取4组CRH5A型动车组,分别标记为Model1,Model2, Model3和Model4,对其变压器进行长期跟踪,运用变压器温度预测模型对各变压器的状态参数进行预测分析。
2.1 预测实验结果
如图1所示,设定7月2日的变压器温度峰值预测值为初始迭代值(初始迭代值设为0 ℃);将7月2日至8月1日之间的变压器温度峰值作为训练集,建立迭代模型,设定筛选变量对4组动车组变压器实际温度峰值进行数据清洗,清洗后的变压器实际温度峰值与预测值如图1所示。
图1 4组动车组变压器温度预测结果Fig.1 The predict result of transformer temperature of four-group EMUs
由图1预测结果可知,7月2日至7月20日的变压器温度峰值预测结果均与实际值有较大的偏差;但在经过一段时间的训练后,其预测值逐渐向真实值逼近。在初始训练阶段(n 表1 动车组变压器温度峰值预测结果Tab.1 The predict result of transformer peak temperature of EMUs 目前,各动车组运营单位对变压器超温预警的处理办法是以定期清洗变压器滤网为主[12-13]。由于动车组自身状况各不相同,运行交路和外界环境变化不定,统一动车组清洗周期往往会导致清洗周期与实际需求不匹配,发生过度清洗或在清洗周期内变压超温报警,增加了运营成本,同时还无法切实保证行车过程的万无一失。本文针对所跟踪的4组CRH5A型动车组,通过变压器温度峰值预测模型,对变压器实际清洗计划进行了动态调整。在使用变压器温度峰值预测模型之前,所观测的4组动车组清洗周期均固定为15天,时常存在清洗周期内超温报警或者在远未达到清洗温度时进行了清洗的情况。使用变压器温度峰值预测模型之后,Model1和Model3的变压器平均清洗周期延长至17天,Model2的变压器平均清洗周期保持15天不变,Model4的变压器平均清洗周期延长至19天。 本文针对目前动车组运用维修中存在的计划预防修的弊病,以动车组车载数据为基准,采用多元非线性回归算法建立了一种变压器温度峰值预测模型,得出的主要结论如下: (1)通过所建立的变压器温度峰值预测模型对采集数据的异常值进行了数据清洗,并以变压器检修项目信息、运行线路状况、行车信息、外界温度、天气状况及前一天变压器运行状态作为变压器温度峰值预测的影响因子,改进后的预测结果更贴合动车组运行实际情况,具有实际应用价值。 (2)以CRH5A型动车组为例进行实车跟踪,经过数据培养和积累,对动车组变压器温度峰值预测结果的精度可达到95.3%,且随着数据的不断增多,该预测精度仍有一定的上升空间。 (3)根据实验结果,对所跟踪预测的CRH5A型动车组进行变压器平均清洗周期调整,结果表明该变压器温度峰值预测模型具有实际应用价值,可以对动车组的运营维护提供合理科学的指导意见。 虽然本文所建立的动车组变压器温度预测模型的预测精度已足以满足生产实际需求,但仍有进一步提升的空间。如可通过在预测模型中加入更多的影响因子,使计算精度进一步提升。2.2 预测数据的应用
3 结语