基于动车组3C装置的接触网缺陷诊断及分析方法研究
2021-03-01王斌杨志鹏张文轩王婧汪海瑛
王斌,杨志鹏,张文轩,王婧,汪海瑛
(中国铁道科学研究院集团有限公司 基础设施检测研究所,北京 100081)
0 引言
接触网作为高速铁路牵引供电系统的主要组成部分,是列车高速、平稳运行的重要保障[1]。接触网系统无备用、零部件众多、机械结构复杂,在自然条件的影响和列车荷载作用下,其状态会不断发生变化[2]。为确保动车组运营秩序,提升系统安全性和可靠性,需借助检测监测设备对接触网设备状态进行监控,通过缺陷诊断及分析,及时挖掘有用信息,为运营维护、设备管理和设计施工提供数据支持。
车载接触网运行状态检测装置(3C)安装在运营动车组车顶。依据TG/GD 124—2015《高速铁路接触网运行维修规则》规定,3C装置实现对接触网温度、动态几何参数和弓网受流状态的全天候等速检测。动车组3C装置自2016年投入使用以来,在全路范围内积累了海量检测数据,但由于缺乏系统、有效的分析策略,数据挖掘不充分,忽略了大量有益于设备运维的科学信息。根据目前修程修制改革的目标,需强化数据分析过程,提高分析精准性,最终实现预防性状态维修[3-5]。因此,有必要研究基于动车组3C装置的接触网缺陷诊断及分析方法,充分发挥检测分析价值,为全面、准确、及时、高效地管理接触网设备状态提供支持。
1 3C装置检测原理
3C装置通过红外热成像技术对接触网、受电弓及弓网运行状态进行监测,对核心区域进行重点监控,实时分析温度变化,结合可见光成像数据,基于图像识别算法实现设备状态辨识和动态参数测量,结合GPS、惯性导航技术及线路台账数据,实现车载系统的走行定位和线路区站、公里标等辅助定位,最终通过无线通信技术将检测数据传输到地面服务器[6]。
3C装置检测项目多、缺陷类型繁杂,为便于统计分析,依据缺陷发生位置将缺陷划分为弓网受流缺陷、接触网几何参数缺陷、接触网零部件缺陷和受电弓零部件缺陷4类(见表1)。
表1 3C装置检出缺陷分类
2 接触网缺陷诊断及分析方法
对动车组3C装置获得的燃弧、温度、几何参数等检测数据,依据TG/GD 124—2015《高速铁路接触网运行维修规则》规定的设备运行状态标准值、警示值和限界值进行界定,形成缺陷数据。接触网缺陷诊断及分析以缺陷数据为基础,根据研究对象和应用场景差异,采用诊断、统计、回归、聚类等大数据方法,对接触网设备局部缺陷和当前状态进行诊断,对接触网缺陷分布特征和演变规律进行分析,并从受电弓型号差异、接触网结构差异和列车运行速度等方面对弓网匹配关系进行研究。接触网缺陷诊断及分析总体技术路线见图1。
图1 接触网缺陷诊断及分析总体技术路线
2.1 诊断方法
列车高速运行中,检测设备受阳光、雨雪、强光源等因素干扰,导致检测数据在局部位置可能出现异常值,诊断方法通过对检测数据进行分析,剔除异常值引起的缺陷误报。诊断方法是数据挖掘领域的一项重要技术,其目标是发现数据集中行为异常的少量数据对象。
接触网检测数据中的异常值确认需融合离群点诊断算法和接触网专业知识。以接触线动态高度检测数据为例,依据《车载接触网运行状态检测装置(3C)暂行技术条件》,接触网几何参数采样间隔不高于1 m,依据TG/GD 124—2015《高速铁路接触网运行维修规则》,两相邻吊弦点接触线高差限界值为15 mm,吊弦间距一般为7~9 m[7],考虑动态接触线抬升量最大取150 mm,为便于估算,取裕度为35 mm,则相邻采样点间的接触线高度变化不高于20 mm。设接触线高度在某采样邻域内的检测数据为H={hi|i=1,2,…,n},若hx∈H属于异常值,则基于k-最近邻算法的接触线高度检测数据离群点诊断规则如下:
式中:N(hx,k)为不包含hx的k-最近邻;d(hx,hi)为hx和hi之间的距离;|N(hx,k)|为N(hx,k)的集合大小;δ为判别阈值,取20 mm。
2.2 统计方法
弓网匹配关系复杂,影响受流质量因素众多,除接触网设备和参数状态等主要因素外,还与列车运行速度、气候环境和地形条件等多种外部因素有关,仅通过单次检出的弓网缺陷(如燃弧)无法准确判断接触网参数或设备状态。因此,在有限维修资源下,应基于历史检测数据进行统计分析,并根据分析结果确定是否有必要实施现场复核和维修。
此外,评价特殊处所或整条线路的接触网设备状态时,应基于历史检测数据,通过统计分析方法充分了解接触网缺陷的位置和类型分布特征,确定动态运行质量薄弱设备、区段和主要缺陷类型,为集中整治提供数据支持和维修建议。
统计方法以历史检测缺陷数据为样本,对描述设备状态和接触网动态性能的检测参数和缺陷信息进行统计分析,主要包括检出频次分析、集中趋势分析、离散程度分析和经验分布拟合等。
检出频次分析通过对一段时期内同一区段中检出缺陷的频次进行统计,用于识别线路中接触网缺陷频发区段,并判断单次检出的缺陷是否值得耗费维修资源。设p1,p2,…,pm为线路检出的m个缺陷处的里程,将线路等分为n个统计区间l1,l2,…,ln,则第i个统计区间中的缺陷个数如下:
式中:card为集合的元素个数。
针对特定接触网缺陷类型,集中趋势和离散程度分析分别基于大量历史检测数据反映超限参数的整体水平和差异程度,经验分布拟合则通过核估计方法给出超限参数的分布函数。集中趋势分析的常用统计量包括平均值、中位数、众数,离散趋势分析的常用统计量包括方差和标准差,经验分布拟合通常采用核密度法对概率密度函数进行估计。设X1,X2,…,Xn为超限参数的多次检测数据,在任意点x处的密度函数f(x)的核密度估计为:
式中:K为核密度函数;h为窗宽。
为了确保f̂(x)的合理性,要求核密度函数K满足如下条件,即要求核密度函数K(x)是某个分布的密度函数:
2.3 回归方法
接触网设备多种类型的故障和事故均由微小病害逐渐演变而成,如吊弦断裂、线夹脱落、线索断线等,针对该类病害,有必要通过回归方法研究其劣化发展规律。3C装置安装在运营动车组上实现等速实时检测,列车运行速度数据丰富,包括从动车组出站提速到高速运行,再到进站减速等各种速度条件,因此,可通过回归算法研究速度与接触网缺陷的关系,探索缺陷的发生机理,完善标准体系建设。另外,针对特殊处所或线路特定缺陷类型,可通过回归方法预测在当前维修条件下接触网设备质量发展趋势,为优化接触网大修时间节点提供参考。
回归方法是数据挖掘中应用领域和应用场景最多的方法之一,最常用的回归方法为一元回归方法,包括线性和非线性回归。以估计速度v和缺陷值f的函数关系为例,设v和f的检测数据为(vi,fi),设随机误差为εi,i=1,2,…,n,则一元线性回归模型为:
式中:β0和β1分别为未知参数,通常采用最小二乘法由数据(vi,fi)获得β0和β1的估计β̂0、β̂1。
则速度v和缺陷值f的经验回归函数如下:
对于一元非线性回归,通过描出数据的散点图,判断2个变量之间可能存在的函数关系,然后采用数学变化将其“线性化”或借助一些基本非线性函数进行拟合,常用的非线性函数有幂函数、指数函数、对数函数等[8]。
2.4 聚类方法
不同气候环境下的弓网关系研究是对弓网关系理论的拓展,从京哈高铁的高寒到兰新高铁的大风,再到海南环岛高铁的沿海等各种气候环境,各种场景下均有3C检测数据,以此为基础,通过聚类方法进行不同气候环境下的弓网关系差异研究完全具备可行性。
我国动车组装配的受电弓型号多样,不同型号受电弓因其机械结构、控制策略等存在差异,导致在相同线路条件下运行的弓网受流性能也不完全一致,动车组3C装置能采集到大量等速检测数据,可借助聚类方法将其用于研究不同型号受电弓的动态性能差异。
为满足山区、沿海、高原、大风、高寒等各种复杂地质条件和气候环境下的不同运营需求,我国接触网进行了适应性选型,接触网结构繁杂[9],在相同受电弓运行条件下,不同速度等级、设计高度、悬挂类型接触网的弓网受流性能差异显著,通过聚类方法可对此进行研究。
聚类是将数据集合分成由类似对象组成的多个类或簇,k-均值聚类是应用最广泛的聚类方法之一。k-均值聚类的工作原理为随机选取数据集合中的k个点作为初始聚类中心,然后计算剩余各样本到聚类中心的距离,将它赋给最近的类,并重新计算每一类的平均值,整个过程不断重复,如果相邻2次赋值没有明显变化,则说明划分的类已收敛。k-均值聚类采用距离作为相似性的评价指标,即认为2个对象的距离越近,其相似度就越大,常用的距离有绝对值距离、欧氏距离、切比雪夫距离等[10]。
3 实践案例
3.1 诊断方法
动车组3C装置的接触网动态几何参数检测基于图像识别技术,在强光、雨雪等外部环境欠佳时可能会出现异常检测数据。
采用k-最近邻算法对某高速铁路2021年1—5月间动车组3C装置检测的接触线高度和拉出值检测数据进行离群点诊断。由于动态几何参数与列车运行速度有关,因此,需对速度、拉出值、接触线高度组成的三维数据进行离群点诊断。
对速度、拉出值和接触线高度检测数据采用z-score算法进行归一化,采用欧式距离作为度量计算离群因子,k分别取值为2、3、4、5时,离群因子计算结果(前100位)见图2。
图2 离群因子计算结果(前100位)
由图2可知,k值取3、4、5时,离群因子的衰减速度基本一致,且衰减速度的拐点均为7,因此,取k值为5,并将离群因子排序前7个点选为离群点,离群点诊断结果见图3。
图3 离群点诊断结果
离群因子最大值处的检测速度为123 km/h,接触线高度检测为5 479 mm,远高于该高速铁路接触网的高度设计值5 300 mm,属于异常值,该处3C装置拍摄的可见光图像见图4,可以看出,图像上存在的黑色斑点(雨水)可能对图像识别算法造成了影响,导致检测数据出现异常。
图4 接触线高度异常值处的可见光图像
3.2 统计方法
3.2.1 局部缺陷频次统计
2021年4月,3C装置在某高速铁路上行K499.805处检出接触线硬弯局部缺陷。为了确认是否有必要对检出缺陷实施现场复核调整,将线路长度按50 m进行等长区间划分,统计各区间2019年1月—2021年4月间检出的接触线硬弯缺陷频数(见图5)。可见,K499.805所属区间K499.785—K499.835中检出频数最多,达到36次。
图5 某高速铁路上行接触线硬弯缺陷频数统计
查看该高速铁路近期的高速弓网综合检测装置(1C)检测数据(见图6),该位置检出的硬点显著大于附近其他位置,且存在持续时间较长的燃弧缺陷。
图6 某高速铁路的1C检测数据
综上分析可知,该高速铁路上行K499.805处的接触线硬弯缺陷存在,且在较长周期内频繁检出,可安排现场复核调整。
3.2.2 检测参数分布统计
TG/GD 124—2015《高速铁路接触网运行维修规则》中规定分段绝缘器应位于受电弓中心,一般情况下偏差不超过100 mm。2020年全路3C装置检出的分段绝缘器拉出值分布见图7,可见,分段绝缘器位置的拉出值主要分布在100 mm以内,占77.75%,但仍有22.25%分布在100 mm以外,属于分段绝缘器偏移,应引起运营维护单位的重视。
图7 2020年检出的分段绝缘器拉出值分布图
3.3 回归方法
对某高速铁路2019年12月—2020年7月同一位置检出的接触线高度局部缺陷进行分析,对检测日期与接触线高度数据进行一元线性回归,回归函数为y=5.42x-5359.54,基于该函数预测未来3期接触线高度检测数据(见图8),可见,该位置的接触线高度检测数据持续增加,2020年8—9月的检测数据与预测结果基本一致。
图8 某高速铁路接触线高度缺陷值回归及预测
该位置2020年9月9日接触线高度检测数据见图9,可见,该位置处于两相邻等高点中间,位于中心锚结附近。中心锚结是影响接触网稳定性的重要因素,中心锚结两侧受力,当接触网张力补偿装置出现异常时,中心锚结位置的受力状态通常会发生改变,导致动态检测数据异常。
图9 某高速铁路2020年9月9日接触线高度检测数据
3.4 聚类方法
按车型对某高速铁路2019年1月—2021年4月检出的燃弧数量进行统计,由于不同车型的检测频率存在差异,统计燃弧数量时以百公里缺陷数(平均每百公里检测出的缺陷个数)为准。各月不同车型检出的燃弧缺陷数量见图10,可见,不同车型的检测设备检出的燃弧数量存在显著差异。
图10 某高速铁路各月不同车型检出的燃弧缺陷数量
为了解导致不同车型检出燃弧数量存在差异的原因,采用k-均值法对车型聚类。燃弧缺陷属于弓网匹配状态异常,发生频次与列车运行速度密切相关,聚类时需增加速度维度,计算各月检出燃弧的列车运行速度和百公里缺陷数均值(结果见表2)。
表2 各月检测数据均值
以欧式距离作为度量,取聚类个数为3,随机获取初始聚类中心,采用k-均值法对表2中数据进行聚类,各样本与聚类中心的欧式距离及聚类结果见图11。
图11 各样本与聚类中心的欧式距离及聚类结果
由图11可知,第1类中各车型装配的受电弓型号主要为CX,检出燃弧时列车运行速度高,燃弧百公里缺陷数量多;第2类中CRH2A、CRH5A装备的受电弓型号为DSA250,CRH380D装备的受电弓型号为CX,检出燃弧时列车运行速度低,燃弧百公里缺陷数量少;第3类CRH380BG装配的受电弓型号为CX,检出燃弧时列车运行速度较高,燃弧百公里缺陷数量较多。
总体而言,该高速铁路上各车型装配CX型受电弓更易发生燃弧,装配DSA250型受电弓发生燃弧的数量相对较少,且列车在高速运行状态下的燃弧发生更为频繁。
4 结束语
基于动车组3C检测数据,提出对接触网设备局部缺陷和当前状态进行诊断、对接触网缺陷分布特征和演变规律进行分析、对弓网匹配关系进行探索的检测数据挖掘方法,并结合案例在不同应用场景下对方法的可行性和有效性进行了验证。提出的检测数据挖掘方法能够有效提升3C检测数据的分析效率和质量,拓展3C检测数据的分析深度和广度,使得3C检测系统能够更好地服务于现场维修、设备管理和弓网关系研究。