基于KMEANS特征匹配算法的车辆门系统亚健康预测方法研究*
2019-10-14张世钟曹劲然许志兴
张世钟 龙 静 曹劲然 许志兴 张 伟
(1.广州地铁集团有限公司,510030,广州; 2.南京康尼机电股份有限公司,210013,南京//第一作者,工程师)
门系统作为城市轨道交通车辆的重要组成部分之一,其机械方面安全性能直接影响乘客安全与列车可靠运行[1]。目前车辆段对于车辆门系统的维护基本以人工定期检查为主,效率较低,列车维护成本较高。南京康尼机电股份有限公司远程监控与诊断小组通过与多家地铁公司合作,目前实现了车辆门系统参数的在线监测,能在线采集车辆门系统运行时的电机转速、转角和电流等数据[2]。在此基础上,研究基于车辆门系统监测数据的亚健康预测,这在实际应用当中具有重要意义。
近期,国内外对轨道交通设备的监控与诊断主要采用案例推理技术[3]、支持向量机[3]、BP神经网络[4]、专家系统[5]及贝叶斯网络[6]等算法。这些算法的诊断思路基本类似,在设备故障发生后,需先提取故障数据特征,再将特征集合输入所建立的模型中,进而匹配得出诊断的故障类型。这些算法在实际应用当中主要针对程度明显的故障类型,而且通过算法诊断获取的结果与实际参数特征无法建立联系,不利于后期分析与验证。
本文主要针对典型故障的早期异常开展研究,通过预测亚健康类型实现故障的早期预警。本文根据南京康尼机电股份有限公司远程监控与诊断小组的智能电机监测数据,采用KEMANS聚类算法区分亚健康数据与正常数据的特征,提取特征值的差异项作为算法预测依据,最终匹配后输出预测的亚健康类型。KEMANS聚类算法主要基于亚健康数据相对于正常数据的特征变化趋势的差异性实现类型预测,故障特征与门系统机理联系更加紧密,预测更加可靠稳定。
1 特征值定义与提取
1.1 数据预处理
以广州地铁某线路车辆的电动塞拉门系统为研究对象,通过智能电机提取转速、转角及电流等监测数据作为原始数据。结合转角及电流等数据的变化趋势,初步提取总体特征值。
为避免异常数据对预测结果的影响,通过设定总体特征阈值,滤除了乘客干扰数据和采集异常数据;绘制车辆门系统开门速度曲线,将曲线划分为升速段、匀速段、减速段、缓行段、到位后段,如图1所示。
图1 车辆门系统开门速度曲线及分段
将原始数据标准化。分别提取开门数据与关门数据的分段特征值(定义为子特征),令子特征值编号与子特征向量xα,i的数组元素一一对应。样本α的n组正常数据子特征矩阵Sα,n为:
Sα,n=[xα,1,xα,2,…,xα,n]T
xα,i=[cα, i,1,cα,i,2,cα,i,3,cα,i,4,cα,i,5,cα,i,6]
(1)
式中:
cα,i,1——第i组数据的开门转角分段子特征值行向量;
cα,i,2——第i组数据的开门转速分段子特征值行向量;
cα,i,3——第i组数据的开门电流分段子特征值行向量;
cα,i,4——第i组数据的关门转角分段子特征值行向量;
cα,i,5——第i组数据的关门转速分段子特征值行向量;
cα,i,6——第i组数据的关门电流分段子特征值行向量。
1.2 KMEANS聚类算法
KMEANS聚类算法从给定划分类别开始,通过迭代使各数据点距离各聚类中心距离最小。根据文献[7],实现步骤如下:
步骤1:样本α的数据集为Sα,n=[xα,1,xα,2,…,xα,n]T,xα,i∈Rm。其中,m=248,为维数,对应开关门子特征。
步骤2:给定划分类别数K,对应划分类别C={ck,k=1,2,…,K}。针对每个划分类别ck,初始化随机选取一点作为聚类中心μk。
步骤3:计算各样本点到距其最近的聚类中心的欧氏距离平方和,有:
(2)
步骤4:依次将类别ck内各数据点均值作为新的聚类中心ck,p,并重复步骤3和步骤4,直至达到指定迭代次数或2次迭代中聚类中心的D(C)差值小于给定阈值ε。
由于KMEANS聚类算法对异常点敏感,即便参照相同标准将门系统多次调整正常,这些正常数据也会通过算法被聚类区分开。而独立分析亚健康数据无法确定其相对变化特征,需要与变化前的正常数据对比才能准确定位亚健康类型。
1.3 提取KMEANS聚类特征
为了提高KMEANS聚类准确率与计算效率,反映出车辆门系统亚健康状态与正常状态的相对变化,将聚类数K限制为2,即将正常数据与任意一类异常数据分为2类,之后通过样本距离大小和正负差异放大样本的聚类特征,实现更加具体精确的聚类特征构造。
将正常数据子特征矩阵Sα,n与异常数据子特征矩阵Sβ,n组合得到[Sα,n,Sβ,n],并输入KMEANS分类器当中聚类。如有超过70%数据能被准确区分,则说明正常数据与异常数据差异性明显,输出数据异常。
当检测到数据异常后,计算正常数据聚类中心μα与异常数据聚类中心μβ的距离向量d(μα,μβ)。聚类距离越大,说明该类特征差异性越明显。因此,根据各子特征维度的聚类距离大小对d(μα,μβ)降序排序,得到
d′(μα,μβ)=[ωδ1,ωδ2,…,ωδm]
(3)
式中:
δi——子特征向量原始编号;
ωδi——第δi个子特征维度下2类聚类中心距离。
提取聚类距离较大的前20个子特征编号作为核心特征值,得到:
Yαβ=[δ1,δ2,…,δ20]
(4)
分别计算正常数据子特征矩阵Sα,n与异常数据子特征矩阵Sβ,n的均值向量,得到:
(5)
(6)
计算相对偏差向量Δ:
(7)
Zαβ=[Δδ1,Δδ2,…,Δδ20]
(8)
最终将反应聚类距离的特征向量Yα,β与反应子特征相对偏差方向的特征向量Zα,β组合得到KMEANS核心特征值Jα,β。
Jα,β=Yα,β·Zα,β
(9)
1.4 特征匹配模式
通过试验或现场真实亚健康数据训练可以构建由T类KMEANS聚类特征值构成的亚健康规则库J(t),t=1,2,…,T。将KMEANS聚类提取的核心特征值Jα,β与规则库J(t)进行逐条匹配,预测可能亚健康类型以及相关匹配度。规则库需要根据试验数据提取的核心特征值训练学习建立。通过匹配度给出可能的匹配度结果。定义交集数量与规则库数量总数比值为匹配度p(t),则有:
(10)
其中,Jα,β∩J(t)表示核心特征值与规则库特征值的交集数量,即两者相同特征值个数。
此外,给出各亚健康类型的综合统计置信度,其中第k类亚健康的统计置信度计算式为:
(11)
式中:
d——统计天数。
2 仿真试验验证与实例应用
2.1 仿真试验配置
仿真试验采用台架模拟试验数据进行验证。台架模拟试验数据分别来自2个35D锁结构塞拉门台架:广州地铁5号线车辆门系统台架和天津地铁1号线车辆门系统台架。
广州地铁5号线车辆门系统台架配置了康尼智能电机、mk7001.t0006-8门控器硬件及MK7001-A门控器软件。调门参数如表1所示。
表1 广州地铁5号线的车辆门系统台架调门参数
天津地铁1号车辆门系统台架配置了康尼智能电机、mk7001.t0006-8门控器硬件及MK7001-A门控器软件。调门参数如表2所示。
表2 天津地铁1号线车辆门系统台架调门参数
仿真计算规则库使用数据为广州地铁5号线车辆门系统台架的2015年7—8月、2016年11—12月数据。
仿真验证数据来自于天津地铁1号线车辆门系统台架的2017年1月数据。
规则库制定数据与仿真试验数据对应关系如表3所示。
首先,将广州地铁5号线车辆门系统台架数据中的正常数据与对应亚健康数据输入基于KMEANS特征匹配的预测系统,并将得到的特征值归入规则库中;然后,将天津地铁1号线车辆门系统台架数据中的正常数据与亚健康数据输入预测系统,对每种类型重复进行5次计算,且每次计算随机选取样本数据,以模拟正线连续统计5 d诊断结果;最后,对各亚健康类型的5 d诊断结果进行综合统计,按置信度高低进行排序,其中置信度最高的3个可能类型即为最终预测结果。
表3 车辆门系统台架规则库数据与仿真验证结果对应关系
2.2 仿真验证结果
2.2.1 隶属度分析
以对中尺寸误差为8 mm的异常数据作为单个亚健康类型示例,与对中正常数据进行对比分析。对中正常数据与对中尺寸误差为8 mm的数据样本聚类后隶属度分布如图2所示。
由图2可见,两类数据的隶属度明显差异较大,而同类型数据的隶属度分布较为集中。
2.2.2 综合置信度分析
通过统计综合置信度,能滤除偶尔异常数据导致的预测置信度偏离,进而保证长期存在异常的亚健康类型置信度排在较前位置。在统计亚健康类型综合置信度时,可将相同部件、不同程度的亚健康按同类型亚健康统计。
图2 对中尺寸正常数据与异常数据的隶属度分布
经统计,天津地铁1号线的对中尺寸误差试验5次综合置信度如表4所示。
表4 对中尺寸误差类亚健康试验预测结果
由表4可见,在连续5次计算过程中,对中尺寸异常数据的置信度一直较高,其他类型亚健康数据的置信度并不是每次都很高。
根据表4,各类亚健康的综合置信度基本大于0.5。因此,可初步将综合置信度0.5作为亚健康的预警值,为正线的亚健康诊断提供参考。
2.3 实例应用验证
在广州地铁某列车的门系统上安装智能电机,并通过网关在线采集运行数据,以进行实例应用验证。采集2017年3月14日试验列车在库内多次运行的数据作为标准正常数据,并据此对该列车之后每天的在线运行数据进行诊断。
通过基于KMEANS特征匹配算法的亚健康预测系统,对试验列车门系统状态进行评估。异常类型置信度会根据历史统计次数累计,当达到设定预警值时,亚健康预测系统将会报出亚健康维修任务,并给出对应检修建议步骤。
目前,该试验项目已进入规则调整与完善阶段,近期已能够较为准确识别门系统亚健康异常。本文选取2例典型案例进行分析。
2.3.1 实际应用案例1
2017年5月14日 00:31:03 ,试验项目亚健康预测系统发出亚健康警报,相应诊断结果如表5所示。
现场检查发现,罩板与门板有剐蹭痕迹。处理办法为调整下挡销、压轮及外摆臂尺寸。
表5 案例1 的亚健康诊断结果
经分析,外摆臂尺寸异常特征与当前规则库有偏差。于是,亚健康预测系统将此次案例作为上滑道异常大类(外摆臂尺寸异常子类)重新学习并加入规则库当中。
2.3.2 实际应用案例2
2017年5月27日00:30:35,试验项目亚健康预测系统发出上滑道异常亚健康警报,其综合置信度为0.516 5。
现场检查发现,该门系统左门平行度为-0.3 mm,右门平行度为2.5 mm(正常范围为0~2 mm)。调整后,左门平行度为0 mm,右门平行度为1 mm。调整后的门系统参数正常。继续跟踪,此门未再发生异常。因此将该案例的亚健康数据作为新规则加入规则库。
3 结语
本文提出一种基于KMEANS特征匹配算法的车辆门系统亚健康预测方法,实现了车辆门系统的早期故障预警。
该方法先以正常状态和亚健康状态门系统的电机转角、转速和电流的时域特征、统计分布特征作为输入量;再通过KEMANS算法计算两者空间距离,并根据距离大小对子特征排序,筛选出差异明显的特征量构成特征向量;最后将特征向量与已有规则库匹配,通过衡量匹配后的综合置信度输出预测的亚健康类型。
仿真验证结果证明:该方法对于已知、可模拟亚健康类型能够实现准确预测。
现场的2例实际案例表明:基于KMEANS特征匹配算法的车辆门系统亚健康预测系统在运行初期能够不断学习新亚健康类型,并扩充数据库,在后期也能够继续准确预测实际发生的亚健康,并给出相应检修建议。
采用该系统对正线实行状态修,可极大减轻现场检修人员工作量,提高检测效率,并能实现早期故障预警,提高车辆门系统的安全性和可靠性。