APP下载

基于大数据的铁路旅客服务设备监测系统研究

2019-07-13崔世卿刘子扬

铁路通信信号工程技术 2019年6期
关键词:旅客聚类检修

崔世卿, 刘子扬

(1.北京全路通信信号研究设计院集团有限公司,北京 100070;2.北京市高速铁路运行控制系统工程技术研究中心,北京 100070)

1 概述

铁路旅客服务系统是面向旅客服务的信息系统,主要承担旅客综合显示信息发布、车站广播、视频监控及火灾、门禁监控等功能。近几年随着铁路客运业务的蓬勃发展,旅客服务系统的管理模式不断发生变化,从最初的各业务独立运行管理,发展为集成平台集中化管理。这意味着集成平台需要对各业务多种类设备进行集中统一监测维护[1]。但旅客服务系统管理体系复杂,业务种类繁多,设备类型各异,给系统设备的实时监测和维护造成一定困难[2]。旅客服务系统直接面向旅客,对出行体验影响很大,因此,实现各类旅客服务设备状态数据的统一采集和处理,通过数据分析,实现设备全生命周期信息管理、设备状态评估、设备故障预警、检修方案辅助决策,从而有效提高系统维护效率,降低设备故障率,降低系统运营成本,是当前旅客服务系统研究的重要课题。

大数据(big d ata),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,通常具有5V 特征,即:大量(Volume)、高速(Velocity)、多样(Var iety)、低价值密度(Value)、真实(Veracity)。目前大数据技术已经在互联网、医疗、通信、电力、物流等诸多领域得以运用[3], 在铁路运输设备管理方面也有相应的研究[4]。同时,学术界也围绕大数据技术和应用进行了大量的研究,促进了大数据相关理论和技术的快速发展。

铁路旅客服务系统包含综合显示信息发布设备、广播设备、视频监控设备、火灾告警设备、门禁设备、集成平台设备等多种设备。具体设备类型如表1所示。各类设备状态数据体量巨大,采集方法不一,数据存储形式复杂,采集周期间隔差别较大,符合大数据特性。研究基于大数据技术的铁路旅客服务设备状态监测系统,能够更好的对数据进行整合、存储,并通过数据分析挖掘,充分发挥数据价值,实现设备信息管理、状态评估、故障预警、检修方案辅助决策等功能,实现设备故障能够早预防、早发现、快维修。该系统将成为支撑低成本、高效率、高可靠性的旅服设备管理的有力手段。

2 基于大数据的铁路旅客服务设备状态监测系统设计

基于大数据的铁路旅客设备状态监测系统基本设计思路是先通过历史数据聚类生成设备状态评判规则,当有新设备状态信息输入时,可根据状态评判规则对设备状态进行判断,并提供故障预警或告警。通过历史维修数据分析出设备状态与维修方案间的关联关系,当设备出现故障预警或告警时,能够实现维修方案的辅助决策。系统设计思路如图1所示。

表1 旅客服务系统设备按功能模块分类表Tab.1 Passenger service system devices classification table by function module

图1 系统设计思路Fig.1 System design idea

2.1 系统架构

基于大数据的铁路旅客服务设备状态监测系统总体架构主要分为5 层,分别为:数据源层、数据采集层、数据存储层、数据分析层、应用展示层。另外,大数据信息安全保障体系负责保障系统中各层级的数据安全。系统总体架构如图2 所示。

图2 基于大数据的铁路旅客服务设备状态监测系统总体架构Fig.2 Overall architecture of device status monitoring system of railway passenger service system based on big data technology

1)数据源层

数据源层包括集成平台设备、综合显示设备、广播设备、视频监控设备、火灾告警设备和门禁设备在安装、运行、检修过程中产生的所有静态和动态数据。

2)数据采集层

数据采集层负责数据的采集和清洗。主要采集的数据类型分为结构化数据和非结构化数据。采集方式包括基于ETL 的离线采集和基于Flume 的数据流式实时采集。并采用H iv e 对采集到的数据进行数据清洗。

3)数据存储层

数据存储层负责对采集处理后的数据进行存储。系统采用关系型数据库My SQL 对结构化数据进行存储管理,采用非关系型数据库Hbase 进行非结构化数据存储管理。

4)数据分析层

数据分析层负责对采集处理后的设备状态数据进行统计和分析,从而挖掘出设备状态判断依据和最优故障检修方案。设备状态信息分析主要采用聚类分析中的K-Mean s 算法[5],最优故障检修方案分析主要依赖于关联分析中的Apriori 算法[6]。

5)应用展示层

应用显示层负责将数据分析层的分析结果面向用户进行展示和应用,包括实时运行状态展示、设备全生命周期信息查询、故障预测及告警、设备报废告警以及相应的设备检修辅助决策方案等。

6)大数据信息安全保障体系

大数据安全保障体系为各层级数据安全提供保障,包括数据产生和采集环节的元数据安全管理、数据传输环节的安全管理、数据存储环节的安全管理和数据使用环节的安全管理等。

2.2 系统功能设计

基于大数据的铁路旅客服务设备状态监测系统主要功能包括:设备全生命周期信息管理、设备状态评估、设备故障预警及告警和设备检修方案辅助决策。

1) 设备全生命周期信息管理

对所有设备信息按照安装调试、正常运行、故障预警、故障告警、检修维护、报废回收,分为6个生命阶段进行管理,形成完整的设备全生命周期信息履历,并提供信息查询。

2) 设备状态评估

通过大数据分析技术,确定设备各状态判定指标,并根据指标对设备当前运行状态进行评估,对设备使用寿命进行预测。

3) 设备故障预警及告警

系统可对设备故障类型进行预测,并向用户发出故障预警,提示用户尽快对设备进行检查维护。当设备已处于故障状态时,能够及时向用户发出告警,提示用户及时维修。

4) 设备检修方案辅助决策

系统可针对设备当前所处运行状态,为用户提供相应的可执行检修方案辅助决策。

2.3 业务流程

1)设备状态数据分析流程

设备状态数据采集后,经过数据清洗处理,对处理后有用信息进行数据分析,获得设备各状态的数据特征,从而生成相应设备状态的判定依据。设备状态分析流程如图3 所示。

图3 设备状态数据分析流程Fig.3 Device status data analysis flow

2)设备检修维护数据分析流程

设备检修维护数据经过数据清洗处理后,结合设备维护时相应的设备运行状态数据,进行关联关系的分析。并根据关联分析结果,确定不同设备运行状态下的设备检修方案。设备检修维护数据分析流程如图4 所示。

图4 设备检修维护数据分析流程Fig.4 Device maintenance data analysis flow

3)设备状态监测检修管理流程

系统获取到设备实时状态数据后,根据大数据分析结果,将设备状态分为设备状态正常、设备故障预警、设备状态告警和设备报废告警4 种状态。

当设备判断为正常状态时,系统对状态信息进行存储,以作为后期设备状态分析的数据储备。

当设备处于故障预警状态时,系统通过数据分析,关联出当前预警类型所对应的维护方案,并向用户推送。

当设备发生故障时,系统通过对故障实际情况进行分析,关联出最优系统维修方案,并将方案推送给用户。

当用户完成设备维修后,系统对实际维修方案数据进行采集处理,用于后期设备维修方案的数据支撑。

当设备处于报废告警状态时,系统向用户发出设备报废告警。用户根据告警对设备进行处理,并对实际处理结果进行记录。系统根据采集到的设备报废处理结果,对设备报废的判断标准进行优化,形成信息闭环。

设备状态监测检修管理流程如图5 所示。

2.4 大数据关键技术

业务流程中使用两个关键算法,分别是生成设备状态判断规则的聚类算法和将设备故障与检修方案关联的辅助决策算法。

1)设备状态聚类算法

图5 设备状态监测检修管理流程Fig.5 Device status monitoring and maintenance management flow

设备状态判定的主要算法是K-mean 聚类算法[7]。其主要应用思路为:对采集到的设备各项状态参数进行聚类,获得设备状态判定依据。在聚类初始化时,选取某类状态的典型参数作为该状态聚类的初始中心点,并通过多次初始化计算,对中心点位置进行优化,确定损失函数最小的点作为该状态聚类中心点,即该设备状态的判断依据。

损失函数定义为:假定μ1,…,μk为k 个聚类中心,用γnk∈0,1 表示xn是否属于聚类k,则损失函数的散度为:

假设设备某一状态聚类的中心点为Z={z1,z2,…,zi,…,zD}(zi为设备的一项状态参数),设备实际状态数据为X={x1,x2,…xi,…xD},则实际数据X 与中心点Z 之间的欧式距离为:

设备状态数据X 距离哪个聚类中心点的欧式距离最短,即可判定为该聚类所代表的设备状态。

2)检修方案辅助决策关系算法

检修方案辅助决策的大数据分析主要基于关联规则挖掘中的A p r ior i 算法[8]。其主要思路是将设备检修过程中发现的故障、问题及其相应的处理方案组合为一个项目集,存储至事务数据库中。根据指定的最小支持度和最小置信度,对事务数据库中的频繁关联规则进行发掘,找出设备故障类型和处理方案的频繁相集,确定故障类型和处理方案之间的关联关系,从而在设备再次出现类似故障时,系统能够及时给出相应的检修方案。

在本系统中,支持度(support degree)定义为:

即故障A 和检修方案a 组成的项目集在设备所有检修项目集|T|中出现的概率。

置信度(confidence degree)定义为:

即故障A 和检修方案a 组成的项目集在设备出现故障A 的所有检修项目集中出现的概率。

当S 和C 均分别满足最小支持度和最小置信度的设置条件时,检修方案a 及为与故障A 有强关联的检修方案,可作为推荐方案向用户提供。

3 结束语

进入大数据时代,旅客服务系统设备监测维护业务正进行着从依靠人工的设备监测和依靠经验的故障判定维修向高效率、高准确性、高标准度的自动化设备监测,智能化检修辅助方案决策的转变。本研究提出的系统总体架构、功能设计、业务流程和大数据分析关键技术,为基于大数据的铁路旅客服务设备状态监测系统的开发和应用提供了理论支持。该系统将成为低成本、高效率、高可靠性的设备管理的有效手段,推动铁路旅客服务系统智能化的发展进程。

猜你喜欢

旅客聚类检修
非常旅客意见簿
候车大厅的旅客
基于K-means聚类的车-地无线通信场强研究
检修
我是人
基于高斯混合聚类的阵列干涉SAR三维成像
变电站一次设备检修的意义及具体检修内容分析
电力系统继电保护二次回路的维护与检修
基于Spark平台的K-means聚类算法改进及并行化实现
桥梁检修专家——MOOG桥梁检修车掠影