城市轨道交通综合监控系统云平台架构设计方案比较
2018-09-27何治达
李 明 何治达
(郑州市轨道交通有限公司,450016,郑州//第一作者,工程师)
综合监控系统是线路运营管理系统的核心组成部分,能与其它专业系统互联,进行信息交互,从而构建线路的信息交换与共享平台,促进高效运营管理的实现[1]。传统综合监控系统的架构无法满足高度集中化、智能化发展的需求。随着大数据、智慧化、云技术及物联网等新一代信息技术在城市轨道交通领域的广泛应用[2],采用云技术的综合监控系统应运而生。这也为城市轨道交通建设提供了新的方向和思路。从运营管理角度讲,采用云平台技术的综合监控系统能提供切实可靠且高效的技术服务,面对各种突发事件可增强运营方的应变能力,提高运营方的反应速度[3]。但云平台有不同的构建方案,本文讨论其方案比选问题。
1 综合监控系统云平台架构方案
1.1 集中式云平台架构方案
综合监控系统集中式云平台架构方案取消了传统的设置在车站及控制中心的物理服务器和工作站,并在云管理中心建立了云资源池。集中式云平台架构如图1所示。
云资源池由多台物理服务器组建,可为控制中心虚拟出互为冗余的实时服务器、历史服务器及工作站,也可为每个车站虚拟出互为冗余的实时服务器和工作站。系统软件和人机界面程序分别部署在虚拟服务器和虚拟工作站上,车站及控制中心配置显示终端以云桌面的形式显示对应工作站中的人机界面。虚拟服务器和虚拟工作站可通过虚拟机灵活调度服务器集群的资源,可将状态数据、内存数据通过共享存储进行迁移,从而在服务器和工作站进行维护及业务升级时,能实现无缝切换,且工作不中断,以保证综合监控系统的可用性和可靠性。
1.2 分布式云平台架构设计方案
在综合监控系统分布式云平台架构方案中,每个车站保留1台车站物理服务器,云管理中心不再为车站提供虚拟备用服务器和虚拟备用工作站,而改由车站物理服务器提供,其他设置同集中式云架构。当云管理中心出现严重故障、通信完全中断时,车站服务器能应急虚拟出备用服务器,以继续维持系统正常运行;当故障消除后,车站综合监控系统将自动迁移至由云管理中心的虚拟实时主服务器上。
1.3 云平台可靠性分析
1.3.1 集中式云平台可靠性
集中式云平台架构的综合监控系统通信故障可能有以下几种:
(1) 车站核心交换机故障。如车站综合监控系统有1台核心交换机出现故障(属于非致命故障),则车站虚拟主服务器可通过车站另1台非故障交换机工作,来保障车站综合监控系统的正常运行,实现控制中心综合监控系统对本站的监控。如车站综合监控系统有2台核心交换机出现故障(属于致命故障),则车站综合监控系统会处于瘫痪状态,控制中心综合监控系统无法对故障车站进行监控(如图2所示)。
注:FEP——前端处理器;SIG——信号;PSSADA——电力监控与数据采集;AFC——自动售检票;PIS——乘客信息系统;ACS——门禁系统;CCTV——闭路电视;BAS——环境与设备监控系统;FAS——火灾报警系统
图1 综合监控系统集中式云平台架构图
图2 集中式云平台架构下车站核心交换机故障示意图
(2) 云中心核心交换机故障。如云管理中心有1台核心交换机出现故障(属于非致命故障),则车站虚拟主服务器通过云管理中心的另1台非故障交换机来保障车站和控制中心综合监控系统的正常运行。如云管理中心有2核心交换机同时出现故障(属于致命故障),则所有车站综合监控系统和控制中心综合监控系统均无法正常工作。
(3) 骨干网断点故障。骨干网出现3个以内断点(属于非致命故障),则车站虚拟服务器(主、备)可通过车站交换机(前后只有1个断点的交换机)来保障车站和控制中心综合监控系统的正常运行。如骨干网出现4个断点(属于致命故障),则断点范围内的车站综合监控系统不能正常运行,控制中心综合监控系统也不能对断点范围内的车站进行监控,而断点范围外的车站不受影响。
1.3.2 分布式云平台可靠性分析
分布式云平台架构的综合监控系统通信故障有以下几种:
(1) 车站核心交换机故障。如车站综合监控系统有1台或2台核心交换机发生故障,则情况与集中式云平台相同,不再赘述。
(2) 云管理中心交换机故障。当云管理中心有1台交换机发生故障时,云管理中心服务器集群虚拟出的车站虚拟主服务器,通过云管理中心另1台非故障交换机来保障车站和控制中心综合监控系统的正常运行。当云管理中心的2台交换机同时发生故障时,则车站服务器虚拟出的虚拟备用服务器可保障车站综合监控系统的正常运行,而控制中心综合监控系统无法正常工作。如图3所示。
图3 分布式云架构中心1台或2台核心交换机故障示图
(3) 骨干网断点故障。骨干网出现4个或4个以内的断点均为非致命故障。如骨干网出现3个及3个以内断点,车站虚拟主服务器通过车站交换机(前后只有1个断点的交换机)来保障车站和控制中心综合监控系统的正常运行;如骨干网同时出现4个断点,则车站的服务器虚拟出的车站虚拟备用服务器可保障车站综合监控系统的正常运行,而控制中心综合监控系统不能对故障车站进行监控。
由上述分析可见,除车站2台核心交换机同时发生故障外,其他故障情况下车站综合监控系统都能保证正常运行;并且,在云管理中心2台核心交换机同时出现故障和骨干网出现4个断点的极端情况下,综合监控系统会启用备用虚拟服务器,仍能够正常运行。
2 云平台架构设计方案比较分析
集中式云平台和分布式云平台架构各有优缺点。集中式云平台架构能实现成本最低化、设备管理和维护最简化,但在云管理中心通信中断时,控制中心和车站综合监控系统将面临无法运行的挑战。云管理中心通信完全中断的概率很小,即使综合监控系统不能正常运行,其集成和互联的系统(如BAS、PSCADA、ACS等)也能脱离综合监控系统独立运行,不会造成生产停滞。
分布式云平台架构能保证车站的综合监控系统在云管理中心通信中断的情况下独立运行。因为车站仅配置1台低性能服务器,故其成本比传统综合监控系统架构有所下降。但分布式云平台架构仍然面临设备分散、不能集中管理和维护的问题。
综上所述,集中式云平台架构在成本、设备管理和设备维护方面优势明显,是一种较为适用的方案。采用该方案时在极端情况下,其车站集成和互联的系统仍可独立运行。
3 结语
传统综合监控系统架构现已无法满足发展需求。随着城市轨道交通信息化发展及云技术的成熟,综合监控系统云技术应用已在积极探索。单系统云平台的建设成本较高,随技术发展和成熟,云平台未来将会发展为多系统综合部署,实现对线网的全面融合,最终节约投资。综合监控系统具有接口多、数据杂及数据量大的特点,运用云平台技术可对数据进行统一管理,为智慧轨道交通的数据管理及数据挖掘打下坚实基础。