APP下载

铁路站段超融合云管平台建设与应用研究

2021-02-14姚益静中国铁路上海局集团有限公司金华车务段

上海铁道增刊 2021年2期
关键词:车务段桌面备份

姚益静 中国铁路上海局集团有限公司金华车务段

铁路信息化建设过程中,几乎都是采用传统的物理服务器、PC的办公模式.局内各车务段的业务都大同小异,包括OA办公系统、18点、smis、信息共享系统、超偏载轨道系统、确报收发调传系统等,这些系统的物理服务器一般都部署在站段中心机房或者地区中心机房,业务终端则分散在车站各生产岗位,使得这些信息系统在其生命周期内出现了诸如运维工作量大,数据安全无法保障等一系列问题,铁路站段超融合云管平台就是针对以上问题而设计的一款既能有效减少人力财力资源的浪费,符合节支降耗的要求,又可以大大提升数据安全性和管理高效性的一款系统平台。

本文结合上海局集团有限公司金华车务段信息系统的实际情况,研究探讨铁路信息系统采用基于超融合基础架构,利用虚拟化技术实现服务器虚拟化和业务终端桌面虚拟化的解决方案。

1 车务段信息系统现状

车务段目前共有5种应用系统(见表1):

表1 车务段目前使用的应用系统

另外还有OA服务器,以及部分备用服务器,这些系统采用的都是传统的物理服务器的架构,基本上是一个应用对应一台物理服务器,另有两个自建的文件共享服务器。服务器都已使用超过3年,没有备份容灾措施,靠冷机备份的方式进行。

内网桌面用户有1 000多个(不包括客票系统用户),分布在管内49个车站的生产岗位,主要用于OA办公、18点、TMIS及其他一些生产应用系统,涉及操作系统有winxp(应用需求)、win7、win8及win10,部分为32位版本。常用软件有Office、PDF、各类浏览器(Chrome、IE、Firefox等)、360天擎软件和北信源。有多种型号的打印机,大部分为USB接口,也有部分并口打印机,还有高拍仪、STP勾传设备、读卡器、扫描仪和指纹识别设备。

2 平台建设与应用的迫切性

由于现有应用系统都是采用独立的物理服务器方式进行部署的,1 000多个办公网终端分散在管内49个车站的生产岗位,所以存在以下问题:

(1)服务器的利用率低。车务段机房内运行的服务器利用率都非常低,由于一台服务器只能有一个操作系统,受系统和软件开发平台的限制,CPU、内存、硬盘空间的资源利用率都很低,大量的系统资源被闲置。

(2)可管理性差。首先是可用性低,几乎每个应用服务器都是单机,如果某台服务器出现故障,相对应的业务也将中断。其次是当硬件需要维护、升级或出现硬件故障时,相关的业务系统会出现较长时间的中断,影响运输生产。

(3)兼容性差,部署速度慢。铁路内部很多用于运输生产的信息系统对高版本的软硬件的适应性没那么强,系统和应用迁移到新服务器,不能保证兼容,当有新的应用需要部署时,需要重新部署服务器、存储系统,快则3 h-4 h慢则半天甚至24 h。

(4)缺乏备份和冗灾。应用基本没有备份容灾措施,靠冷机备份的方式进行。

(5)运维工作量巨大,效率低。车务段管辖沪昆线、衢宁线、金千线、衢九线、金温线五条线,车站多范围广,重要生产岗位,比如TMIS业务终端,通常采用一主一备的模式来应对突发故障,可即便这样,一旦发生故障还是有一种鞭长莫及的感觉。

3 铁路站段超融合云管平台设计

3.1 总体规划

平台由超融合基础设施和云管平台两部分组成,利用6台物理服务器搭建超融合基础架构,其中3台建成企业级云平台,采用服务器虚拟化技术,借助迁移工具将原先运行在独立物理服务器上的数据库和应用无缝迁移至云平台,可以通过CDP技术、数据多副本技术、虚拟机备份技术、网络行为管理等多技术来保障数据的可靠性与完整性及数据的安全,满足车务段主要业务系统的需求;另3台物理机建成桌面云平台,通过虚拟化技术将TMIS终端业务统一运行到后端的数据服务器上,实现运维的统一管理。

3.2 硬件构成

整体环境由6台物理服务器、2台千兆上联交换机、2台万兆光交换机,两台DELL ME4012存储设备,一台千兆管理交换机组成(表2)。

表2 超融合云管平台硬件组成功用表

3.3 超融合云管平台拓扑图(图1)

图1 超融合云管平台拓扑图

4 超融合云管平台研究与实现

4.1 企业级云平台实现

根据表一中的硬件配置采用三台DELL R740服务器,一台ME4012存储,10 GB网络交换机与aDesk平台共用,来组成整个服务器虚拟化平台,包括备份空间。此配置中,SSD与数据磁盘的配置大概在1:10左右,高于厂商的推荐配置。根据配置,整个平台可以提供60C、384GB MEM和大概30TB左右的存储空间,其中超融合部分存储空间14TB用于虚拟机,ME4012的16TB空间用于备份。根据虚拟机资源类型的不同来测算,目前的配置完全能够支持目前车务段对虚拟服务器的需求,表3是根据虚拟机配置,估算的支持虚拟服务器数量的统计表:

表3 支持虚拟服务器数量的统计表

云管平台软件采用aCMP:V6.0.10和aCloud:5.8.8_R1,如果遇内存资源紧张,可按需增加物理服务器内存,如遇CPU、磁盘资源紧张,可以通过增加物理服务器的方式,来提升平台的整体运算能力。

4.2 虚拟桌面平台实现

虚拟桌面平台利用计算虚拟化aSV、存储虚拟化aSAN,将计算、存储、网络整合在一套桌面云环境中,使用瘦客户机、PC等多种接入方式,只要综合计算机网络可达的情况下,用户就可以通过各种类型的终端去访问位于服务器上的个人桌面,让数据保护更安全,桌面管理更高效。整个车务段有1 000多个终端PC,用于TMIS业务的终端50多个,此次只规划了TMIS业务终端部分,以后如果需求增加,aDesk平台可以很方便的进行横向扩展,为今后整个车务段实现完全桌面虚拟化做好基础。

桌面云平台采用和企业级云平台一样的硬件配置,根据配置整个平台可以提供60C、384GB MEM和大概30TB左右的存储空间,其中超融合部分存储空间14TB用于虚拟桌面,ME4012的16TB空间用于虚拟桌面个人数据的备份。根据虚拟桌面资源类型的不同,估算的支持虚拟桌面数量的统计如表4:

表4 估算的支持虚拟桌面数量的统计情况

同样可以通过增加物理服务器内存和增加物理服务器的方式来解决内存、CPU、磁盘资源紧张的问题,提升平台的整体运算能力。当前配置了60个VDI的许可,60C物理内核的许可,可以满足车务段TMIS业务终端虚拟化的需要。

5 平台实施过程中遇到的问题和解决方法

(1)平台建成初期,出现CDP自动备份不能进行下发,所有授权全部掉线的问题,重启acmp授权服务,发现不能识别到key或者key识别非常慢,因此怀疑为key识别问题,于是工程师现场进行key插拔,之后key映射正常,授权也全部正常,业务恢复,判断主要为key识别故障导致。

(2)在进行虚拟存储扩容时,出现服务器I/O繁忙度100%,在进行5.3.8升级至5.4.2版本时也出现I/O繁忙问题。最终导致虚拟存储添加失败、升级失败等问题处理方法:针对读写IO较低磁盘,进行磁盘模式更换,从镜像模式改为普通模式,此时再测试主机磁盘IO速率,结果正常,虚拟存储添加失败问题在集群内主机全部分批重启一遍后问题解决,升级失败问题通过后台升级解决。

(3)车站使用虚拟桌面操作TMIS终端业务的时候,STP勾传功能串口服务器无法正常使用,但是在桌面云管理系统里的策略组→USB设备访问控制里已经添加了该设备的VID:PID,而且在Nport administrator里也可以搜索到该串口服务器,后来考虑到STP串口服务器设备在车站本地,而虚拟桌面服务器在车务段,尝试将虚拟桌面IP地址加入到Nport administrator管理程序的Accessible IPS列表中,问题解决。

6 结束语

目前,该平台已经在金华车务段投入使用,通过该平台提供的简单的单一管理方法,大大提升了站段生产数据的安全性,提升站段IT运维的效率,提高管理水平,取得了良好的安全效益、管理效益和经济效益。该平台适合应用于铁路基层站段OA办公系统、18点、TMIS等,能满足大部分基层站段对信息系统建设的需求,具有在全路各站段推广的前景。

猜你喜欢

车务段桌面备份
浅谈数字化条件下的数据备份管理
西瓜桌面桶
桌面云技术在铁路行业中的应用
创建vSphere 备份任务
Windows10应用信息备份与恢复
铁路车务段安全管理的现状与对策浅析
安全风险管理在矿区铁路车务段中的应用
桌面装忙
如何有效提高车务运输组织能力
旧瓶装新酒天宫二号从备份变实验室