传统铁路勘察设计企业云计算数据中心关键技术研究
2022-12-14叶红兵
叶红兵,龙 云,张 毅
(中铁二院工程集团有限责任公司信息技术中心 四川 成都 610031)
0 引言
自进入21 世纪以来,全球科技创新进入空前密集活跃的时期,基于云计算技术的数据中心正日益演变成为新型的信息基础设施,不仅成为信息产业发展的重要支撑,更是助力传统企业向数字化转型,推动企业陈旧生产方式和固化商业模式变革的基础保障。近年来,全球各国政府相继制定国家战略和行动计划,鼓励政府部门优先使用云计算技术进行IT 基础设施建设。
1 存在的问题
随着“十三五”期间信息技术的快速推广应用,传统铁路勘察设计企业在信息化基础设施的建设中加大了经费投入,为企业实现“管理制度化、制度流程化、流程自动化、信息数字化”的信息化目标提供了较为有力的支撑,取得了一定的成效。
但是,随着十九大提出的“网络强国”“数字中国”和“交通强国”的战略倡议,结合铁路勘察设计行业的快速发展,传统铁路勘察设计企业在信息化建设和应用过程中存在的问题也逐步暴露出来,具体包括:项目的设计成果资料独立保存在生产者个人或生产者所属部门手中,项目之间缺少信息交互,项目成果无法共享,各个项目仍然存于信息孤岛状态;勘察设计企业所使用设计类专业软件和硬件资源投入高,且分散在不同的设计部门,部分软硬件资源处于闲置状态,软硬件资源利用率低;勘察设计文件数量多,数据量大,且分散存放在不同的技术人员手中,技术人员可以自由控制和管理,数据的复制、修改、拷贝处于不可控的状态,数据安全性低。
由此可见,传统铁路勘察设计企业原有的烟囱式IT建设方式由于部署复杂、扩展性差、可靠性低等原因,已经很难适应企业未来的数字化转型与业务升级需求,急需通过云计算技术构建全新的企业级自动化云计算平台,对企业既有的信息化硬件基础平台进行资源整合和扩展,为上层业务应用系统提供高性能、高安全、灵活运营,灵活管理的云化的资源中心,充分发挥云计算资源集中、按需分配、快速部署、弹性扩展和绿色节能的优势,以满足企业日益增长的业务建设和数字化转型需求。
2 关键技术研究
随着一系列建筑信息化的国家政策和标准相继出台,国内各铁路设计院为提高轨道交通项目规划、设计、建设、运营、装备制造各个阶段全生命周期的网络化、集成化、智能化水平,正以BIM 技术实施和应用为抓手,加快信息化建设的步伐。但是,传统设计院的BIM 应用模式多数是采用单机模式,存在数据安全性低、数据存储容量要求大、软硬件投入多、标准不统一、团队协同难等问题,需要通过引入虚拟化、云计算、海量数据存储等相关技术,按照云计算技术标准体系框架,构建全新的云计算应用及部署模式,其关键技术主要包括以下几个方面。
2.1 显卡虚拟化
传统铁路勘察设计企业每年会投入大量的成本用于购买设计类软件和对应的显卡与服务器硬件支撑资源。这些软硬件资源分散在不同的设计部门,部分软硬件资源处于闲置状态,软硬件资源利用率低。如何高效地利用显卡和服务器等硬件资源是传统铁路勘察设计企业云计算数据中心建设需要关注的问题。显卡虚拟化技术就是为解决这个问题而出现的。简单来讲,显卡虚拟化是通过虚拟化技术将显卡资源进行逻辑切片,并将逻辑切片的显卡资源分配给虚拟机使用。目前,在虚拟化环境下主要有以下几种使用显卡资源的方式。
(1)直接发布物理机方式(HDX 3D Pro Graphics)
HDX 3D Pro Graphics 直接采用物理机的方式来解决图形加速卡的问题。在后台为每个用户准备好一台物理的图形工作站,然后在这些工作站上安装客户端程序和VDA的客户端,再通过虚拟化软件将这些工作站的桌面发布给设计人员通过客户端来使用。
(2)GPU 透传方式(Multi-GPU Pass-through)
GPU 透传方式是将物理主机的单个GPU 直接分配给此物理主机上运行的虚拟桌面,同时通过底层虚拟化软件的HDX 3D Pro 技术将此虚拟桌面中的应用程序直接调用GPU显卡的处理能力,从而实现GPU 显卡的三维运算与设计。
(3)图形加速卡共享方式
图形加速卡共享技术结合了GPU 透传技术和Windows共享桌面技术的原理,将两者融合在一起使用。该方式是在远程桌面会话中呈现OpenGL 应用程序的图形处理单元(GPU)硬件,可用于物理机或虚拟机,以提高应用程序的可扩展性及性能。
(4)图形加速卡硬件虚拟化方式(显卡虚拟化)
图形加速卡硬件虚拟化方式是针对Nvidia 公司专门推出的硬件GPU 虚拟化显卡RTX 系列,实现将一块物理显卡提供给多个虚拟机同时使用,满足三维设计工作的需求。
上述4 种显卡资源使用方式中,前面2 种是用户独占显卡资源,后面2 种则是用户共享显卡资源。为了提高显卡资源的利用率,合理降低显卡等硬件资源的投资成本,建议铁路勘察设计企业云计算数据中心根据不同的应用场景通过显卡共享和显卡虚拟化的方式将设计类专业软件以虚拟应用和虚拟桌面的方式提供给设计人员使用。
2.2 存储虚拟化
传统铁路勘察设计企业具有勘察设计文件数量多、数据量大和数据安全性低的特点,云计算数据中心的建设需要选择一种稳定可靠的存储架构来保障设计类大数据量文件的高效存储和数据安全。存储虚拟化技术的出现为云计算数据中心存储架构的选型提供了更多的思考和选择。
总体来讲,存储的技术路线主要分为两大类,一类是以数据中心SAN 和NAS 为代表的集中存储。其中,NAS 是基于LAN 上的技术,系统兼容性较好,能够很好地实现不同平台下的非结构化数据的共享应用,无需专门建立专门的数据传输网络通道;SAN 是将数据流独立出来,部署专用的光纤传输网络,其性能优越、可扩展性高,适用于结构化数据的高速存储和读写处理。
另外一类是存储虚拟化,又称软件定义存储(SDS),通过软件的方式重塑存储系统,不依赖具体的存储硬件。与传统存储在观念上的差别是,软件定义存储认为,硬件故障是一种正常现象,并且可以通过软件的方式去解决,例如,多副本技术等。软件定义存储的另一个能力是屏蔽不同类型的底层存储,提供统一的存储介质服务,例如,Cinder 提供存储接入,底层无论是SATA、SAS,或是SSD,存储的使用者是没有感知的,通过统一的存储接口获取存储数据。相比于SAN 和NAS,软件定义存储具有高扩展性、投资低等优点,但是软件定义存储的正常运行需要依赖于平台网络、软件定义存储软件以及x86 硬件服务器,其稳定性和数据一致性较低。
考虑到SAN 存储具有高性能和高稳定性的特点,结合铁路设计类软件对数据具有高安全要求的特性,建议铁路勘察设计企业云计算数据中心现阶段选择SAN 存储来存放各种设计文件,以此来保障业务系统和数据的安全性,后续根据存储虚拟化技术的发展情况再考虑是否引入存储虚拟化技术。
2.3 网络虚拟化
在云网络环境下,传统网络由于不能按需动态地调整已经不能适应云网络场景下的业务弹性需求。为此,传统铁路勘察设计企业云计算数据中心需要利用网络虚拟化技术来构建云数据中心大二层网络架构,以实现业务系统虚拟机的灵活部署和漂移。
相对于传统网络,网络虚拟化可以将传统上在硬件中交付的网络资源抽象化到软件中,也就是说可以将多个物理网络整合为一个基于软件的虚拟网络。具体来讲,网络虚拟化技术包括数据平面和控制平面两个部分。在数据平面,目前业内的主流标准是VXLAN(Virtual eXtensible LAN,可扩展虚拟局域网络)。VXLAN 将VLAN 原有用于标识VLAN 数量的12 位提高到24 位,解决了原有VLAN 数量不足的问题。同时VXLAN 也是一种隧道技术,通过三层网络来搭建虚拟的二层网络,实现了在虚拟化环境下虚拟机动态漂移后的IP 和MAC 地址保持不变,从而保障了业务的连续性。
在控制平面,相继出现了集中控制和松散控制两种模式。集中控制模式采用了OpenFlow 协议来实现VXLAN 网络的控制平面。OpenFlow 的易于实现,使原来处于领导地位的很多传统网络设备厂商,可能很容易在传统网络向新型网络转型的过程中,被其他小厂商拉回到起跑线上。于是,为了保住自己的先发优势,以传统网络设备厂商为代表的顽固派主导推出了各种松散控制的方式。目前应用较为广泛的松散控制模式采用MP-BGP 协议的扩展,它被应用在名为EVPN(Ethernet Virtual Private Network,以太虚拟专用网络)的网络架构中。MP-BGP 本身能够依靠MPLS 标签建立VPN,在EVPN 中只需要将MPLS 标签替换为VXLAN 标签,就能够在云网络中方便地建立基于租户的专有云,天然迎合了火爆的公有云或虚拟专有云的市场需求。这使得EVPN 在各种五花八门的松散控制模型中,成为构建新型网络的首选方案。
通过上述分析,为充分利用企业现有网络资源,建议铁路勘察设计企业云计算数据中心采用EVPN+ VXLAN 技术来构建云数据中心大二层网络架构,以实现业务系统虚拟机的灵活部署和漂移。
2.4 云计算技术标准体系框架
传统铁路勘察设计企业云计算数据中心的建设需要遵循标准的云计算架构。标准的云计算架构包括管理和服务两大部分。管理部分的主要功能是对整个云平台进行管理,使其能够安全、稳定地运行;服务部分的主要功能是从下到上依次为云用户提供基础设施即服务(Infrastructure as a Service,简称IaaS)、平台即服务(Platform as a Service,简称PaaS)和软件即服务(Software as a Service,简称SaaS)。简单来讲,IaaS 主要为云用户提供服务器、网络、存储等硬件资源,PaaS 主要为云用户提供应用开发平台的环境,SaaS 主要将应用系统以应用的方式提供给云用户。IaaS、PaaS 和SaaS 不是相互独立的,而是具有一定的依赖关系,一般来讲,上层服务依赖于下层服务,即SaaS 依赖于PaaS 和IaaS,PaaS 依赖于IaaS。
根据铁路勘察设计行业特点,可以将铁路勘察设计企业的业务分为两大类,一类为管理类业务,这类业务以管理为核心,以提升管理、生产效率为目的,另外一类为生产设计类业务,这类业务以协同设计为核心,以提升设计协同和效率为目的。其中,PaaS 层主要以管理平台和生产设计平台为核心,结合铁路勘察设计行业特点,管理平台又可以细分为企业信息管理平台、工程项目管理平台和工程数据中心等,生产设计平台可以细分为协同设计平台、高性能计算平台和业务交互平台等;IaaS 层主要是管理平台和生产设计平台提供基础硬件资源,包括计算、显卡、网络和存储等;SaaS 主要将管理平台和生产设计平台衍生出来的业务以通用性软件的形式提供给用户使用。
2.5 云计算技术应用模式及部署模式
传统铁路勘察设计企业云计算数据中心的建设需要根据行业特点和自身需求选择适宜的云计算部署模式。目前,业内主要有4 种云计算部署模式。
(1)公有云
公有云是一种公开的云服务,能够为用户提供强大的服务资源,由于具有规模大的优势,其成本较低。在公有云环境下,公有云的管理和运维统一由供应商负责,用户无须关心底层硬件和云平台的运行情况,只需关注所申请资源的使用情况和在资源上部署的业务系统的运行情况,大大地提高了用户的工作效率。
(2)私有云
对于许多企业而言,由于各种因素,特别是考虑到企业数据的安全性,他们更愿意选择私有云的部署模式来享受云计算技术带来的便利。私有云是将云平台部署在企业内部,由企业自己对企业内部的数据和安全性以及服务质量进行控制。相对于传统的企业数据中心,私有云可以有效提高服务器硬件资源的利用率和业务系统的应用连续性。
(3)混合云
简单来讲,混合云是一种将公有云和私有云结合起来的部署模式。在混合云模式下,企业可以将非关键的业务部署到公有云上,而将关键业务和安全性高的业务部署在企业内部的私有云上。混合云的优点是将公有云成本低和私有云私密性之间做了一个较好的平衡,缺点是部署难度大。
(4)行业云
行业云是专门为某个行业设计的云,并为该行业的企业提供行业云服务。目前出现的国资云就是由各地国资委牵头建设和投资,并以加快国有企业数字化转型为目标的行业云。和其他云计算模式相比,行业云可以优化行业的业务,缺点是提供云服务的范围较小,只支持某个行业。
在云计算技术的实际应用过程中,公有云一般用于社会公共服务和中小型私营企业,私有云一般用于中大型国有企业,混合云和行业云应用得相对较少。考虑到铁路勘察设计企业的国有性质以及部分勘察设计数据的敏感性和保密性,建议铁路勘察设计企业云计算数据中心采用私有云模式进行建设。针对国资云的行业属性,后期可以根据国家政策要求和单位发展的实际情况,再考虑是否使用国资云模式。
3 云计算数据中心系统总体架构
通过对云计算数据中心关键技术的研究,结合铁路设计企业数字化转型的业务建设需求,云计算数据中心系统总体架构如图1 所示:
云计算数据中心系统架构包括:
(1)物理层。为数据中心提供各种硬件资源,包括服务器、网络设备和存储设备等。
(2)IaaS 层。将物理层资源进行资源池化,按需弹性为上层业务提供计算、网络和存储等资源。
(3)PaaS 层。以企业信息管理平台为基础,以管理为核心,以提升管理、生产效率为目的,打通财务系统、专业软件,重建协同设计,建设移动工作中心,完善内部生产管理体系,形成移动工作中心、协同设计平台、工程项目管理平台、工程数据中心、企业信息管理平台和业务交互平台。
(4)SaaS 层。基于IaaS 层和PaaS 层,将业务以软件应用的方式提供给用户使用。
(5)业务服务层。整合集成各类服务系统,为工程勘察设计、工程总承包、海外工程项目、产品产业化、成本与风险管理和绩效与安全管理等业务应用提供各级各类技术支撑。
(6)安全运维和管理。制定数据中心安全管理制度和安全管理措施,保障数据中心各项业务的稳定可靠和安全高效。
(7)云平台管理。利用云平台管理系统对主数据中心和灾备数据中心云平台进行统一管理,提高云平台运维效率。
4 结语
云计算数据中心关键技术研究为传统铁路勘察设计企业云计算中心的建设提供了较为全面的技术支持和理论指导。建成后的云计算数据中心将对传统铁路勘察设计企业既有的信息化硬件基础平台进行资源整合和扩展,为上层业务应用系统提供高性能、高安全、灵活运营,灵活管理的云化的资源服务,充分发挥云计算资源集中、按需分配、快速部署、弹性扩展和绿色节能的优势,为传统铁路勘察设计企业的数字化转型和业务升级保驾护航。