云计算背景下信息化系统运维研究
2023-07-20姜东参
姜东参
摘要:随着三峡通航信息化的高速发展,三峡通航在用和在建信息系统数量和规模不断壮大,信息化应用的结构也越来越复杂。传统运维模式将会消耗大量的人力和物力资源,根据Gartner网站上的调研结果显示,在信息化系统费用中,大约有一半用于系统运营期的运维管理工作。因此,需要更合理的模式来保障信息化系统服务的灵活便捷和安全稳定。云计算技术的发展和应用,在一定程度上能够解决信息系统建设和运维过程中出现的一些问题,文章介绍了云计算背景下的信息系统运维模式,对云计算环境下的运维体系和运维管理模式进行了分析,以供参考。
关键词:信息化;运维;云计算
中图分类号:TP393
文献标志码:A
0 引言
云计算(Cloud Computing)早期是分布式计算的一种模式,主要通过网络“云”将大量的数据计算任务处分解成数个小程序,通过多台服务器组成算力系统处理和分析,并将结果返回给用户。现阶段所说的云计算主要是分布式、效用计算、负载均衡、并行计算、网络存储、热备份冗杂和虚拟化等计算机技术混合演进的成果。通过计算机网络形成的计算能力极强的系统,可存储、集合相关资源并可按需配置,向用户提供个性化服务。随着云计算技术的不断发展,在信息系统运维管理中可以解决许多之前无法解决的实际问题,由于云技术背景下系统整体架构模式和运维模式与传统运维模式存在较大的差异性,需要对运维模式进行转型和升级[1]。云计算作为一种新型技术在信息系统的运行和维护中能有效提升整体运行效率,较大地降低信息系统运维的成本,发挥较大的经济效益和社会价值。云计算技术的发展推动了信息系统资源的集约化、规模化,提高了系统建设的效率和弹性,对于信息系统运维业务的发展有着积极的意义。
1 云计算背景下服务器虚拟化架构
1.1 传统架构
传统架构由服务器、存储设备、网络组成。在服务器上安装操作系统、中间件、数据库等应用,然后再进行信息化系统的构建。传统服务器架构在使用过程中,随着信息化系统数量的逐步增长会存在一些问题:(1)随着信息系统规模的逐步增大,系统之间的逻辑、系统部署方式就越复杂,系统性能的逐步提升导致软硬件需求越来越多,考虑服务的高可用性,一些信息系统需要主备部署,所需要的硬件资源成倍增长。数据中心大量的服务器占很大的空间,造成软硬件投资成本过高。(2)传统服务器架构部署信息化系统往往需要至少一台服务器,部分信息化系统对硬件资源要求不等,导致硬件利用率较低,造成硬件资源浪费。(3)大量的服务器造成机房功耗较大,导致运营成本上升。(4)服务器管理比较复杂,存在不同品牌不同型号的服务器,操作界面和使用习惯有较大差别,给运维人员带来了极大的工作量。(5)新增服务器需要花费大量的硬件成本与时间成本。(6)服务器运行稳定性问题等[2]。
1.2 云计算背景下服务器虚拟化架构
1.2.1 裸金属虚拟化架构
裸金属虚拟化技术主要是在物理服务器上安装虚拟机软件,而无须先安装操作系统的预装模式,再在虚拟机上安装其他操作系统(如Windows,Linux等)和应用。由于虚拟机是直接安装在物理计算机上的,所以称为裸金属架构,如KVM,VMware ESXI,XEN等。它主要依赖虚拟层的内核和服务器的控制台,对虚拟服务器进行管理,通過识别和捕获以及响应虚拟机发出的CPU指令,负责调度整个虚拟机的运行。裸金属虚拟化架构如图1所示。
1.2.2 寄生架构
寄生虚拟化架构主要是指在物理资源和宿主操作系统上安装和运行虚拟化程序,然后创建相应的虚拟机。所有的虚拟机共享底层服务器资源,利用这个虚拟机进行创建和部署信息化系统。寄生架构如图2所示。
1.2.3 操作系统虚拟化架构
操作系统虚拟化架构主要是指在物理资源和宿主操作系统层面增加虚拟化服务器功能。它把单一的操作系统划分为许多个虚拟容器,使用虚拟容器对虚拟机进行管理。宿主机操作系统负责在多个虚拟服务器之间分配和共享硬件资源,但是这些服务器彼此独立,互不干扰。操作系统虚拟化架构如图3所示。
1.3 服务器虚拟化架构特征
1.3.1 封装
虚拟机创建以后,整个虚拟机以文件形式存在,虚拟机运行环境封装在独立环境中,包含磁盘、CPU、内存等信息,不受外界因素干扰。整个磁盘分区存储为一个文件,易于备份、转移和拷贝。
1.3.2 硬件独立
虚拟机无需修改就可以运行在任何安装同一个虚拟化软件的物理机上。服务器虚拟化技术支持资源高可用、弹性资源调整,极大地提高了系统的可持续运行能力和综合利用效率。
1.3.3 分区
使用虚拟化技术在一台物理服务器上可以运行多个虚拟机操作系统,多个操作系统之间分区运行,可以实现单一物理机器上同时运行多个虚拟机。
1.3.4 隔离
物理硬件和虚拟机分别进行单独封装,同一台物理机上多个虚拟机之间互相隔离,互不干扰。同时,横向之间数据也不会在多个虚拟机间进行流通;一旦其中某台虚拟机宕机或者文件损毁、木马感染,也不会对其他虚拟机的运行造成影响,从硬件层面对不同系统进行了隔离,降低了系统的安全威胁[3]。
1.4 服务器虚拟化优势
1.4.1 灵活的部署方式可以提高资源利用率
服务器虚拟化可支持实现物理资源的聚合,将一台或者数台物理资源形成资源池,进行动态分配部署。一台主机上可以运行多个虚拟机,每个虚拟机相当于传统的一台服务器,不同虚拟机上运行不同的业务系统,按需分配资源,极大地提高了资源利用率。通过虚拟化可实现动态的资源部署和重配置,满足不断变化的业务需求。同时对于资源利用率较低的服务器,可以对其实现最小化资源分配。
1.4.2 降低管理成本
服务器虚拟化技术可减少运维管理的物理资源的数量,系统运行人员无须考虑每个服务器之间的网络传输、存储共享。通过将所有的硬件资源聚合形成资源池来统一调度分配,同时利用自动化部署工具或虚拟机模板进行虚拟机部署,提高了运维人员的效率。
1.4.3 提高安全性
服务器虚拟化可实现软硬件之间的独立和虚拟机之间的相互隔离,可以实现对虚拟机数据和服务的可控和安全访问,极大地提高了系统间的安全性。
1.4.4 高可用和高扩展
服务器虚拟化技术可在不停机状态下对硬件资源,如CPU、内存、硬盘等,进行扩充、删除或者调整。根据不同的虚拟机的需求,资源可以以最小单元或者最大单元对虚拟机进行精确的资源配置,这些是传统服务器模式不可能做到的。
1.4.5 合理的资源分配
服务器虚拟化可兼容各种接口、协议,支持不同品牌的硬件,并能够以合理的调度方式进行资源分配。
2 云计算背景下的信息系统运维体系
2.1 运维模式
传统信息系统通常采用“烟囱式”的建设方式,基于单个项目建设,每个信息系统都有一套硬件设备和运行环境、數据库。不同系统之间不能共享资源,形成了资源孤岛。而云计算的核心优势在于资源聚合,统一分配。就是将所有资源进行统一化管理,形成资源池,然后针对用户的实际使用需求进行动态分配,从而实现更灵活高效的资源分配模式,提高资源利用率。同时,运维对象由独立的硬件设备转变为资源池,各种监控管理工具也转变为云平台管理运维工具,传统的运维技术及管理制度难以适用于新的运维对象,需要更新运维管理制度和模式,并对运维人员进行针对性培训,这对运维人员的经验提出了较高要求。
2.2 运维组织架构
云计算背景下信息系统组织方案的构建应包括3个领域:技术部门、运维责任部门和综合职能部门。技术部门可以与第三方技术人员进行技术学习合作;运维责任部门包括系统运营和运营管理,以便建立运营维护团队;综合职能部门是对硬件、云平台、信息系统的综合管理。
2.3 运维特征
云平台为智能运维的落地带来了现实的物质基础。依托云计算的分布式处理、分布式数据库、云存储和虚拟化技术可以对海量数据进行挖掘。海量数据在云平台得到了统一的处理,并且以服务模块的形式对外提供二次应用开发。依托庞大规模的集群,实现资源的统一管理。将资源调度、数据流转、数据迁移等技术应用到实际运维工作中,进而实现7×24 h不间断运维管理,促进系统的稳定运行。
3 云计算背景下的信息系统运维要点
随着云计算时代的到来,云计算将会逐步淘汰传统运维。云时代,运维工作发生了深刻的变革,传统运维需要处理服务器、网络、存储等硬件设备,云时代则不需要接触硬件设备,而是处理虚拟资源(虚拟化是云平台的核心支撑技术,软件定义计算、软件定义存储、软件定义网络)。云计算时代的运维,通过AI、大数据等技术,会节省更多的人力、物力成本,减轻运维人员的压力。
3.1 云上的信息化运维管理工具
云的到来可以大量减少资金投入、人力建设运维管理平台体系,只需购买基于云的软件运维管理服务,就可以使用软件服务厂商先进的运维管理工具和运维管理体系。而对于大量的私有云来说,云内存在大量专业化监测软件,只能由原厂进行开发,如摄像头状态监控软件、存储服务器运行状态信息等。因此,基于云的运维管理工具必须提供基于平台服务模式的标准软件接口,私有云用户可以在平台服务上添加或者开发自己个性化的运维功能模块[4]。
3.2 自动化处理
随着信息系统建设的硬件资源和算力节点的逐步扩大,云计算运维管理的难度与复杂度也日益大幅度增长,这对信息系统运维的自动化能力要求很高,系统运维人员需要自动化处理工具来实现运维管理。自动化管理已然成为当前云计算运维管理的一个发展趋势,因此需要云平台厂商提供负载均衡、动态伸缩、数据迁移等自动化处理方式的服务来满足运维的复杂度和门槛。
3.3 安全管控
云计算虚拟化平台针对不同用户定义不同管理对象,不同的管理对象负责管理不同的区域,系统管理人员针对系统的文件以及用户的文件使用情况等进行管理,主要包括:(1)网络防护。在构建云管理平台时,需要部署网络防护机制,防止针对云管理平台本身进行攻击。(2)管理权限精细划分以及特权行为动态管控。根据不同人员职责的不同,使用不同的权限访问控制方式,对客户端安全进行分级管理。当出现对云计算平台中的服务器、网络设备、虚拟机等设备进行操作时,管控系统应该拦截操作指令,并对其进行判别,防止恶意操作破坏云计算平台。(3)安全管理模块。在构建云管理平台时,需要增加安全管理模块,对云管理平台所管理的基础设施进行监控和防护。通过一系列的安全策略,来控制云服务可能出现的安全问题,保障云平台平稳安全运行。
4 云计算背景下的信息系统运维面临的挑战
4.1 数据安全和隐私
云计算最大的问题是数据安全和隐私。随着云计算不断被采用,风险变得更大,用户无法查看数据在哪里被处理或存储。如果在云管理或实现过程中没有正确处理,可能会发生数据盗窃、泄露、证书被破解、身份验证被破解、账户劫持等风险。
4.2 云迁移和兼容问题
云迁移意味着将数据、服务、应用程序、系统和其他迁移到云。整个过程会消耗大量的时间和资源,当用户从一个云提供商迁移到另一个云提供商时,不得不从头再来,面临的挑战包括故障排除、速度、安全性、应用程序停机、复杂性、费用等。同时,将本地的服务部署转移到云计算时,云计算服务和本地部署基础设施之间,可能会出现不兼容性问题。
4.3 缺乏专业知识
云技术飞速发展,越来越多的服务和应用被发布,以满足不同的需求。然而,很难找到熟练的专业人员来维护云系统。对于中小型企业来说,专门聘请云专家成本很高。云对许多人来说是一个概念,从事运维工作的人并非都熟悉云技术,这需要大量的培训来学习如何有效地使用云技术。同时,运维人员不再直接操作实体资源,而是面对一堆API,问题查找的难度将大大增加。较大型系统涉及的资源(包括横向扩展的弹性计算服务;PaaS平台提供的第三方服务、负载均衡、数据同步等)大大膨胀,资源增长带来的管理复杂度剧增。
4.4 不稳定性因素增加
云产品本身的版本升级或者故障停机带来系统运行的宕机概率增大,当平台进行维护或者故障停机时,用户将面临业务运营中断。无法随时访问数据,业务被迫停止,将会带来极大的负面影响。
5 云计算背景下的信息系统运维的应对
云计算背景下,信息系统运维必须要加强对人才队伍的建设,培养信息系统运维人才。为了满足新形势下企业的信息运维需求,企业应该根据自身需求,合理地规划人才需求计划和招聘计划。根据企业各岗位不同制定不同专业的培训方式和授课方式。开展信息系统运维工作时,主要包括以下几个方面:首先,需要从技术层面进行培训和完善管理机制;其次,要积极参加和组织企业进行人才发展方面的培训;另外,要加强新领域知识应用能力的培训,培养这一块的专业技术人才是关键;最后,要不断加强业务知识学习,增强自身素质,提升能力素质及相关意识。
6 结语
云计算为现代化的运维管理体系带来了新的理念,将传统运维工作中的大量重复性、简单的手工工作通过软件实现,从而使运维人员能有更多精力、条件投入整个服务的生命周期中。当然,云计算也给日常运维工作带来了更多的风险和挑战,因此,应加强对云计算运维管理的要点以及相应改进措施的研究与探讨,不断提高云计算背景下信息系统的运维质量,实现高效的运维管理。
参考文献
[1]周红卫,刘娜.云计算基础设施产品测评框架与测试方法研究[J].江苏通信,2021(6):82-86.
[2]刘小都,苏丁浩.基于云计算环境下的信息系统运维模式[J].通讯世界,2017(20):71-72.
[3]呂静贤,吴刚.有关云计算环境下的信息系统智能运维模式探究[J].百科论坛电子杂志,2018(24):600.
[4]冯安超.云计算环境下的信息系统运维模式探究[J].智能城市应用,2021(3):88-90.
(编辑 沈 强)
Research on operation and maintenance of information system under the background of cloud computing
Jiang Dongshen
(Three Gorges N-avigation Administration, Yichang 443000, China)
Abstract: With the rapid development of navigation information in the Three Gorges, the number and scale of information systems in use and under construction in the Three Gorges Navigation are growing continuously, and the structure of information application is becoming more and more complex. The traditional operation and maintenance mode will consume a lot of human and material resources. According to the survey results on the Gartner website, about half of the information system costs are used for the operation and maintenance management of the system operation period. Therefore, more and more reasonable modes are needed to ensure that the information system services can be flexible, convenient, safe and stable, and continuously guaranteed. Cloud computing technology can solve the problems existing in the process of information system construction and operation and maintenance to a certain extent. This paper introduces the information system operation and maintenance mode in the background of cloud computing, and analyzes the operation and maintenance system and the operation and maintenance management mode in the cloud computing environment for reference.
Key words: informatization; operation and maintenance; cloud computing