企事业单位数据中心运维管理分析与研究
2019-09-24杨高攀严鹏飞
杨高攀 严鹏飞
摘要:本文以企事业单位的数据中心运维为讨论对象,通过对数据中心及运维相关内容的研究,对比了其与互联网企业运维的异同,结合现阶段企事业单位的运维存在的问题,综合笔者在运维过程中的经验,对企事业单位的运维提出意见和建议,希望对于此类运维提供一个有意义的参考。
关键词:数据中心;主机房;运维管理;ITIL
中图分类号 TP308 文献标识码:A
文章编号:1009-3044(2019)21-0026-03
开放科学(资源服务)标识码(OSID):
Abstract: Based on the enterprises and institutions of the data center operations and maintenance,through the research of the data center and the relevant contents of the operation and maintenance, this article compared the similarities and differences of its operations with the Internet enterprises. Combining with the present problems existing in the operations of the enterprises and institutions, integrated the author ‘s experience in the process of operation and maintenance , this article put forward opinions and Suggestions for the operations and maintenance of enterprises or institutions. This article is aimed at providing a meaningful reference for such operations.
Key words: Data center; Computer room; operation and maintenance management; ITIL
信息化为中华民族带来了千载难逢的机遇,随着互联网、云计算、物联网、大数据等现代信息技术的发展,科技创新日新月异,以数字化、网络化、智能化为特征的信息化浪潮蓬勃兴起,信息技术已然对国际政治、经济、文化、社会、军事等领域产生了深刻影响,在与生物技术、新能源技术、新材料技术等交叉融合过程中,正在推动产业变革并促进工业经济向信息经济转型,信息化已是经济社会发展的重要支撑和引擎,已经从传统幕后的支撑角色转变为前台的引领角色,可以说,没有信息化就没有现代化,而数据中心作为信息化的基石,受到越来越多的关注和重视,没有数据中心就没有信息化。数据中心要充分发挥其基础保障及支撑作用,除却优良的规划设计与建设外,就离不开完善充分的运行与维护,所以本文以企事业单位的数据中心运维为讨论对象,通过对数据中心及运维相关内容的研究,对比了其与互联网企业运维的异同,结合现阶段企事业单位的运维存在的问题,综合笔者在运维过程中的经验,对企事业单位的运维提出意见和建议,希望对于此类运维提供一个有意义的参考。
1 数据中心与运维内容概要
1.1 数据中心
数据中心(Data Center)是为集中放置的电子信息设备提供运行环境的建筑场所,可以是一栋或几栋建筑物,也可以是一栋建筑物的一部分,其由主机房、辅助区、支持区和行政管理区等功能区组成。主机房(Computer room)是主要用于数据处理设备安装和运行的建筑空间,包括服务器机房、网络机房、存储机房等功能区域。数据中心在建设规划初期就应根据本单位所处行业、使用性质、数据丢失或网络中断在经济或社会上造成的损失或影响程度确定所属级别,数据中心分为A、B、C三级,A级为“容错”系统,可靠性和可用性等级最高;B级为“冗余”系统,可靠性和可用性等级居中;C级为满足基本需要,可靠性和可用性等级最低,这三级的定位是向下涵盖关系,在数据中心建设过程中还要综合考虑安全、设备运输、管线敷设、雷电感应、结构荷载、水患及空调系统室外设备的安装位置等问题进行综合分析和经济比较,当数据中心按要求建设竣工验收后,运维部门的重点工作就是对其中所有的基础设施和电子信息设备进行运行与维护。
1.2 运维
运维是对运行与维护的简称,其核心工作及基本的职责是保证业务系统稳定、可靠、安全、高效地运行,价值体现在质量、成本、效率、安全。运维工作在不同企业的不同发展阶段,有着不同的定位和职责,例如互联网企业的运维就有网站运维、系统运维、网络运维、数据库运维、IT运维、运维开发、安全运维等方向,其已技术为主,管理次之。而在企事业单位的运维中,其运维工作通常由特定的运维部门完成,该部门会同时承担业务工作和运维工作,其运维的主要任务在于管理,技术次之。
2 运维的发展阶段、分类及相关内容
2.1 运维发展阶段
有专家学者将运维的发展阶段与人类社会生产发展阶段进行类比,大致由“农耕时代”“工业时代”“信息时代”“智能时代”对应数据中心运维的手工运维、自动化运维、数据化运维、智能化运维。在手工运维阶段也即运维的农耕阶段,由于企业信息化规模较小且技术单一,企业的运维水平往往取决于团队中核心运维人员的经验,以人为运维机制核心。在自动化运维阶段,通过各类运维工具去解决效率低下、操作不规范等问题。例如通过使用自动化监控类工具对数据中心的基础设施和电子信息化设备的运行数据进行收集并分析。使用各种ITSM系统、CMDB系统、APM等专业工具进行运维支撑服务以及配置管理。在数据化运维阶段,主要将前一阶段积累的数据进行整理,并结合云计算、大数据分析等专业技术,对运维数据进行多维度分析,发现以前各阶段均未能发现的问题,注重于分析與预测。在智能化运维时代,则是充分将AI人工智能引入运维过程,让数据中心实现自我学习、自我管理,人只是作为AI的辅助而存在。
2.2 运维的形式
数据中心运维主要有三种形式,即自主运维、外包运维、自主与外包相结合的运维。由于数据中心内各类设备的专业度与集成度越来越高,只凭企业内部的运维人员几乎不可能能将所有类型设备的维保任务全盘接下,另外供应商在提供设备的同时会附带有限的维保服务,所以现在大部分企业采用自主与外包相结合的运维方式,把专业的事情交给专业的运维服务提供商去做。
2.3 运维的工作方式
现阶段主要有两种即驻场运维和远程运维(包含现场巡检)。驻场运维即在数据中心现场办公,运维人员对数据中心内部的所有基层设施和电子信息设备进行性能检测调优、故障排除、设备维修更换、系统升级及日常检查等多种类型的工作。远程运维与驻场运维的区别仅为办公地点的不同,工作内容则相同。
2.4 运维人员的角色
运维工作主要是人的活动,运维人员的角色主要有两类即管理人员和实施人员,在互联网企业中这两类角色的界限较为明显,例如运维经理、应用运维、系统运维、运维研发、数据库运维、运维安全等,但在企事业单位中这两类角色的界限不是很明晰,运维人员多身兼数职,既是管理者又是实施者。
2.5 运维人员的技能要求
运维人员的技能要求主要有两方面,即管理能力和专业技术,由于运维所接触的知识面非常广且杂,所以这两类角色有其共同的特点,即要求运维人员具备很好全局思考能力,能够对运维过程中各层面问题进行分析并提供解决方案,对于企业内部的业务、应用、架构全面了解并熟悉。在互联网企业多侧重于运维人员的专业技能,而传统的企事业单位则侧重于其管理方面的能力,但随着近年来大数据、云计算、物联网等信息化技术的发展,企事业单位中对于运维人员的要求也越来越注重其信息化方面的技术能力,并竭力培养其管理与技能兼有的复合型人才。
3 企事业单位数据中心运维现状
3.1 硬件设施较差
目前我国众多的企事业单位中,由于历史原因和投资成本等诸多因素影响,造成其数据中心甚至连C级也达不到,又由于总体拥有成本的限制,不可能及时地对数据中心进行升级改造,基础环境现状跟不上越来越复杂的业务应用架构需求,设备、组网、网络安全等设备和技术均老旧,无法适应新兴技术对于硬件性能和资源的要求。
3.2 信息孤岛
现阶段企事业单位中各业务部门对于信息化的需求愈来愈高,自建应用系统越来越多,架构越来越复杂,很多企事业单位中出现有多少个部门就有多少个信息系统,每个信息系统都有自己的数据库、操作系统、应用软件、硬件设备,完全是独立的体系,数据不共享,造成数据的重复建设,无法形成本单位统一的数据标准,造成人财物和数据资源的浪费,同时也不利于后期的大数据平台建设。
3.3 运维管理体系不健全
企事业单位缺乏符合本企业所隶属本行业的专业的信息化规划,及运维管理体系相关标准,重业务轻信息,未把信息化放在引领业务的地位,这与运维部门在企事业单位中长期处于的地位不高有一定关系,企事业单位的决策层认为只要做好本职主业才是正道,对于信息化的重视程度远远不够。
3.4 运维队伍配置不合理
由于现阶段我国很多企事业单位的信息化部门定位为服务性质的部门,角色方面属于后台支撑的角色,地位还很低,运维人员多充当救火员的角色,非专业人员对运维人员的看法一般属于运维工作中的一个非常小的职责,例如解决办公方面的小问题。但是从运维工作性质方面看,进行基础设施运维工作的人员,按专业主要包含电气、暖通、弱电、安防等;进行电子信息设备运维的工作人员,按专业主要包含服务器、网络、信息安全、软件工程等。另,数据中心配置人数应该根据数据中心的规模、本单位人才规划及信息化发展规划来确定,但在实际中信息化人员普遍偏少,人员偏少后自然会带来专业配置的不合理。
4 应对策略
4.1 加强信息化基础管理
在企事业单位的信息化基础管理方面,首先按照标准化、流程化、平台化、自动化、智能化的逻辑进行构思,完善制度体系,全面提升信息采集、处理、传输、利用、安全等能力。加强信息资源规划、建设和管理,创新部门业务系统建设运营模式,提高资源利用水平。制度体系建设的内容方面,应包含运维服务制度、流程、组织、队伍、技术和对象等方面的内容,整合运维服务资源,规范运维行为,确保服务质效,形成统一管理、集约高效的一体化运维体系。
4.2 运维工具的应用
工欲善其事必先利其器,在应用工具方面,企事业单位可以应用商用的或开源的运维管理平台,通过引入各种ITSM系统、CMDB软件系统、APM等专业工具进行运维支撑服务以及配置管理;通过引入ITIL这个基于行业最佳实践的框架,将事件管理、问题管理、配置管理、变更管理、发布管理、服务级别管理、IT服务财务管理、IT服务持续性管理、能力管理、可用性管理等将本企业内部的“服务提供”流程组和“服务支持”流程组进行梳理并固化。
4.3 优化人才队伍
高素质的运维团队。运维不是一个人一个部门就能完成的事情,运维涉及电气、暖通、弱电、安防、服务器、网络、信息安全、软件工程等众多专业知识,这一項复杂的系统工程,具有高科技、跨部门、长期性的特点,所以要加强运维人员的综合专业素质培养,同时提升其管理能力。在选人用人上企业一定要造就一批领军人才、壮大专业人才队伍、完善人才激励机制。
4.4 数据中心升级改造
加大数据中心资金投入,在基础管理、应用工具、人才队伍等基础稳固的前提下,企事业单位可根据本单位财力状况适时进行数据中心升级改造,改造时要兼顾业务和新兴技术的应用,尽早地将数据中心这个基础瓶颈突破。
5 结语
综上所述,本文对数据中心及其运维的概念进行分析研究,结合企事业单位在运维过程中存在的问题,提出了应对策略,企事业单位只有将信息化放在引领业务的突出位置,释放信息资源红利,加强基础管理,加大资金投入,优化人才队伍等方面做出努力,才能真正让信息化引领业务,并在新一轮的市场竞争中取得一席之地。
参考文献:
[1] GB50174—2017,数据中心设计规范[S].
[2] 陈明, 田健, 杨爽. ITIL在信息化运维中的应用分析与研究[J]. 城市建设理论研究(电子版),2018(11):186-187.
[3] 陶珮, 王怀宇. 基于ITIL的IDC服务运营体系的应用研究[J]. 科技与创新,2018(3):125-126.
[4] 张亚军, 张金隆, 陈江涛. IT服务管理研究评述及未来展望[J]. 情报杂志,2013,32(6):95-99.
[5] 胡佳胜. 高等学校公共机房管理存在问题与对策[J]. 科学技术创新,2018(29):96-97.
[6] 张志慧. 刍议高校计算机实验机房系统的维护策略[J]. 2016(36):113-115.
[7] 王健新. 形势下高校公共计算机机房管理和维护探析[J]. 计算机产品与流通,2018(8):241.
[8] 费晰, 胡璋, 杨海. 关于提升卫星发射中心远程数据机房运维保障水平的若干思路[J]. 中国航天,2018(6):31-33.
【通联编辑:王力】