智能运维管理平台技术的一体化运维研究
2023-06-25张力影闫永君
张力影 闫永君
摘要:科技与经济的发展带动数据中心不断扩大自身规模,随着系统的复杂程度越来越高,运维管理水平也需要同步增长,但现行智能运维管理平台技术的一体化程度仍然较低,需要进一步开展运维研究。在这一背景下,文章从宏观角度分析了管理平台的架构设计与功能模块,并以高速公路领域为例,对智能运维管理平台技术的一体化运维开展研究,指出智能管理平台能够赋予运维工作以直观性,让整体工作的专业水平得以再创新高。
关键词:智能运维管理平台;一体化运维;互联网
中图分类号:TP391.44文献标志码:A图1数据中心智能运维管理平台软件架构
0引言随着科技进步,物联网、云计算与大数据等技术的实用性不断提高,加上国内数字化转型脚步的加快,中国的数据中心业务增长速度远超其他国家,而业务的增长也带动了数据中心的扩建,越来越多的基础设施维护让监测工作變得日益复杂,对相关人员的管理水平要求也有所上升。若数据中心存在未被发现的隐患,就会威胁IT系统的正常运行,导致数据传输与储存的安全系数降低。而找到维护数据中心基础设施的有效途径成为现在互联网行业的首要任务,而智能运维管理平台正是有效途径之一。
1架构设计
1.1数据中心基础设施主要运维管理问题
相关电子信息设备需要被放置在数据中心运行。根据数据中心的规模与功能不同,可能是建筑物的一部分,也可能是一栋甚至几栋建筑物。单个数据中心分为主机房、辅助区、行政管理区等[1]。
从微观角度来看,新时代背景下出现的大型数据中心与综合型园区的区别并不大,这会放大传统动环监控系统的缺陷。监控系统在设计与应用等方面存在重合与同质化现象,无法根据实际需求调整功能。横跨多栋建筑物的子系统交互存在壁垒,传统监控系统虽然信息化水平较高,却不具备智能化功能。数据采集功能需要分区块执行,综合应用程度低。拓展应用需要大量的成本支撑。管理效率低下,甚至无法实现集中式管理,管理过程也较为复杂。无法实时监控重要设备的状态,不能及时发现潜在隐患,事故预警能力差。
1.2数据中心智能运维管理平台软件将智能运维管理平台应用于数据中心,可以有效解决上述问题,实现一体化运维管理,其具体表现在:
智能运维管理平台能够打通不同建筑内子系统之间的交互壁垒,拓宽数据传输渠道,提高传输的安全系数,便于实现系统的联动控制。借助多协议物联网网关,管理平台能够同时采集不同通信协议的信息,提高采集的兼容性,扩大采集覆盖面,满足设备的个性化需求。智能运维管理平台作为物联网平台的一种,可以快速处理大量数据,在数据中心内部完成采集、储存等工作,再通过专家引擎侦测潜在隐患,及时做出隐患预警,还可以自动积累侦测与分析经验,搭建诊断规则库,在平台内部共享数据,为数据中心和网络设备的建模与挖掘提供基础条件。该平台能够模拟数据中心基础设施的运行工作状态,演练终端运作过程,其架构如图1所示。
由此可以看出,智能运维管理平台包括展示层、应用层与采集层等5个环节[2]。
1.2.1采集层该环节主要负责数据采集,对物联网的应用程度最高。站在器件角度来看,该环节由数个传感网络与感应器件组成,对高新技术的需求量较大,包括射频、无线网络、现场总线等。
1.2.2接入层该环节需要应用网络通信技术与信息设备,逐个接入采集层子系统获取设备参数,包括因特网络、有线网络、IoT网关等,过程中涉及的协议数量较多,如SNMP/OPC和MQTT等。
1.2.3平台层该环节主要处理数据,并对这些数据进行分析与诊断,需要配套的数据引擎。涉及的公共服务组件数量十分庞大,对系统引擎的要求较高。核心技术包括无损实时数据压缩传输等。
1.2.4应用层该层主要用于构建业务,可以完成所有业务管理模块与业务服务,如监控、连接、事件记录、岗位变更、人力调配等。
1.2.5展示层该层能够直接接触用户,是用户与数据中心交互的关键环节,包括可视化大屏、移动终端软件等交互形式,有明显的多元化特点,让用户能够随时随地使用各种方式接入平台[3]。
1.3数据中心智能运维管理平台系统泛用性较高的大型数据中心园区智能运维管理平台系统结构如图2所示。
位于系统中间位置的接入层能够在连接园区与平台的同时,将各个建筑物中的子系统串通为一个整体,并利用园区通信网络,让智能运维管理平台也得到实时数据。此外,系统接入层还能够为这些数据提供智能化应用服务,满足总控中心、物业管理等部门的工作需求,并在物联网与人工智能的帮助下拓展智慧化应用服务。
2功能模块对于智能运维管理平台来说,应用层作为核心层级,是在业务建构基础上搭建完成的,是众多模块中最能体现管理平台智能化水平的部分,其核心功能包括:设施监控、能效管理、容量管理、资产管理、连接管理等。
2.1设施监控通过图形化显示功能实现对基础设施的监控,控制相关参数,对其进行分析,通过可视化大屏实时显示结果,当参数异常时会触发报警器进行告警。其中的告警环节包括警示显示、异常处理与成因分析。
2.2能效管理该功能主要用于监控能源消耗,包括水、电、气等。平台能够全方位优化管控过程,提高系统运作的安全系数与能源利用率,避免无意义的能源消耗。模块分为能源组成与节能诊断等。
2.3容量管理该功能对基础设施容量的针对性较强,能够统计空间、电力等参数,并对其进行部署后展示在屏幕上,拥有建立模型与资源优化等功能,可以大幅度提高容量利用率。模块分为容量的优化、分析与监视[4]。
2.4资产管理该功能能够对数据中心资产设施进行全生命周期管理,包括资产的出入库与变更等。模块分为资产可视化与统计分析等。
2.5连接管理该功能主要用于链接中心设备,避免信息断流,为数据中心提供连续性的数据支撑。模块分为统计报表与配置信息等。
3实际应用——以高速公路行业为例随着路况复杂程度的提升与汽车数量的不断增多,传统动环监控系统已经不能满足管理工作的需求。本文以应用于高速公路机电工程隧道及设备箱的一体化智能监控箱运维管理系统为例,探究智能运维管理平台视域下的一体化运维。
现有高速公路监控箱体内部接线混乱,热源集中程度较高,箱体无法自行发出告警。這一方面不利于维修人员开展工作,另一方面也增加了箱体附近的危险系数。此外,传统动环监控系统的智能化程度较低,不能配合维护人员完成远程检修工作,一旦箱体发生故障,技术人员必须亲自到场解决问题。而使用新型智能运维管理平台能够有效提高检修工作的效率,为维修人员提供“预判—管理—分析”的“一条龙”服务,能够第一时间发现基础设施的参数异常,准确定位故障点,提高处理效率。
3.1系统概述该智能运维管控平台被称为一体化智能监控箱,能够应用于高速公路的道路与隧道。该箱体在传统箱体的基础上接受了智能化改造,获得了实时监控以及故障定位等众多智能化功能,可以保护外接摄像机的安全,并保障情报板的稳定运行。该软件在不影响监控箱与配电箱基础功能的前提下增强了自身的模块化特点,进一步突出相关功能的作用,缩短了系统上传与共享信息的时间,提高了信息的准确性,为交通部门的成本控制与人力资源控制做出了重大贡献。通过使用一体化智能综合箱管理平台,能够让有关人员实时了解智慧运维箱的运行状况与前端设备的供电情况等,大大加强了设备运维的精细化水平[4]。
3.2系统总体设计为解决传统监控箱的众多弊端,在充分考量了现行智能交通系统对物联网的应用程度后,该一体化平台制订了独特的、有一定针对性的设计方案。该方案以IP网络为基础,在RS 232技术的实时监控基础上进行开发,其软件与硬件都以监控服务器端为中心,大大降低了前期安装与后期维护的难度与成本。其中的每个模块都有明确的工作范围,如客户端只与用户界面进行关联。数据处理主体为嵌入式监控主机,若需要进一步增加监控数量或监控范围,可以升级该主机,增加内存,拓展功能,或增加监控主机的数量,能够赋予系统较高的灵活性。系统的主要技术为分布式计算机,能够同时处理网络内部数个一体化智能监控箱所提供的监控数据,系统模块包括智能采集终端与运维管理系统等。同时,系统配备有报警功能,用户可以自行设置报警方式,包括但不限于电脑显示、语音播报、电话或短信通知,以及邮箱或专用App等渠道。
3.3一体化智能监控箱的硬件设计相较于传统监控箱,一体化智能监控箱的硬件结构复杂程度极高,包括智能采集终端、自动重合闸与智能PDU插座等。其中,智能采集终端又包括湿度传感器、继电器与触摸屏等。
3.3.1智能采集终端整体系统都是围绕智能采集终端构成的,该终端能够实现对电压、湿度、基础设施状态、IP等信息的集中显示,能够减轻前段本地检修人员的工作压力,提高工作质效。该系统还配置有预警功能,能够在没有备用电池的情况下对电量参数发出告警。该系统使用ST公司的32位 STM32F103ZET6 芯片,芯片的频率与内容量都能够满足系统长期运作的要求,不需要频繁进行维护。
3.3.2自动重合闸自动重合闸能够有效降低负载短路造成的损失,一旦输出接口出现短路,自动重合闸就会立刻切断其他各路电源;当短路故障恢复或得到修理后,重合闸就会让机器重回正常状态。模块包括断电自动断开、过欠压等。
3.3.3电源防雷器在安装该设备时,需要掌握客观天气需求,并以此为依据选择输出与板卡,尽可能提高防雷器的适应性,让电压能够接受AC 70 V 至AC 250 V 的变化,维持设备运行。
3.3.4智能PDU插座该设备能够避免系统漏电与过欠压,总控制电源的输出与关闭,提高城市电压输入的安全系数。
3.3.5交换模块该设备选用工业级插卡式交换机,能够自动同步手机设备参数,为故障排查与系统优化提供经验。当设备参数波动超出告警阈值时,交换模块会自动重启设备,工作人员也无须前往现场,通过智能管控平台即可操控开关,将运维成本维持在可控制范围,也降低了故障维修的时间成本。
3.4智能运维管理系统3.4.1智能运维管理系统简介该系统主要针对的是智慧交通隧道工程与外场设备运维管理,可以直接应用于隧道管理站,且监控分中心也能够通过该系统进行高效办公。在系统启动后,网络内部的前端摄像机、微波车检与情报板等设备的运行参数能够被实时同步到工作人员手中,监控工作具备一定的全面性与准确性,确保设备能够长时间执行高精度的运维工作。此外,工作人员既可以通过系统查阅基础设施参数,也能够对设备进行远程控制,相较于传统箱体需要人工检修的缺陷,该系统大大提高了运维效率与检修安全系数,对交通部门的成本控制工作有较大的促进作用,让运维变得“可视”,让整体工作的专业水平得以再创新高。
3.4.2系统功能智能运维管理平台的搭建必须充分考虑对应高速路段的监控特点,明确交管部门的未来发展方向,融合物联网等通信技术,在拓宽功能的同时不断提高性能,让系统的实用化水平保持在巅峰状态。
4结语随着经济与社会的进步,智能化科技水平不断提高,面对越来越复杂的网络环境与工作需求,各个领域都要充分发挥智能运维管理平台的作用,弥补传统监控系统的缺陷,提升工作的质量与效率,实现一体化运维。
参考文献
[1]宋志杰,邹铁汉,张韦微.焦作科瑞森重装股份有限公司 坚守输送主业 专注制造创新——智能运维管理平台[J].起重运输机械,2022(17):2-5,92.
[2]万溧,蒲泽伟,吴敏,等.基于云架构的智能微网群智能运维管理平台设计[J].西藏科技,2021(7):34-37.
[3]徐友恒.数据中心一体化智能运维管理平台建设研究[J].中国管理信息化,2021(18):105-106.
[4]衷兆程.上海地鐵隧道设备智能运维管理平台设计与开发[J].上海国土资源,2020(2):97-100.
(编辑 李春燕)
Research on the integrated operation and maintenance technology based on the intelligent
operation and maintenance management platform technologyZhang Liying, Yan Yongjun
(LuXun Academy of Fine Arts, Shenyang 110004, China)Abstract: The development of science, technology and economy drives the data center to enlarge its scale continuously. With the increasing complexity of the system, the level of operation and maintenance management also needs to increase at the same time, the intelligent operation and maintenance management platform is an important means to improve the level of operation and maintenance management. Based on this, this paper analyzes the structure design and function module of the management platform from the macroscopic angle, and takes the expressway field as an example to study the integrated operation and maintenance of the intelligent operation and maintenance management platform technology, in order to help improve the operation and maintenance level of various fields.
Key words: intelligent operation and maintenance management platform; integrated operation and maintenance; Internet