APP下载

构建3D机房运维可视化系统

2020-10-09茹军徐浩

信息化建设 2020年6期
关键词:机房运维可视化

茹军 徐浩

构建智能化的机房运维管理系统,保障机房中的设备高可靠运行,使机房运维和管理在日常工作变被动为主动,将出现的问题做到早发现、早解决,提前预警。

机房是政府机关企事业单位的数据核心和网络安全重地,是数据中心的物理存放单元,一旦网络等重要设备出现故障,会导致数据传输和存储出现异常,严重的情况下,甚至会导致数据的丢失和一些关键设备报废,产生不可估量的损失。这给机房及网络运维管理带来巨大挑战,完全依靠传统人工监测、排查已不可行。如何构建智能化的机房运维管理系统,保障机房中的设备高可靠运行,使机房运维和管理在日常工作变被动为主动,将出现的问题做到早发现、早解决,提前预警,提高对网络设备智能化监控能力等方面值得深究。

建立3D机房运维可视化系统,实现自主运维

调研发现,目前机房日常运维管理存在着几个主要问题:一是无法实时掌握关键设备的运行状态,导致出现网络中断、网络服务停止等情况无法及时处理。二是机房管理工作不到位,容易产生人工误操作造成机房设备损伤和损坏。三是机房管理存在安全隐患,可能出现因环境或人为破坏因素对机房设备产生破坏。四是管理工作繁琐,没有统一管理平台,管理人员不能有效地管理机房设备。

基于以上原因,建立一个直观、高效的机房运维管理系统变得非常迫切。因此,为探索机房的3D可视化智慧监管,浙江省林业信息宣传服务中心针对以上问题“开展3D机房运维可视化系统”试点建设,通过采用3D虚拟现实技术,在三维环境中构建机房环境、资源、设备和监控管理信息的机房运维可视化平台,实现对机房和各类设备的智能可视化管理。管理人员可一目了然地掌握设备的运行状态及当前各项性能指标、业务运行状况、资产使用情况、IP地址使用情况等信息,从而实现主动式、自动化、统一化的运维工作方式,为机房智能化监管的探索解决方案。

打造机房智能运维系统,提升智慧预警

打造机房智能运维系统,需要建立一体化监控、统计报表、故障管理、评估优化、大屏整合管理等五大系统。

监控体系是整个机房运维系统的核心。监控系统能对其多个因子实现集中监控和管理,实现24小时无人值守,节省人员财力。有告警时可以根据告警的不同级别,通过不同的颜色标识告警的设备,在告警的设备上悬浮显示告警图标,并能查看具体的告警信息。同时可以实现短信、邮件等多种方式结合发送,保障运维人员能够实时获取异常信息,系统将会告警通知到对应运维人员,确保告警得到及时处理。

与以往人工巡检相比,一体化监控系统主要有两大优势:其一是故障告警实时性提高。以往人工巡检为每天4次,无法实现24小时不断巡查,往往要在接到求助电话后才去排查,并花费时间去查找故障位置。而通过监控系统,设置的轮询时间为1分钟,即当设备、网络出现故障后,最晚1分钟就可以监测到故障位置并短信报警。其二是故障检测时间减少。以往用人工检测的话,每个设备需要大约30秒,总共需要15分钟左右。而通过监控系统系统巡检,只需要登录设备状态页面,就能一眼看出设备总体状况

统计报表体系提供了运行状态报表、流量报表、故障报表等内容丰富的报表模板,可以从资产/资产组、性能指标、时间段三个维度进行选择,生成自定义报表。报表以柱状图、饼状图、表格、趋势曲线图等形式展现,并且可以pdf、word等文档形式导出,为运维管理工作总结、改进决策、编写报告,提供客观、详细、全面、可靠的数据支撑。

故障管理功能可以通过SNMP、NetFlow、WMI、SSH、Telnet、JDBC、API等协议,实现对主流厂商服务器、交换机、路由器等设备的关键指标进行365×24小时集中、统一监控。监控内容包括:设备概览(IP地址、接口总数、版本信息、响应时间、系统可用性、CPU利用率、内存使用率等),网络状况(上传速率、下载速率、接口状态),告警(告警统计、告警列表),日志(日志分析、日志查询),TRAP等;

设备监控功能可以对监控对象的关键性能指标的阈值进行灵活设置,系统会将监控到的性能数据与设定的阈值进行对比分析,在第一时间内将故障位置和故障详情通知运维管理人员,并记录其相应的告警事件,做到事件可追溯。运维管理人员及时发现和分析设备故障,及时排除设备故障,帮助摆脱被动式的运维局面,保障机房运维过程有据可依。

监控平台支持日志分析评估功能支持日志全文检索和关键字检索,可以根据指定时间范围内,对日志内容、日志级别进行统计与分析。通过评估优化体系使得运维人员可以在定期的时间内发现不足的地方,更好地优化网络配置。

大屏展示系统提供设备类型统计视图、告警统计视图、响应时间视图、流量排名视图、TopN等综合视图,为运维人员清晰、直观地展现运维数据,快速了解设备的整体运行状态,实现随时浏览机房的日常情况。

构建三维可视化管理体系,助力智慧监管

以三维虚拟仿真的最佳形式实现对机房的真实展现,体现其各类保障能力,实现基于三维环境对其运行情况进行实时监控,构建一个立体式、可视化的机房綜合管理系统。

机房环境可视化仿真。根据机房实际布局情况建立全三维的完整场景,包括机柜安装布局摆放情况、配线桥架的走向、静电地板、玻璃隔断、机房门及配电设备、空调设备、UPS、监控设备环境等辅助设施布局摆放情况都按照实际位置、品牌、样式在系统中展示。

设备资产可视化管理。根据机房设备资产情况,进行3D建模,实现在三维可视化环境中进行设备上下架操作,运维人员能够像在真实机房对设备上架一样,在三维可视化系统中预演设备上架过程,设备上架后,设备的型号、房间名、机柜、U高等基本信息能够自动关联,自动赋予上架设备基本的属性信息,实现设备资产上架、下架、迁移的自动化管理。同时,提供历史跟踪和查询记录,完善信息资产管理档案。

机柜容量可视化展示。对机房的U位空间进行以3D形式做可视化展示,用色彩分割展现不同容量范围的机柜空间,并能对查看范围内的U位空间容量进行统计,显示总空间、已用空间和使用率等指标。

动环情况可视化监控。动环监控可实时监控机房的精密空调、功耗、温湿度等信息,在3D设备上展示精密监控数据和告警数据,自动统计机房总功耗容量,目前功耗状况及剩余容量。管理员可依据监控情况调整精密空调运行方式,有效降低PUE值,推进节能降耗。

配线走向可视化管控。配线走向可视化管控能够管理各种网络设备、服务器间的所有的配线关系。根据设备的跳线数据自动通过算法绘制网络三维链路,以动态的三维效果呈现整条链路的连接情况,实现机房配线管理的可视化。该功能极大方便了运维人员进行网络拓扑调整、网络故障排查等工作。

机房虚拟漫游。机房虚拟漫游实现机房3D实景虚拟漫游,在三维场景中第一人称视角浏览数据中心全貌,可以不用进入机房就能够浏览其场景结构布局,掌握设备信息。

在机房运维管理过程中如何及时发现运行风险,是运维管理工作关心的永恒话题。3D机房可视化系统可以提前发现问题,给出告警,并且准确在三维场景中定位故障设备位置。通过完善的监控系统可以大大避免很多故障,同时在事后故障分析中,3D机房可视化监控系统的各种技术参数和记录依然是可供分析的重要资料,通过对这些监控记录很可能可以找出故障的原因。

随着信息化技术的不断迭代更新,机房智能化监控能力需不断增强,进一步提升机房运维管理水平,使运维管理工作越来越完善。浙江省林业信息宣传服务中心将基于现有调研及探索建设成果,继续深入研究3D虚拟现实技术在智慧机房中的应用,以智慧化机房安全监管,切实推动林业信息化、现代化、智能化进程。

(作者单位:浙江省林业信息宣传服务中心)

猜你喜欢

机房运维可视化
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
运维技术研发决策中ITSS运维成熟度模型应用初探
“融评”:党媒评论的可视化创新
基于ITIL的运维管理创新实践浅析
N通信公司机房节能技改实践
新型有线电视机房UPS系统的配置
大功率发射机房冷却送风改造
谈有线电视前端机房的防雷接地