APP下载

英特尔助力智能数据中心运维

2021-01-06

网络安全和信息化 2020年12期
关键词:机柜功耗运维

随着“新基建”的落地实施,数据中心作为重点发展的领域,其建设与运维的发展趋势、最新技术正在受到企业级的关注。越来越多的企业选择拥抱云计算。在云化转型之路上,选择架构灵活、减少业务成本的代价就是运维复杂程度大大增加,给运维人员提出了巨大的挑战。

数据中心运维面临的主要挑战就是数据中心效率与成本的协调问题。比如,企业管理数据中心通常采用人工定时巡检的方式,巡检人员按照排班时间检查服务器LED 灯状态,从而判断IT 设备是否运行正常,但人工的服务器巡检费时费力令企业的运维成本居高不下,且无法实时反映服务器健康状况;互联网企业数据中心通常分布在流量较高的城市节点,单个数据中心部署的服务器数量超过几千台规模,通常在企业办公地点设立运维中心,安排运维人员对所有城市的设备集中管理,每位运维人员管理动辄上千台的服务器设备,工作强度非常高,数据中心服务器太多,有没有什么方法,能通过一台电脑就可以实现对整个数据中心的管理和检测呢?数据中心日常运维中,如何管理IT 设备尤其是服务器组件级的资产信息,这些资产信息不仅仅是财务部门的成本管理,也必须对诸如内存、硬盘、CPU 等组件的型号、数量、更换、保修信息等进行管理,这将体现数据中心运维管理水平和大数据采集分析等一系列能力。

要想回答这一系列数据中心运维的难题,企业需要在运维中加入一大利器——IT 设备的智能运维。智能运维使数据中心运维既保障高质量与高效率,又可以保持较低的运营成本,完美解决了困扰企业的难题。这里为大家分享数据中心管理案例供大家参考。

某电力行业国企,近一年开始全面部署国内云厂商提供的混合云方案,大规模外包数据中心运营服务。但是,随之而来的困扰是:自家数据中心的可用性及可靠性完全取决于云服务供应商的云平台。服务器等IT 设备运行状态、健康状况、数据中心耗电、用电安全等运营基础信息靠云厂商的带内方案,并不能得到保证,需要更可靠的工具。该企业经过认真仔细的调研,决定采用Intel DCM 作为带外管理工具,从另一角度弥补云服务方案必须基于业务网络的天然不足,从而满足了该企业IT 管理人员的需求。

某互联网头部企业是一家混合云ICT 厂商和服务商,为方便为客户提供优质的服务,他们在国内各业务核心区域部署大量服务器,运维中心设在北京,他们将各区域管理网络打通,并在管理网内部署了Intel 数据中心管理软件平台(DCM)替代人工巡检实现潜在故障和硬件自动告警,Intel DCM 通过带外网络,无需安装托盘程序即可自动采集IT 设备温度、功耗、健康状态、告警、资产信息等信息,并且对信息按照类型梳理及聚合,从而提炼出精准的数据,便于运维人员实时查看数据中心整体运行状态,及时发现潜在硬件风险并尽早制定应对措施。

远程监管服务器设备更换部件及维修,也是远程管理数据中心的痛点,现场维修人员执行时间不准确,更换备件后核对信息耗时、费力等问题困扰着运维人员,通过使用Intel DCM 的智能资产监管功能,帮助用户自动发现并记录服务器设备资产详细信息,包括CPU、内存、磁盘、网卡等部件厂商、规格、型号、频率等信息。用户通过与CMDB 中设备采购信息对比,可以便捷的核实采购资产的使用变化情况。另外,DCM 也为用户提供实时发现资产监视能力,DCM对服务器资产定时扫描并与历史信息比对,当发现资产信息变动,将自动产生告警信息,运维人员只需按照告警提示查看更新内容即可完成维修工单的核实工作,大大提升管理效率。

除自建数据中心外,为了快速完成产品和服务部署上线,企业租用IDC 机房空间部署服务器设备,租用合同通常会约定机柜瞬时电流上限,若瞬时电流超出上限,IDC 机房将额外征收费用。如果仅仅为满足电流约束而减少机柜中设备数量,机房租金平摊到每台设备的费用偏高,如何平衡这两方关系也是运维团队和IT 团队面临的问题。Intel DCM 的智能功耗控制功能为这类使用场景提供便捷的解决方案,以下是用户的实践案例:用户按照服务器的实际功耗部署服务器到机柜,并按照与IDC 合约要求在DCM 软件中设置机柜功耗控制阈值,当服务器因瞬时处理任务增加导致功耗上升并试图超越功耗阈值,DCM 智能功耗控制功能将自动触发,此时机柜中的每台服务器将按照预先设定的优先级被强制降低功耗,确保机柜整体功耗低于阈值要求。在此案例中,通过在DCM 软件中设定机柜功耗控制策略,保证在任何业务处理阶段,机柜整体功耗不会超出合同约定,避免不必要的经济损失;另一方面,机柜中的服务器可以按照优先级被控制功耗,优先级较高的设备可以满载、全速处理业务需求,优先级较低的设备将被短时间内限制功耗的使用,从整体来看即便在突发的业务处理高峰时段,机柜的功耗被控制在期望的范围内,并且业务服务和数据吞吐能力不会受到影响。

Intel DCM 是一个将带外管理功能发挥极致的数据中心智能管理解决方案,有别于带内管理、虚拟机和云操作系统的服务器管理方案,Intel DCM 将管理目标集中于IT 设施的物理特征,汇集了英特尔在智能数据中心运维上多年的经验,是通向数据中心优化及敏捷管理之路上的绝佳伴侣,同时也为企业管理TCO 提供又一利器。

猜你喜欢

机柜功耗运维
门槛可拆卸式机柜车载运输工况的仿真分析
基于任务映射的暗硅芯片功耗预算方法
高速公路智能运维平台
通讯基站柜内空调的传热传质模拟分析
智能+时代的新运维
——2019(第十届)IT 运维大会特别报道
揭开GPU功耗的面纱
配电线路的运维管理探讨
安全级仪控系统机柜状态监测报警设计
钣金结构的机柜设计
环保之功,从主板做起