大数据时代下的数据中心运维管理
2021-12-01王彧尹之伊
王彧 尹之伊
浙江威奇电气有限公司 浙江 海宁 314400
引言
数据中心产业发展情况,深入剖析数据中心预制化、智能化、能源储存和能源再利用等热点技术的优劣势、发展现状、应用前景以及存在的问题和需要关注的重点方向,总结数据中心基础设施技术发展趋势,为数据中心从业者研究、应用相关技术提供参考。
1 概述
1.1 数据中心新特点
数据中心作为海量数据存储、计算和汇聚的中心,除了绿色化、模块化等特点外,在新基建浪潮下呈现出如下新的变化特点:一是体系一体化。加强国家大数据中心一体化建设是实施网络强国战略的重要实践之一。全国一体化数据中心建设,将通过数据中心与云计算资源的分级互联,以技术、业务和数据等三个融合,支撑政企、行业、区域、业务的协同管理和服务,实现政府决策科学化、社会治理精准化和公共服务高效化。二是运维智能化。随着云计算、人工智能等新技术的普及,数据量级飞速上涨,数据中心规模不断扩张,设备数量呈倍数增长。因此,统一管理海量设备,提高运维效率,成为大数据中心亟待解决的问题。基于人工智能和大数据技术的智能运维将部分取代人力的重复烦琐劳动,监控和管理潜在的安全问题,变被动人工运维为主动智能运维。三是部署边缘化。我国移动网络通信技术的迅猛发展,迫切需要VR/AR、自动驾驶等业务场景低时延、多连接,集中式计算处理因遇到难解的瓶颈而难以满足上述业务需求。边缘数据中心可提供存储、计算、网络等资源,更好地支撑低时延等业务场景,因而将成为有效解决方式。
1.2 大数据时代信息化管理作用
信息化管理指的是相关单位应用计算机技术在大数据时代,保证有效的规范自身行为。计算机网络技术能够管理外部信息,收集相关单位内部信息。由此可知,信息化管理在相关单位中起着重要的作用。第一,可以提高相关单位查找信息的效率,加强核心竞争力。科学技术快速发展,相关单位在大数据时代若想通过计算机网络技术构建优质的管理系统,则需要相关单位收集自身相关的指标,通过有效整合获取信息资料。相关领导人员可根据核心资料内容掌握单位人力资源管理的状况,有效规划相关工作内容,保证工作人员开展工作更加顺利,同时也能够将对应的数据资料作为相关单位发展的依据;第二,计算机技术能够使信息化管理打破时间、地域等因素的约束。相关单位应用计算机网络技术能加速收集、整理核心技术的效率,此种操作可以使相关单位提高管理效率,推动相关单位发展。计算机网络技术能够打破管理的时间束缚和空间束缚,工作人员在管理过程中,通过网络便能够查询、收集资料,从而实现有效的控制管理。此种情况也便于管理人员在网站及时找到信息资料,做出相关决策。在某种程度上,单位只有紧抓机遇,才能够加强核心竞争力,提升经济效益;第三,计算机网络技术应用在信息化管理中能够有效整合,提高相关单位经济效益。为让单位获取最大化效益,相关单位需要有效的整合外部和内部的信息资料,在大数据时代,单位需要具备处理数据的能力,构建信息化管理体制,加强处理数据的能力。应用计算机网络技术,大批量处理数据信息,从而获取有效信息,推动单位发展[1]。
2 数据存在的问题
大数据背景下数据质量管理存在的问题大数据背景下的数据和传统数据大不一样,给数据质量管理带来了如下困难。①大数据种类繁多决定了数据来源具有复杂性。数据源之间因结构不一、来源多样、众多不同,出现了不一致、冲突或自相矛盾的情况。在收集数据时应尽量保证数据质量的可靠性和数据定义的完整性。②大数据由于容量大,在获取、存储、计算和传输过程中会产生许多错误。由于速度极快,大量的数据更新会迅速产生过时的数据,不一样的数据也极易产生。目前仅靠传统的、简单的程序匹配处理和人工数据错误检测、修复,根本不能处理大数据下的数据错误问题。③由于门类众多、规模庞大,发展迅速,各类数据的标准不完善,使其可能产生冲突或不一致。另外,数据的收集和集成通常由不同的团队合作完成,这也增加了处理数据时产生错误数据的概率。④在进行数据的质量管理工作时,由于大数据自身的特点,为确定其时间、空间的复杂程度,需采用线性和亚线性算法,并结合并行算法才能提高运算效率,得到最好的管理算法,这样计算的难度大有提高[2]。
3 大数据平台网络安全建设和运维的具体策略
3.1 科学合理应用现代运维技术
大数据平台的出现,不仅会给整体经济发展带来积极价值,同时也会带来诸多挑战。然而,很多数据中心的运维管理工作必须随着时代的变化而不断创新。根据目前数据中心建设和运营中心建设的阶段,一定要从解决信息问题的角度出发,运维团队管理者应该有多种方法进行自我优化和管理。在现代技术维护方面,通过实施整改使之彻底改变,才能不断有效地提高运维管理效率。例如通过智能电力传输,控制好国内大型电网平台的运行,让多主体软件系统的运行联合,电力企业主要有两种合作方式:一种是交叉合作,另一种是平行正式合作,通过代理商之间的沟通与合作,可以很好地实现代理商与代理商之间的信息共享。另外,多智能新系统可以实现智能电源网络中各种相关信息的全面、深入分析。利用智能数据里的纵向和横向关系合作,达到同级代理商共享数据资源的结果。最后,电力企业可以利用智能输电的方法全面掌握所有用户的用电情况,而电力用户也可以利用供电网络的智能化应用系统,自己独立查询供电问题,全面了解电价价格、能源公司供电方式的综合能力等信息,进一步保护了终端客户的合法用电利益。
3.2 加强数据安全风险防范
一是提升数据安全风险监测技术能力。充分利用数据中心强大的资源共享和运算能力,形成风险监测预警机制,反映数据中心数据安全现状与风险趋势等态势情况,明确数据安全风险防控着力点。二是提高数据安全风险防范能力和意识。加强数据安全风险防范,关键在人才,基础在教育。目前我国数据管理、开发和运维人才极为短缺,难以满足数据中心产业发展需求。一方面,完善数据安全专业人才培养机制,依托高校、科研院所等机构开展数据安全相关研究项目和教育培训,提升数据安全重要性;另一方面,加强国民通识教育,让数据安全教育深入全民,培育公民数据安全意识。
3.3 监控监测告警
主要通过各种管理协议和管理接口适配,实现各类管理对象的管理信息采集和运行状态感知,收集高质量、可信和准确及时的信息,提供对上层运维服务的支撑,保障业务流程的有效运行,所管理的对象包括:网络、服务器、存储、安全、机房动力环境及应用服务系统等。传统的配电监控系统一般用于监控高低压配电设备、变压器及电容器等运行状态,允许通过远程的方式遥控开关、变压器档位,对保护故障进行复归。因对安全、响应及保密要求更高,配电监控系统使用专用协议,配置单独的管理型工业以太网交换机,网络也需要物理隔离。超大型数据中心的配电监控可在负荷搬运、一键处理等自动化方面进行拓展。具备负载投退通过调整开关动作顺序减少负载对电源侧的冲击;外市电停电时根据业务负载功率启动与之匹配的柴油发电机组数量,缩短故障应急时间;针对不同事件场景,通过预先设计的程序,实现一键处理等功能[3]。
3.4 数据质量处理
经过存储、评估、预处理和清洗后的数据达到了有关技术标准的相对质量要求,我们称之为合格数据,但是难以仅靠上述有关方法就能获得非常理想的数据。随着时间的推移,许多数据一直在变化,需要对此进行反复修改。所以将处理后的数据更换到标准库中,同时需要反复循环处理这些数据,这样得到的结果才更有效、可靠。①更新合格数据。大数据背景下,大量的数据通过有效处理变为合格数据,然后根据优先级上传到数据库中。然而,由于数据时效性的原因,大部分的数据永远达不到绝对合格。因此要不断进行优化更新,对大数据进行循环质量管理,才能保证其正确可靠。②数据监控反馈。一般情况下,会存在多组数据描述同一事物的属性,因此需要数据监控并做相关的分析,根据监控反馈计算,推断出数据的可信度,以找出可信度高、时效性强的合格数据,利用有关算法去设置和储存监控指标值,同时为这些指标设置阈值,一旦超过有关范围,系统就会将问题交网络管理员进行处理,同时保留前一步的反馈数据。③制定数据治理框架,将零零散散的数据需求容纳其中。这个框架必须确保各个部分被融合成一个整体,满足收集、存储、检索和安全要求。为此,企业必须清楚说明其端到端的数据策略,以便设计一个覆盖所有要求和必要操作的框架。必须有计划地把各个部分结合起来,彼此支持,这有很多好处,比如在高度安全的环境中执行检索要求。合规性也需要专门的设计,成为框架的一部分,这样就可以追踪和报告监管问题。这个框架还包括日常记录和其他安全措施,能够对攻击发出早期预警。在使用数据前,对其进行验证,这也是框架的一部分。数据治理委员会应该了解框架的每个部分,明确其用途,以及它如何在数据的整个生命周期中发挥作用。
3.5 推动建立数据流动安全保障机制
一是加强数据流动监测和管理。推动建立数据流动轨迹和交易链条的安全风险监测追溯与综合管理平台,持续研发数字水印、数据血缘、区块链等数据流动共享安全技术,监测流动数据的风险态势并进行异常预警和溯源处置,强化流动共享数据安全保障。二是完善数据交易流通规则制度。结合我国数据交易实践情况,面对数据交易流通过程中可能出现的安全风险问题,制定数据交易安全规则,明确数据提供者与需求者安全保障义务、数据清洗标准、数据交易过程安全标准等内容,打造安全、可靠、合法的数据交易市场营商环境[4]。
4 结束语
随着技术的快速更新迭代,数据中心作为技术创新的制高点,仍会出现众多创新性热点技术,企业自身可以深入了解当前数据服务中心的具体运维管理模式,了解到数据中心运营对企业发展的重要影响,并根据经济大局的格局不断壮大公司,用数据中心运维工作促进企业自身更好、更快发展。