APP下载

大数据助力企业安全管理领域的研究

2020-12-29中国航空结算有限责任公司高红岩

网络安全和信息化 2020年5期
关键词:日志运维监控

■ 中国航空结算有限责任公司 高红岩

编者按:大数据对于推动企业业务发展与高效管理方面的作用不言而喻,但前提仍是安全。本文针对民航行业大数据在企业安全管理方面提出一些建议。

对于民航系统来说,信息系统具有独特的行业特性,其稳定性至关重要。旅客订票、代理人出票、飞机离岗等操作不容有误,任何信息系统出现的任何故障,都会带来无法弥补的损失,有时还会危及到人民的生命财产安全。

因此,安全保障工作至关重要,必须要求7×24的高标准、高要求。随着系统功能越来越丰富,系统架构越来越复杂,如何对众多系统进行科学管理是IT运维管理所面临的一大难题。开源产品的引入,不同厂商技术差异等问题也都会给系统管理带来困难,用户反映系统慢、资源不足、网速不达标等问题也是层出不穷。

面对各种各样的问题,不经过科学分析、系统评估,盲目的增加资源并不一定能彻底解决问题,而且糟糕的系统架构、程序bug等问题也并非可以单纯通过增加资源就能够解决,从长远来看,资源的浪费、成本的大幅度提高、系统管理难度的上升都将是越来越严重的问题,所以,系统性的科学管理就显得尤为重要。

大数据助力企业科学、安全、高效管理

随着国外同行业的竞争对手不断涌入国内,民航企业的行业保护政策却不断弱化,以及其它因素所带来的经济影响,都使得民航业面临的竞争越来越激烈。在这种情况下,如何保证公司的竞争优势,在市场上立于不败之地,为客户提供一个安全、稳定的数据中心,保证客户业务各个层面的安全稳定是至关重要的。

当今社会,已经进入了以云计算、大数据为代表的时代,大数据在发展经济、促进安全生产等方面的作用已日益显现,利用大数据助力企业发展、科学管理是我们近年来主推的一项重要举措。

1.大数据助力企业科学管理

在实际生产维护工作中,从上到下都充分认识到了大数据的重要性,大数据之“大”,不仅在于海量数据的“大规模”,更重要的体现在:通过各行各业产生数据轨迹的“大覆盖”,推动各类同构、异构数据的“大融合”,提升分析数据内在规律和发展趋势的“大智慧”,实现从数据到信息、到显隐价值挖掘的“大应用”。

在互联网+浪潮的带动下,传统行业与互联网行业的边界逐渐变得模糊,传统企业的IT系统变得越发复杂,运维对象开始由运维物理硬件的稳定性和可靠性演变为能够自动化部署应用、快速创建资源、动态扩缩容系统、实时监控程序状态,以保证业务持续稳定运行的敏捷运维。企业内部成百上千台服务器,各种性能数据、资产信息、系统日志和业务信息等都属于大数据领域范畴,如何利用这些数据助力企业进行科学管理呢?

在实际应用中,主要采取广撒网的形式,注重对各种数据的有效收集、汇总、分析及展示。从管理的角度出发,按照系统、网络、数据库、应用及虚拟化等不同方面,收集各方面的数据信息进行分析,为管理系统提供科学依据。

以数据库管理为例,搭建数据库性能数据收集系统,通过编写程序自动定期收集各种作业(应用、系统)的实际运行时间、数据库基础配置信息、系统性能数据、数据库性能数据、数据库的备份时间等信息,以业务要求为基准,形成各种基线,为性能分析、故障定位、资源扩容提供依据,使系统管理更加精准并且有据可依。

完成这项工作意义重大:首选提供一个基准,通过作业服务水平协议(SLA)要求时间和实际的作业运行时间进行比较,发现应用作业是否在性能上存在问题;也可作为性能调优的基准,调到业务作业运行SLA要求的时间基线即可满足要求;从系统配置上,也可以以系统性能数据为依据,评估当前的系统配置是否合理,是否需要增减系统资源,做到有据可依;更重要的是根据性能数据,对系统资源使用做趋势分析,为后续资源扩容提供支撑,真正做到用数据说话。

2.大数据助力企业安全、高效管理

面对成百上千台系统,如何安全、高效管理?以大数据为依托,借助监控工具、自动化脚本、邮件系统等手段,实现全面、安全高效的管理系统。

(1)对系统实施全面监控

系统中无时无刻不在产生数据,系统报错会自动产生日志,人为运行各种命令会产生日志,作业运行会产生日志等。这些信息是检查系统是否正常、稳定的有力数据,也为查找问题原因提供可靠的线索。如何挖掘数据的价值,如何利用这些有价值的数据是一门大的学问。传统的运维模式在逐步向大数据运维场景发展,大数据运维场景是借助专业监控工具和软件,实现自动化监控、自动化性能与故障分析、趋势预测和故障根本原因定位,其准确性远远超过人工运维的准确性,这才是提升管理效率和运维水平的有效出路。

此外,因各个企业的业务场景及实际需求都不尽相同,厂商的监控软件并不能完全覆盖所有的功能需求,往往需要进行二次开发,自行编写程序,收集对维护系统有价值的数据信息,部署对全公司所有业务平台的监控。

收集的数据包括系统日志、性能数据、错误日志、网络信息、资产信息及操作日志等,针对这些数据进行逻辑规则匹配和挖掘,有针对性的发出告警,做到对系统的实时监控。同时所有数据信息进入信息历史库,以备将来追踪问题时使用。

截至目前,部署的监控点包括系统性能监控、设备宕机、进程异常停止、备份失败、系统软硬件错误、数据库空间不足,越权操作、存储硬盘错误、文件修改、网络中断、链路错误、应用作业错误等大概70多个种类,覆盖200多套数据库,500多套操作系统,几十条网络线路等,而这一切的基础来源就是底层的信息数据。

通过收集底层大量基础数据,并对其加工、匹配、筛选、展示等处理,实现对系统的实时监控。此项工作的实施,不但节省了人力维护成本,而且也减少了系统故障发生的概率,缩短了故障发现时间,大大提高了系统的可用性,达到了利用数据监控系统、维护系统的目的,系统安全性上得到有利的保障。

(2)合理利用大数据,定位故障

监控的目的之一就是定位故障,而且还要求快速定位故障。当发现系统故障甚至不可用时,我们想立刻知道,是哪个服务器出了故障,对哪些业务有影响,需要哪些人来处理,到底出了什么样的错误。更重要的是,要根据数据之间的逻辑关系,发现故障之间的关联关系,判断哪些是次生故障,哪个是故障根本原因,所有这些都需要数据来支撑。

所以对于数据而言,大而无用不是我们的目的,我们希望把零散的、无序的数据组合成大而有序,大而可用的数据,正所谓数据的价值不在于数据本身,而在于数据之间的关联关系。这就要求合理的使用数据,对数据进行加工、分析,物尽其用。在实际生产业务的监控中,以收集上来的信息为基准,结合业务逻辑,岗位负责人员,建立业务之间、资源之间的拓扑关系,把主机、数据库、业务、故障解决人以及具体故障日志等信息囊括进来,作为告警通知的基础架构。而发出的每一条告警消息都应该内容清晰,包括故障当前状态,是故障类还是预警类、需要哪个岗位来处理、故障发生时间、故障节点名称、具体报错日志等关键信息,以实现定位故障准确,为后续故障的处理缩短时间。因此,在实际的应用中,我们需要合理使用大数据,深度挖掘它们的价值。

大数据本身需要保护

从我国情况看,大数据在面临传统安全风险的同时,还面临着数据能否自有掌控,处理能否自主实现,应用能否规范有序,安全能否有所保障等新的安全风险。针对这些问题,应尽快从强化数据立法,加快自主自控,注重显隐价值保护等方面筑牢我国大数据安全管理的防线,实现以安全保发展,以发展促安全的良好局面。

对于企业来说,首先要建立数据保护制度以及相关的安全规范和流程,尽快从制度层面提出企业数据主权,规定数据的合理使用,对违规使用数据进行相关处罚。其次,加强自主研发,真正做数据的主人。三要加大人才培养力度,整体规划国家及企业的大数据安全人才的培养、引进和使用,形成学业、职业、产业三位一体的培育体系。

结语

本文结合企业实际生产业务,介绍大数据在科学管理,安全、高效管理方面的实际案例,充分印证了大数据的实用价值,并指出,大数据本身安全性存在隐患,需要保护,也呼吁企业加大对大数据人才的培养。

猜你喜欢

日志运维监控
高速公路智能运维平台
The Great Barrier Reef shows coral comeback
一名老党员的工作日志
基于无人机的监控系统设计
扶贫日志
智能+时代的新运维
——2019(第十届)IT 运维大会特别报道
雅皮的心情日志
雅皮的心情日志
配电线路的运维管理探讨
科学训练监控新趋势——适时监控