大数据环境下信息系统运维智能化研究
2019-09-10张韶华马倩倩孙学智
张韶华 马倩倩 孙学智
摘 要:在大数据环境下,传统信息系统运维方式已经无法满足当前信息系统正常运行的需求,必须结合新兴技术,如大数据技术,实现运维智能化发展,从而更好地为信息系统服务。本文对大数据环境下运用大数据技术提升信息系统运维的智能化水平展开研究,并以性能动态基线为例,分析了大数据技术在信息系统运维智能化中所发挥的作用。
关键词:大数据环境;信息系统;运维智能
中图分类号:TP311.13 文献标识码:A 文章编号:1003-5168(2019)17-0026-02
Abstract: In the big data environment, it is necessary to combine the current emerging technologies, such as big data technology, to realize the intelligent development of operation and maintenance. In this paper, the application of big data technology to improve the intelligence level of information system operation and maintenance in large data environment was studied. Taking performance dynamic baseline as an example, the role of big data technology in the intelligence of information system operation and maintenance was analyzed.
Keywords: big data;information systems;intelligent operation and maintenance
信息系統的运维是IT系统生产价值得以顺利发挥的重要前提,也是信息系统正常运行的必要保障。随着社会信息化进程不断推进,信息系统在社会各领域的作用日益凸显,其复杂性也随着应用要求不断提升而增加,给其运维工作增加了一定困难。所以,寻求信息系统的智能化发展已经成为当前信息系统运维发展的重要任务。应用大数据技术可以有效提升信息系统运维的智能化水平,对信息系统发展具有重要意义。
1 信息系统运维概述
“运维”即运行和维护,信息系统的运维就是通过采取一些措施或方法来确保信息系统正常运行。通常情况下,信息系统在运行过程中会不可避免地出现一些故障或运行错误,需要相关技术人员提前对这些异常做好预测,提前做好防范工作,并在系统出现故障时及时诊断和找出故障原因,排除故障[1]。
对于信息系统来说,运维工作是生命周期中不可或缺的重要一环,属于信息技术服务范畴。目前,信息系统的运维主要包括服务器硬件运维、应用软件运维以及其他运行维护工作三大类。一般来说,信息系统的运维工作难度与信息系统的复杂程度有关,系统构架愈复杂,信息系统运维的工作难度就愈大,运维成本也就越高。
2 大数据环境下信息系统运维面临的挑战
2.1 运维方式被动
在大数据环境下,为了满足用户信息资源的应用需求,信息系统的整体架构逐渐变得复杂。而传统的信息系统运维模式大多是被动式运维,即出现问题、发现问题、找出问题、解决问题。目前,这种运维模式是在出现问题之后才会开展运维工作,事前没有采取任何主动防范措施,这要求运维人员必须具有较高的运维素养,快速找出问题、排除故障,否则就可能给用户造成严重损失。这种被动的运维模式已经很难满足日渐复杂的信息系统的运维需求。
2.2 运维对象复杂程度逐渐增大
大数据环境下,云计算技术、大数据技术等现代高新技术应用大大增加了信息系统的复杂程度,信息系统运维的对象日渐复杂。比如,目前信息系统的种类繁多、硬件设备结构较复杂、不同的信息系统安全标准也不尽相同,给运维工作增加了一定的难度和复杂性。传统的运维方式或方法在面临海量的数据信息时,已经难以保证运维工作的可靠性及有效性,较容易产生信息系统的运维漏洞。这也是大数据环境下信息系统运维面临的一项不容忽视的新挑战。
2.3 运维工作的自动化水平较低
目前,随着信息技术的不断进步,信息系统运维的技术水平也有了很大进步,但总体来说,我国信息系统运维工作的自动化水平并不高,很多运维工作都需要工作人员人工处理,比如,一些系统文件的简单变更往往需要工作人员对所有相关设备进行逐一操作,运维效率较低,对大数据环境下信息系统的运维来说远远不够。因此,只有不断提升运维工作的自动化、智能化水平,才能有效提升信息系统运维的工作效率,满足大数据环境下信息系统的运维需求。
3 大数据环境下信息系统运维的智能化
本文关于大数据环境下信息系统运维智能化的研究主要是以动态基线为例,研究大数据技术在信息系统运维智能化中的具体应用。动态基线的工作原理是利用大数据技术来分析、预测信息系统运维中可能会出现的故障,通过分析正常数据的变化规律来确定正常范围,当数据变化数值超过正常范围时,运维系统就会发出预警通知运维人员,从而在故障产生之前就采取防治措施,避免信息系统故障带来损失。所以说,这是一种不同于传统被动式的运维,是一种智能化的主动运维[2]。
动态基线计算可用如下算法进行:以服务器应用日志增量作为数据分析,2019年6月19日上午10:00的基线数据计算为例,将2019年5月20日—2019年6月17的该时间点的数据作为样本资料。
由表1可知,20195月25日、6月9日缺乏数据,需要进行数据平滑处理,将其相邻数据的平均值作为数值,得到两个值分别为43、56。然后计算动态基线的数据。首先,为了尽可能得到有效数据,剔除异常因素,应将所有数据划分为5个区间范围95/5=19,故[0-19][19-38][38-57][57-76][76-95]。将表中数据的最大值和最小值去掉,分配到这5个区间内,可发现区间4中的数据最多,故将区间4与其相邻的3、5三个区间共21个数据作为最终计算用数据。其次,对这21个数据进行排序,并利用均方差法计算动态基线的概率。动态基线概率计算要先确定滑动窗口的大小:21×0.8(置信度)≈16,第一窗口即第1个数到16个数,第二窗口为第2个数到17个数,依次类推,共6个窗口。最后,分别计算得到各滑动窗口的标准差值,即9.99、9.89、10.08、9.95、9.51、10.56。第五窗口的均差最小,因而取该窗口的最大值、最小值作为基线的上下基线值,即72、57。由此计算得到基线的范围界限上下值:上限值=72×(1+20%)=86.4;下限值=57×(1-20%)=45.6;所以2019年06月19日10:00该动态基线的正常范围为应45.6~86.4。
4 结语
本文以动态基线的算法为例,分析了大数据技术在信息系统运维中的应用价值:运用大数据技术可以有效提升预测算法模型的运行效果,从而提高信息系统运维效率及智能化水平,保证信息系统正常运行,使其为用户提供更高的应用价值。
参考文献:
[1]罗砚.基于大数据的信息系统运维智能化研究[J].邮电设计技术,2018(3):79-82.
[2]周生键.电力信息系统运维管理自动化解决方案[J].数字通信世界,2019(5)278-279.