Evolven:实现IT运营分析与配置变更管理的完美联姻
2014-03-14周祺
特约通讯员 周祺
Evolven:实现IT运营分析与配置变更管理的完美联姻
特约通讯员 周祺
编者按
想象一下,每天收到100 万封电子邮件,却没办法知道哪些真正需要阅读,哪些需要被忽略。这个基本上是全球企业IT 运营数据的情况。Evolven 的IT 运营分析解决方案可分析IT 运营产生的高达太字节的大数据,并将数据转变为决策,能有效指导业务运营,实现配置变更管理,消除因错误的系统配置而导致的偶然却代价高昂的错误。
想象一下,每天收到100万封电子邮件,却没办法知道哪些真正需要阅读,哪些需要被忽略。这个基本上是全球企业IT运营数据的情况。每天,一个典型的企业IT网络生成的数据会超过1.3 TB,这些数据包括日志文件、软件错误报警、IT服务单和网络更新等。
然而,当今配置管理和变更管理工具都过于僵化和繁杂,以致无法应对现代IT运营数据的复杂性,以及应对庞大的配置数据和频繁的变更。变更与配置问题已成为IT运营的“慢性病”,庞大的、迅速增长的、类型各异的变更和配置数据成为症结所在。归根结底,这些问题的本质源于“大数据”。由于数据量的不断增长直接关系到我们以多快的速度采用和扩展移动和云计算,以及以多深入的方式来了解运营数据中包含的专业知识,并在此基础上做出预测,因此不仅需要掌握,而且必须优化系统性能。智能分析和认知计算为此提供了解决办法。过去几年里,科技行业在通过大数据实现转型和学习方面取得了巨大进步。那么,能否将同样的能力应用于我们的IT系统呢?答案是肯定的。
IT运营数据的价值是不言而喻的,企业过去别无选择,只能放弃或归档IT运营数据。许多企业因此错失了重要信息,这些信息可能有助于防止系统停机,或帮助他们在最需要的时候保持网络运行能力,这些关键时刻包括扩大型应用部署期间或执行几十亿美元金融交易的过程中。但是此前,企业没有办法捕获这些分析,除非聘请数据专家团队。即使他们这样做了,可分配的资源也是捉襟见肘。现在我们可以利用一种全新的分析软件填补这个空白:IT Operations Analytics(ITOA)。Evolven实现了将这种智能分析技术与配置变更管理的完美联姻。通过Evolven的IT运营智能分析方法,不仅可以解读数据,而且能够形成决策,有效指导业务运营、基础设施运行等。
立足:业内变更适应能力最佳的管理分析商
Evolven是一家私人控股的软件公司,其总部设在美国,并在以色列设有研发中心。在Evolven的管理团队和顾问委员会中,有许多全球知名的企业软件专家。Evolven公司的专注领域包括:配置管理,发布验证,灾难备援(灾备),事故调查,虚拟化,云配置管理,发布管理,变更监控,变更管理,运营分析等。2011年获得领先风投公司Pitango和Index Ventures的融资。
Evolven软件公司新推出的IT运营分析(IT Operations Analytics,ITOA)解决方案,能够针对IT运营领域内的多个关键性挑战,提供智能的解决方法,例如,如何加快突发事件的解决和处理效率,如何避免危害性强、风险性高的变更,以及如何评估和优化IT业务的绩效。针对慢性的长期变更,以及配置上面的挑战,Evolven公司设计了新的分析方法,其能够极大地减少停机的风险,缩短突发事故的调查时间。
Gartner,领先的行业分析师,将Evolven选为2013年IT运营管理领域内的优秀供应商,并将Evolven评为“唯一一家将IT运营分析,与配置和变更管理结合在一起的供应商”。在2013年,Evolven被美国著名科技企业杂志《Red Herring》誉为北美百强企业之一。此外,其它业内领先的分析师也已经认识到Evolven在“变更转化和配置管理”领域内的突出表现和贡献,并将其誉为“业内变更适应能力最佳的管理分析商”。
ITOA执行过程
ITOA:将IT运营分析与变更管理相结合
Evolven推出的ITOA方案用于分析潜在的变更和克服配置挑战。结合分析和认知计算,可以实时筛选几万亿字节的运营数据,发现和了解对于IT健康状况和性能至关重要的发展趋势。将动态的关键变更和配置数据转化成清晰的可执行见解。识别并记录那些将影响IT环境稳定性的不一致变更、异常数据和错误配置,做出相应的调整、更新设置,及时消除可能会造成重大损失的不良的系统配置,有效减少停机时间和加快事故调查速率。
Gartner指出,“近两年,对ITOA相关的过程、技术以及服务的需求有明显的增加,据统计,2012年该领域的全球支出为3亿美元,2013年超过了8亿美元,增长率超过了150%。而且据Gartner于2013年9月发布的IT运营分析报告称,2014年的增长率将持续超过100%。”这些新型的IT分析工具采用不同的视角来处理庞大的数据以及运营商所面临的复杂性问题,从大数据中挖掘可执行的信息和见解。为实现这一功能,Evolven动态地爬取并捕捉最细粒度的配置参数,结合了多种数学算法和分析技术,如统计模型分析,事件关联分析,启发式分析和日志分析等。Evolven实现了IT运营分析与配置、变更管理的完美结合,提供以下独特性能:
●可执行的见解
识别大数据的关键元素,以及那些能影响系统稳定性的关键变更都需要大量的数据和分析,Evolven提供了这些海量数据和多种分析方法。具有简易的控制面板,所有端到端环境中产生的变更都在报告中一目了然,所以当进行事故调查时,所有信息都是透明的,这使得运维人员可以掌握所需信息从而了解事故情况。
●基于相关联的事件
基于所有相关联的信息进行分析,信息来源包括:应用程序、底层软件基础设施、应用堆栈等,遍历构成业务环境的所有重要技术组件。通过挖掘,可以获取包含了很多细节点的信息,甚至细化到个人信息级别。这些细节点往往是造成事故的根源,而在当今的配置管理方案中却不够透明。Evolven能够很好地解决这一问题,通过动态爬行收集最细粒度的信息,接近实时地抓取所有近期的变更,使所有变更变得可视化。
●快速显示结果
对于IT运营商来说,他们分秒必争,希望投入更多的精力到产品研发和解决业务需求,不希望一项技术的部署成为他们额外的负担。因此时效性对于技术的采用是必要因素。尽管是单个参数的细微的错误配置都很可能引起重大的故障,使发布周期延长或停滞,甚至使生产中断。Evolven可以迅速得出分析结果,展示参数配置的详细视图,确保系统环境的完整性得到保护,使发布计划得以维持。
ITOA的具体实现分为三个步骤:
第一步:爬行
Evolven无需任何初始化准备即可持续地在动态环境中爬行,遍历整个系统环境,收集深度信息,细化到配置参数的层级,其中在信息收集过程中运用了以下三类代理之一:
●远程代理:运行在服务器中(诸如多任务服务器或专门从事代理收集的单任务服务器),接收远程服务器信息并推送到Evolven应用服务器。
●本地代理:主要针对不能远程获取的信息收集,也是直接在服务器中运行并将信息推送到Evolven应用服务器。
●离线代理:通过ad-hoc(点对点)模式进行,如通过挂接点或USB加密锁等方式。该代理从本地收集信息,然后上传到其它任一代理的服务器中。离线代理在设有防火墙的服务器中或在服务器与Evolven应用服务器断开连接的情况下也可以运行。
这些信息收集过程可在按需(ondemand)或预定的方式下进行。为确保较低的系统开销,Evolven采用了一种碎片化方式,即遵循原始快照,进行递增式的信息收集,生成增量文件。
第二步:分析
Evolven采用先进分析方法处理海量数据得出可执行信息。所收集到的环境配置信息将与其它环境信息或相同环境的历史快照或一些基准参数做比较。纯粹基于这些海量数据,是难以得到有价值的分析结果的。因此要结合有效的分析方法,Evolven的分析引擎(Analytics Engine™)包含了一组专利分析技术,直接针对关键点差异化数据。这组技术包括:
●影响知识库:可定制的知识库,确定每个不同点的影响和严重程度
●规则机制:对信息进行聚合、标记和归一化,使之更为明晰。
●降噪机制:过滤掉无关的或预期/要求的差异信息。
第三步:展示
通 过 Evolven的 rich browserbased client客户端展示分析结果:
●用图表形式对结果进行比较,用户可以直观清晰地对环境风险和潜在影响有一个综合的了解;
●展现完整的环境配置存储库视图,使部分专业用户可以了解整个环境配置并在用户能力所及的情况下深挖到最细化到信息。
●在用户选定的情况下可以对环境状态作出提醒和警告,对配置变更的危险程度进行警示。
●通过一种主动方式,可以生成日志或周期记录,提醒管理员系统的运行情况,提供高水平的分析结果汇总,以及系统维护的指导意见。
优势:减少异常,快速修复,提高效率
ITOA从所有的环节(软件到硬件)中收集细节的配置信息,识别当中的差异和变更,运用先进的分析技术放大关键问题,从而可以更清晰地了解复杂情况。ITOA在许多IT运营情境中都有很好的应用:
●变更管理
在应用和软件部署中,Evolven可以验证各种个体变更,监测和主动检测任何非授权变更和配置变更,使补丁和版本准确执行并保持一致性,在任何变更执行前对最成功执行的可能性作出分析。避免停机,以及其他影响系统性能和稳定性的可能性问题。
●问题管理
当有事故发生,Evolven可以快速查找事故根源,在问题失去控制危及整个系统之前及早解决。通过对问题环境的对比分析,可以识别很细微的诱因。
●事件管理
在大多数组织机构中,设备管理的平均修复时间(MTTR)都很长,ITOA可以大大减少事件的响应时间,并在第一现场努力避免事故的发生,例如,当有事故发生,IT运营商第一时间对所有的分散数据进行排序,从而找出系统在上一次正常工作以后出现了什么变化,以及什么原因导致这种变化。ITOA通过自动分析系统上一次正常工作以后的所有变更运用模式和基于统计的算法来识别事件的根源。
●维持环境的一致性
对IT运营来说保持服务器与环境的一致性是一项长期的挑战。Evolven可以轻易地对服务器和业务服务环境进行比较分析,汇报任何非兼容问题和关键异常,避免祸及整个系统性能。
总结
云技术的出现带来了许多变革。随着经济社会对IT运营效率和竞争力的要求不断增加,云技术起着举足轻重的作用,它能有效降低成本和管理开销,提高IT系统的灵活性、可伸缩性和可访问性。基于这一优势,云计算的出现正撼动着现代数据中心,运营商纷纷采用云技术改造数据中心,努力不懈地追逐运营效率和成本效益的提高。然而,从物理数据中心到虚拟数据中心再到云数据中心的转移过程中,伴随着带来了越来越多的配置管理挑战,增加了管理的复杂性和动态变更的频率,使数据量呈指数级增长。这些由云计算导致的快速变化的步伐成为企业面临的主要挑战,企业需要在维持系统可控的情况下驾驭这些巨大的变更,这就需要结合IT运营的智能分析方法。
Forrester研究机构指出,“IT分析工具可以帮助IT运营更好地管理业务,将大数据转化成更好的决策来处理各种业务,基础设施和应用”。我们的IT环境迫切需要进行分析。Evolven结合分析认知能力,提取复杂IT环境中的大量数据并进行转换,在正确的时间提供了正确的信息。将先进的分析和预测认知工具应用于运营系统的工作,将运营数据转化为竞争工具,不仅能够整合云计算扩展系统,而且可以随着世界的创新发展,不断推进并管理我们的IT系统。
(消息来源:Evolven公司)