APP下载

科来:网络回溯助云服务运维

2016-11-26

网络安全和信息化 2016年1期
关键词:网络故障链路运维

作为企业的IT运维部门,经常会遇到用户投诉系统缓慢的问题,但是,当IT运维部门试图解决这类故障时,却经常会找不到具体问题在哪里,无从下手,最后导致问题无限期搁置下去。那么,到底是什么阻碍IT运维人员找到准确的故障点呢?科来认为,网络排障困难主要是由于主客观两方面的原因造成的:

首先,从主观上讲,企事业单位的IT运维部门大多都注重资源、设备的管理和监控,而缺乏对网络中通讯流量的透视分析;过多依赖安全规则库特征码的检测,而缺乏对异常通讯行为征兆的主动分析能力和预警能力;分析处理问题侧重应用层面,而缺乏精细化,小颗粒度,深层次分析管理手段。

其次,从客观上讲,因为网络故障是非单一性的,因此,存在一类或多类故障并存的可能,同时,用户投诉中约有75%的场景无法复现,因而无从解决。也就是说,故障的间歇性,客观的增加了排除隐患故障的难度。

那么,对于企事业单位的IT运维部门来说,怎样才可以避开主、客观的因素,快速、准确找到故障的具体原因呢?科来行业技术总监朱欣嘉认为,只要具备了网络回溯分析的技能,企事业单位的IT运维人员就可以分分钟找到故障源头。

科来行业技术总监 朱欣嘉

所谓网络回溯分析技术是指通过网络底层通讯信息的嗅探及存储,进行记录、检查、分析及统计,帮助用户快速回溯网络历史运行状态,从而达到相关网络管理要求的网络分析技术。其最大的价值在于“发现网络隐患,并对其追根溯源,从而找到问题的根本,对安全事件及网络问题进行取证分析”。

而从运维管理的需求来说,当前企事业单位的IT运维管理首先需要应用流量梳理。即厘清网络中各种业务系统的流量,建立可视化的流量监控,掌握网络资源使用情况,从而及时发现异常流量和新上线的业务情况;

其次,需要了解并掌握关键生产业务的性能状况、繁忙程度,定位业务瓶颈在网络还是服务器,分析客户端到服务端的网络时延,服务器数据交互性能等;

再次,需要具备对网络链路故障的快速定位和隐患故障的排查能力,以及对间歇性网络故障的事后分析排查;

第四,需要具备安全分析的能力。即自动发现影响网络安全的异常行为,如APT攻击、蠕虫病毒、端口扫描、ARP攻击、非授权访问等;

最后,需要取证分析能力。如遇到安全设备产生大量告警,需要确认是否误报,一旦确认,提供原始数据,为事后处理提供依据。

回溯分析技术完善运维管理目标实现

而这些,网络回溯分析都可以做到。基于该项技术的研发,科来软件推出了科来网络回溯分析系统。科来网络回溯分析系统总体上采用分布式部署,集中监控分析的架构。

针对网络故障的多样性和难判别性,科来网络回溯分析系统以故障数据流中的原始数据包为基础,剖析业务数据在网络平台中的传输过程,还原业务交互过程的真实与完整,定位影响业务传输质量的网络故障源。科来网络回溯分析系统还对链路总流量、Top_网段、Top_IP主机、Top_网络应用、Web攻击检测、警报日志等进行多元化的实时数据监控,用户可利用实时监控信息初步判断监控链路的网络故障层次。针对网络故障的间歇性,科来网络回溯分析系统提供5种数据类型以及40天以内任意时段的网络数据的回溯分析能力,方便用户对历史网络故障数据中的主机、会话、网段/部门、应用进行数据的深度检索和故障定位。结合生产业务的传输特点,科来网络回溯分析系统对各项关键业务执行独立的数据交互监控,及时掌控业务交付质量、繁忙度、业务处理颈瓶。科来网络回溯分析系统还能够针对各服务器提供服务的端口进行统计,能够准确反映出各服务器所开放的服务端口,从而能及时发现异常服务端口,并为安全设备设置策略提供依据。

科来网络回溯分析系统

此外,科来网络回溯分析系统对关键业务交易内容的深度解析,可分别掌握各交易类型、用户信息、交易状态、交易成功率等各种信息。分析业务交易存在的颈瓶。依据网络实际运行环境、业务传输质量要求以及异常行为在网络交互中的特征,对监控链路和业务交互流量中的可疑行为和交互质量做自定义网络规则告警,实现异常行为快速发现,以及业务访问质量监控。依据对生产业务监控,分析业务操作的TCP交易,可识别每一个请求与响应情况,分析是否有影响业务交互质量的重传、重置,响应慢等。

除此之外,科来网络回溯分析系统还可对数据链路到应用层的智能诊断信息的解释、原因及建议;可对网络链路故障进行区分,排查定位故障源。自动分析网络中的疑似蠕虫、端口扫描、可疑会话、ARP攻击等,并可自定义规则。如果业务数据交互不成功,依据TCP通讯详情及多段对比分析法,定位发生故障的网络中间设备,并根据任意时间、任意流量类型生成报表,并发到指定邮箱,从而实现流量报表的自动输出。

猜你喜欢

网络故障链路运维
天空地一体化网络多中继链路自适应调度技术
基于星间链路的导航卫星时间自主恢复策略
运维技术研发决策中ITSS运维成熟度模型应用初探
VxWorks网络存储池分析在网络故障排查中的应用
基于信息流的RBC系统外部通信网络故障分析
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
Wireshark协议解析在网络故障排查中的应用
基于ITIL的运维管理创新实践浅析
通讯网络故障类型研究