AI应用于APM的现实价值
2017-03-25丁海骜
丁海骜
“在2014年12月,我们的生意比平常多很多。因为交易多了,我们的平台遇到了一个问题:突然发生宕机,死机了,最后服务器崩溃了。由于是突然间发生的问题,我们短时间内一时也找不到原因。”Ivan Woo,来自电子商务直销网站平台QNET的首席技术官面对记者,依然难掩两年多以前那次遭遇技术故障的无奈:“QNET纯粹基于电子商务平台做生意,宕机10小时带来的损失将近千万美金。”
QNET是一家纯云端的电子商务的平台,在全球, 它的用户有近百万活跃直销会员,注册用户500万。
网络直销和普通电子商务的区别,首先是QNET对用户采用会员制管理,要成为QNET的会员,需要通过购买货物来实现。由于这种会员制的特点,最初加入的会员与引荐他人入会的会员,购买同一款产品时的价格是不同的,因此QNET的网购平台需要针对每个用户,判断其会员等级,提供不同的价格列表。这就使得QNET网购平台比普通的网购平台需要更复杂的运算。
其次,QNET平台所销售的产品,不止包括手表、化妆品等实体产品,而且还包括旅游、教育等生活方式类服务产品。其中,很多实体产品本身也并非采用采购的方式,而是由QNET的母公司建厂生产。这就使得QNET的业务维度不能简单从销售开始,到物流结束,而是要从市场调研开始、到生产、市场推广,直到售后服务——虽然QNET平台本身没有必要涵盖整个业务,但是相关的数据和流程,都需要与QNET的网购平台实现深度的交互。
虽然有如此大的区别,但是QNET从根本上,还是反映了电子商务领域普遍的问题——在保证网络平台的稳定高效的同时,提高对整个网络平台性能的管理深度。
所以在那次技术故障以后,为了再发生问题能够迅速找到原因,解决问题,在Ivan Woo的推动下,QNET开始尝试在系统当中部署实施Dynatrace解決方案。2017年8月在第四届Dynatrace Perform上海用户大会上接受笔者采访的Ivan Woo强调,通过部署相关系统监测和优化系统,以及创建自己的运营团队,QNET从每年十几次的宕机次数,降低到了每年两次,到最近两年,已经全年基本没有宕机的情况发生。“即便发生宕机的情况,Dynatrace也能帮助我们缩短找到问题的时间——从原来10个小时降低到了现在30分钟以内。”Ivan Woo说。
不难理解的是,QNET并非个例。随着互联网的深入应用,企业数字化转型的步伐也在加快,因此,大多数的商业机构都面临如何监督和优化IT系统的问题。尤其是随着企业业务环境变得越来越复杂,企业的交易链变长,企业的运维环境日趋复杂,导致性能管理的难度加大。
了解APM技术演进历史的人都知道,其从最初的主动拨测方式到流量定向,再到探针式的植入技术,APM事实上已经经历了3代的技术更迭。但是面对企业应用环境的改变,现行的APM技术是否还能够适用?这已经不仅仅是一个技术层面讨论的问题,更是企业能否顺利展开业务的现实基础。
“有数据显示,实际上我们只有5%的应用程序是被监管的。”琚伟,Dynatrace大中华区总经理在接受采访时强调,处在数字化转型过程当中的企业用户,以往可以通过APM对企业的关键业务应用进行监测、优化,从而提高企业应用的可靠性和质量,保证用户得到良好的服务。但是面向未来的数字化企业,则只有通过更自动化和智能化的方式进行检检测和优化,才能帮助企业真正实现数字化转型的目的。
作为APM领域的先进技术实践者,Dynatrace实际上经历从第一代技术到第三代技术的整个过程。此次Dynatrace Perform 上海用户大会上,Dynatrace宣布以平台化和引入AI的方式,将APM正式带入第四代技术,以解决桎梏企业数字化运维的难题。
“从这一刻起,我们已经进入了一个人工智能驱动的运维时代。”琚伟说。本次Dynatrace展示的通过引入人工智能技术推出的智能化运维解决方案——Dynatrace Davis,通过为用户提供人工智能驱动的性能监控界面,改变了过往的人机沟通和协作模式。例如,用户可向Dynatrace Davis询问前一日的性能运行状况,Dynatrace Davis将以对话的方式回复性能问题出现的时间点、根源、引发的影响。同时,Dynatrace Davis还可自行分析性能问题集中爆发的时间节点和原因,并给出解决方案。
“人工智能正在重新定义应用性能管理,Dynatrace将引领智能运维时代,以智能可视化、全栈式监控和平台化的解决方案,为数字化转型中的各行各业带来全新的性能管理体验,助其加速实现业务升级。”琚伟在演讲中强调,面向未来的第四代APM技术,除了引入人工智能技术,还将通过采用包括微服务、容器、大数据等这些技术在内的先进手段,将以往APM的三种技术手段集中在一起,通过形成一个整体的管理平台,应用单一的语言,为用户提供一个自动化监控的应用体验,从而重新定义性能管理的模式,帮助企业更智能地应对复杂应用环境下的性能问题,最终实现智能化运维。“从哲学的角度看,平台一定是有利他性,不是唯我。Dynatrace将通过这种平台,将我们对万物的兼容性体现出来,从而更好的体现平台的利他性。”琚伟说。
如果将AI的加入看做是APM技术的演进,将平台化作为Dynatrace商业应用方式的升级,实际上,所有的一切都是为了保障IT与企业的业务能够实现更紧密的融合,以支持数字化企业的业务运行。从这个角度讲,所有的改变,都是趋势,也是必然。