APP下载

面向云原生的智能运维架构和关键技术

2021-08-27任高强崔云龙高平吕书林赵军生

中国新通信 2021年12期
关键词:关键技术

任高强 崔云龙 高平 吕书林 赵军生

【摘要】    云原生技术具有简单快捷、轻松自如的运行优势,可以按照实际的应用需求进行自由的伸缩,所以该项技术得到了推广应用,但云原生技术的系统结构越来越复杂,其中的资源规模更加庞大,而智能化的运维体系的建设与完善,则可以更好地发挥云原生技术的优势,帮助企业有效的降低云原生技术的运维成本,并切实提升技术的服务质量。智能运维架构经过云原生技术的应用场景与实践过程分析,以此构建新的运维架构,并依照核心服务算法平台的趋势预测、数据异常检测及故障定位诊断等原理来优化云原生技术的关键部分。本文从云原生技术智能运维构架的关键点进行分析,研究了面向云原生的智能运维架构和关键技术的相关内容。

【关键词】    云原生技术    智能运维架构    关键技术

一、面向云原生的智能运维架构的架构概述

1.1整体架构

在智能运维平台中,容器技术具有不可忽视的作用,能够支持有关承载单元,并开发网络云原生化,提高运维架构的智能化水平。智能云原生运维架构需要具备控制子系统和智能运维子系统等,这些系统组成了智能运维整体架构。1.控制子系统。控制子系统一般涉及到了配置中心、安全中心、注册中心等。注册中心能够及时发现微服务目标,完成对应的注册工作。安全中心的主要目标便是审核信息,也可以进行加密处理,确保信息的安全性。配置中心可以发送到服务代理。平台适配器能够对容器进行集中管控,为微服务带来必要的信息支持;2.智能运维子系统。该系统能够收集不同代理下发的监控信息,将监控信息发送到后端监控服务中,对运行日志和运行指标等进行分析,精确把握网络变化及变化过程中存在的规律,提高智能云微架构的服务实效;3.服务代理。服务代理便是云原生,严格控制微服务流量,在微服务中具有着关键作用。

1.2智能运维的典型场景划分

智能运维的架构一般需要特殊的场景作为依托,也就是说智能运维的系统需要具备2个或2个以上的应用场景。如某研究所在电信视频领域的研究中,重点分析大视频质量较差的根本原因和硬盘故障预判两个内容,结合研究的结果发现通过智能运维技术的应用提升了电信大视频运维系统的运行效率,所以技术人员可以从应用场景出发来研究智能运维,如分析AIOps的智能运维场景分类。

1.3智能运维架构关键性内容分析

在智能运维的实践应用研究中,学者发现从数据管理、算法分析及应用场景等多个方面的要素进行实践研究更加合理,在AIoT+AIOps数据中心这一概念提出以后,智能运维的应用能够将数据与算法等条件作为着手点进行分析,若以软件系统作为基础进行分析,那么建立数据平台和数据算法体系则更能满足实际需求。

1.智能平台的软件组成

数据平台主要包括以下几个重要的层面:第一,数据采集层,智能架构的数据主要产生于ITOM监控工具集,如网络性能检测与诊断及其他服务的性能监管等,都需要数据采集层来完成,云原生技术智能运维平台的数据采集层具有较高的技术要求,采集层需要具备跨平台、跨语言、兼容的多种模式,统一采集才能确保数据的稳定性,建立起快速的传输机制,为系统后续的运维管理带来便利。第二,数据处理层,在数据处理的过程中,云原生技术的智能运维平台的发展速度飞快,对数据处理层的服务性能要求较高,所以数据处理层要具备多数据源、快速接入、元数据提取与管理等能力,企业需要对数据分析的接口进行一定的拓展,才能满足实践的需求。第三,数据存储层,云原生技术的智能运维数据存储层要具备出色的可扩、缩容能力,在实践中要快速的存储已经采集的信息,并且要能够结合智能运维平台的功能实现数据的更新,可以更好的节省成本,快速的调整各类安全接口[2]。

2.算法平台的详细分析

云原生技术智能运维中的算法平台需要经历一个持续发展的过程,选取的算法要和其应用场景具备密切的联系,其中的常见经典场景可以参考表1的部分内容。从实践的角度来看,相关算法对应的场景为了达到更高的性能指标,技术人员需要考虑多种算法结合使用的情况,并不只有表格1中的相关内容,若在某个特定的场景中,技术人员可能会需要尝试应用多种算法,或者对某一算法进行创新和改造才能达到理想的应用效果。目前人工AI的机器学习算法还难以满足使用的需求,需要及时的升级算法才能使其更加智能,为搭建更加高效的云原生技术智能运维算法平台,技术人员需要将场景和算法相匹配,不断的优化人工AI的算法过程。

1.4架构部署

一般来说,云原生智能架构在部署方面可以实现多形式部署,一般表现在网元、监控数据开放、外部访问等。在智能云原生平台中,和服务及协议适配服务间进行连接,配置服务代理采用二级监控的方式,对监控信息进行过滤和整合处理,在既定时间中传输到智能运维子系统中。

1.5演进设计

以虚拟化技术作为基本条件,很多运营商都开始建立云网络运营系统,底层一般运用多云或裸金属软件资源,利用虚拟网络功能对网云功能进行处理,经过管理和编排,实现信息资源的配置优化,同时也能连接系统和网络管理系统。在应用云原生构建云网融合系统时,可以在既有的架构基础上增加智能云原生平台,在平台中增加容器资源,促进管理与编排系统的优化更新,对网元功能进行分解和封装。

二、面向云原生智能运维架构和关键技术的实践

2.1智能运维实践案例分析

云原生技术智能运维架构在互联网领域的应用非常广泛,如某公司建立起的“AIOps”智能监控系统,异常故障检测的设备召回率可达到85%以上,能够有效的提升故障告警的准确率,而且系统的故障排查效率也大大提高,还能够根据周期性的趋势预测来调整相应的参数,其数据的时间在分布上可以大规模的跟随机器学习。如百度的“单机房故障自愈压缩”的系统可以有效的解决了机房故障时间长的问题,同时以当下的监控平台系统和异常检测算法,实现了自动化的感知和定位,解決了传统系统中存在的各种问题,实现快速的故障自愈。在现代的电信行业中,流量媒体业务成为大众关注的焦点,宽带IP网主要是端对端的网络质量监控,智能化的运维架构可以实现故障的自诊断功能,并构建起集约化的宽带服务智能运维体系,能够切实的提升运营商网络的运维效率与智能化的程度。如在IPTV的系统中融入了智能异常检测的功能以后,能够对实时产生的海量数据进行分析,及时发现人工察觉不到故障或异常,增强了用户的体验。还有其他相对经典的单场景行业实践中,都可以结合云原生技术智能运维架构的相关内容优化云计算的效果[3]。

2.2详细内容

云原生技术智能运维架构的设计主要包括以下两个方面的内容:一是智能运维要结合云原生技术的特点来配合设计,使之能够为云原生系统所服务;二是智能运维要利用云原生技术提升按需弹性的伸缩功能,作出动态化的部署,如图1所示,云原生技术智能运维架构非常清晰明了。从运维对象的角度讲,云原生技术智能运维架构是针对云原生系统设计的内容,这一系统的运维对象相对固定,能够按照需求来弹性的伸缩调度,所以匹配的智能运维系统也需要适应这种变化的趋势,其基础设施包括服务器、虚拟机及数据库等,可以建立起不同服务的连接通路。从数据平台的角度讲,数据平台属于智能运维架构的基础平台,能够为云原生技术智能运维架构中的算法平台提供一定的技术支持,对于数据的存储则要重点的考虑如何保存海量数据,并进行跟踪的服务。从数据快速筛选的角度考虑,可以帮助云原生技术智能运维架构有效的节省成本,并智能化的调整参数,帮助系统快速地删选有效数据,还能够自动删除一些无效的历史数据,用于降低系统的存储成本压力。从数据存储库的分类来看,原始数据库与样本数据库是其主要的组成部分,二者之间相互配合运行但又相对独立,样本数据库的数据来自于原始数据库,原始数据库中的数据则包括有效、无效两种,所以原始数据库中的部分数据可能会定时地清空,但是通常不会删除,随着数据量的叠加,其数据的类型也在逐渐的丰富。而且云原生技术智能运维架构的算法平台可以根据实际场景来设计,基于微服务架构的基础上,属于相对独立的微服务组件,可以不断的扩充场景再进行设计与开发,在后期的运营阶段能够实现多场景的串联应用。

三、结束语

目前我国已经应用了5G技术,这对于云原生技术智能运维架构的发展而言,创造了有利的环境,所以云网融合技术的持续发展,需将云原生技术智能运维架构的关键技术作为主体,才能夠引导并管理云原生系统,帮助现代通信运营软件实现快速的发展,而云原生技术智能运维架构又需要多种算法和完善的技术支持,因此相关领域的技术人员仍需要不断研究,以谋求云原生技术智能运维架构关键技术的持续发展。

参  考  文  献

[1]郭涛.Aruba持续进化的道与术[J].网络安全和信息化,2021(02):13-16.

[2]薛龙,陆钢,周奇,张会炎,万亭君.面向云原生的智能运维架构和关键技术[J].电信科学,2020,36(12):105-112.

猜你喜欢

关键技术
‘阳光玫瑰’葡萄绿色高效栽培技术
防雷关键技术在自动气象站系统中的应用探究
网络安全态势感知关键技术研究
基于多源卫星影像基础地理信息数据关键技术研究
无人机集群作战关键技术及发展趋势
AI全科教师开发:基础、模型与关键技术
多电飞机起动/发电系统研究和关键技术分析
空域分类关键技术及应用研究
电气控制与PLC应用关键技术的改进方法研究
TD—LTE关键技术与发展展望