基于RPA状态流转的规建维优基站健康自评估系统
2020-07-23张琳
张 琳
(中国联合网络通信有限公司四川省分公司,四川 成都 610016)
0 引 言
随着电信运营商集约化运营体制的推进和2G、3G、4G、5G混合网络运营,电信运营商的基站数目越来越庞大。但是,大部分网络运维工作仍需依赖重复的手工流程实现。烟囱式的运维模式和传统的建设转维模式,使网络无法进行全生命周期统一管理,数据孤岛严重,故障无法实时感知。
为解决上述问题,网络运维支撑软件架构必然向平台化、智能化、可视化和个性化方向演进。新开通基站全流程管控和健康评估作为网络运维工作中的重要环节,目标是提高运维人员运行监控实时性,及时发现隐患问题,提高网络用户感知。
1 基站状态流转健康自动评估系统架构及设计
(1)基站状态流转健康自动评估通过可视化方式创建业务模型,简化模型的学习和定义门槛,使自动评估功能快速适应网络变化。
(3)系统架构具备一定的灵活性、可扩展性和安全性,并支持大规模的数据并发和高吞吐量。它主要分为数据源、接入中心、存储中心、统一操作平台、应用中心及管理中心6部分。
1.1 基础平台架构
基于状态流转的规建维优基站健康自评估系统,属于智能运维平台中多个RPA机器人组合起来的一个专项应用。基站健康自动评估系统的能力基于智能运维平台中的服务组件,以满足当前管理内容为目标,按规则评估基站告警和性能指标,充分利用已有维护系统架构储备和知识积累为基础实施开展,采取兼容并蓄、差异为先的原则,对外构建统一指令接口层,实现网管接口发放统一,无缝衔接各厂家网管系统,全面高效地支撑现有网络拓扑设备的日常运维。
1.2 流转状态部署
系统采用组件化和微服务化开发,结合使用场景等特点,合理部署各服务的节点数和资源分配情况。整个部署过程简单、方便、灵活,且耗时相对较少,如图1所示。
图1 流转状态流程部署图
1.3 系统功能部署
基站状态流转健康自动评估系统以流程编辑器为主要驱动,主要由以下功能组成[1]。
(1)个人中心:对接仪表盘接口数据,实现定制化仪表呈现。
(2)流程编辑器:用于创建复杂的流程方式(可视化建模)的取数、网管基站状态查询与评分机制。
分别取橡木桶贮藏后的猕猴桃果酒样品和 4 ℃玻璃瓶密封保存的猕猴桃果酒样品,各3个重复,随机编号后进行品尝打分。样品的感官评定采用评分法,在学校范围内筛选了2名具有专业资质的酒类品评教师和10名经过酒类品评培训的学生(男、女各5人)组成品评小组。受试者被要求对果酒的整体感官质量(视觉、香气和味道)进行评分,评分范围在0到10之间。为此,将果酒样品随机编号,并用培养皿覆盖。在20~22 ℃进行盲评,在品尝过程中提供清水,品评前后使用清水漱口。单独打分,避免互相影响,收集评分后去掉最高分和最低分各一个,然后计算平均值[15~17]。
(3)指令配置:用于创建指令和指令解析模板以及简单的查询任务。
(4)数据拼盘:用于通过指令采集数据和存储。
(5)常用信息管理:用于创建接口、脚本、数据库以及FTP服务器等支撑查询的配置。
(6)任务管家:用于按计划时间调度任务。
(7)消息中心:为各个应用系统或查询对应专业提供便利统一的消息接入、消息推送、消息处理及消息管理能力。
(8)数据接入平台:用于应对多种数据源的数据采集。
2 基站自评估系统功能描述
2.1 状态流转系统实现逻辑
系统主要运行逻辑为“采集数据—判断数据—输出判断结果”。通过模块化设计,主要按实现逻辑将系统分为6个模块——站点数据入库,初始化基站数据,工程单验告警查询,站点KPI入库,健康报告生成,健康评分以及状态跳转辅助流程。通过6个功能模块将所需数据汇总至对应的数据表上存储下来,映射至仪表盘的数据接口进行基站状态流转的定制化呈现,从而达到对基站入网生命周期的呈现。
2.2 状态流转系统功能模块解析
(1)开通前。通过平台数据对接获取逻辑站点名称信息,过程中以逻辑站点名称进行网管登录状态查询。若逻辑站点出现一个小区已激活则会流转到观察期,若未有任何一个小区激活则仍视为开通前。
(2)观察期。逻辑站点出现一个小区已激活则视为站点进入观察期。观察期会对入网基站进行连续10日的即时告警查询、网优KPI查询以及用户数业务量评估,并按规则输出站点健康报告。若达标进入状态试运行;若不达标,则停留于状态观察期。
(3)试运行。通过健康评估的站点所处的状态,如图2所示。
2.2.1 站点数据入库
通过平台构建定时入库流程,并对入库数据进行必要筛选,按照所需对应的基站数据录入指定的表中构成起始数据。在此过程中会生成状态——开通前。
2.2.2 初始化基站数据
网元录入系统后,配置网元的登录模板,支持telnet/ssh登录方统一配置,包括统一网元配置和网元连通性配置。
(1)统一网元配置。根据实际情况搭配统一直连终端配置和统一登录指令配置,生成网元的登录配置。
(2)网元连通性配置:对配置网元进行连通性测试。
通过网元登录设置后,以流程编辑化完成网元数据的初始化,成功登陆基站获取小区状态后生成状态——观察期。
2.2.3 工程单验告警巡查
工程单验告警巡查可通过指令模板构建的指令模板模型或者流程编辑器构建的流程模型来调用执行。指令配置可按需扩展,实现跨专业、跨厂家、跨设备的指令集管理。指令集配置约定了执行指令的网元类型、厂家、设备型号、使用的登录模式、指令内容、可选择的指令解析模板以及指令结束符号等。调用指令组件的模型将指定哪些网元执行哪些指令,执行指令按哪个解析模板进行解析推送给指令服务,指令服务执行和解析后输出。
2.2.4 站点KPI入库
采用内嵌脚本定时收录网络站点相关的KPI数据至对应的数据库。
2.2.5 健康报告生成
通过观察期连续10日对基站进行告警检查判断和KPI读取判断。根据既定健康报告规则输出基站健康报告,完成观察期站点健康评估。满足条件进入试运行状态,不满足则停留在观察期,并有平台流程继续检查对应状态,直到达到既定的健康水平才准许站点进入试运行状态。在此过程中会生成状态——试运行。同样,通过流程编辑器内嵌的各个组件有机形成报告生成模式,并根据不同厂家进行分区报告存放,通过定制化的iframe仪表盘呈现站点导流状态和报告下载按钮[2]。
2.2.6 健康评分和状态跳转辅助流程
可视化配置异常检测规则,实现查询结果规则的任意配置。
2.2.7 状态流转管控仪表盘
根据既定状态流转规则产生相应的管控数据表,根据所需数据表使用仪表盘功能呈现所需数据,可实现按地市、按工期、按厂家呈现,做到一应俱全快速知晓新站入网状态,通过邮件节点或者工单系统快速将现网情况反馈至对应处理人。
3 系统应用的总结及思考
3.1 跨厂家、跨系统汇聚查询获取基站状态
无线网维护中均涉及多个厂家的告警查询,质量监控涉及建设、维护、资源以及性能等多系统查询。维护人员每次都需要通过登录不同厂家的网管,记住不同厂家的指令,在信息孤岛中进行人工串联,造成了很大的人力浪费。因此,建议利用流程编辑器、数据拼盘、常用信息管理等功能完整模拟人工工作流程,根据定制流程编辑实现不同厂家不同规则不同系统的自动录入关联,使得流程具备自动判断能力。
3.2 分区输出健康报告实现实时网络全流程管控
分区输出厂家健康报告后,通过平台定制开发将对应健康报告推送至站点健康报告池列表中,使得运维人员对每个站点存在的健康问题一目了然,并快速做出处理预案,解决了以往运维人员、优化人员需要定期提取告警、采集网络KPI的问题,减少了专业流转层级,提高了一站式发现问题的速度,缩短了流程处理时间,有效减少了建设过程中因不规范建设流程、数据配置导致的网络质量异动。