APP下载

基于RPA技术的自动化运维实践研究

2022-11-27夏明昕刘梦荞王敬忠孙百贺

通信电源技术 2022年4期
关键词:存量运维流程

邓 洁,夏明昕,刘梦荞,王敬忠,张 婷,孙百贺

(中国移动通信集团设计院有限公司 山东分公司,山东 济南 250001)

0 引 言

随着物联网、大数据、云计算等新一代技术的迅速发展和不断成熟,探索实施数字化和智能化转型来进一步提质增效是各大企业关注的热点问题。其中,机器人流程化(Robot Process Oriented,RPA)技术能够降低失误率、提高工作效率、提升操作合规性,为企业自动化、智能化运维管理提供了重要技术支撑,使既有的业务架构和运维模式转型升级更具可行性。

当前,RPA技术逐渐被应用在各类信息系统当中,广泛服务于金融、医疗、物流、零售以及制造等领域,发挥着不可或缺的功能作用。基于RPA技术的自动化运维管理,RAP作为非侵入式、快速部署、灵活运用的软件,能够全天候运行,保证流程的运行符合规范要求并且无差错,同时也在一定程度上缓解了企业数据和信息孤岛的经营管理痛点,进一步提高企业数字化程度和运转效率。由此,如何把RPA技术深入应用到自动化运维领域,是当前运维技术、业务架构和管理模式转型升级过程中亟待解决的问题[1]。

1 分析当前运维管理中存在的问题

1.1 运维部门人员存在的问题

1.1.1 人力成本日益高企

随着经济社会日益高速的发展,人口红利时代逐渐消失,越来越凸显劳动力不足的情况。具体到运维行业的人才培养,由于其培养周期较长,前后投入的成本相对比较大,因此各大企业特别是知识型企业的人力成本日益增加,提质增效、转型升级的要求越发迫切。

1.1.2 人工运维精力有限

运维人员本身的劳动时间、精力有限,在保持基本业务能力的同时,很难保障对实时变化的业务需求具备持续高度的灵活性,无法确保多个设备和基站能够一直保持良性且全面有效的运维管理。

1.1.3 重复性操作风险大

当前,企业各类运营业务越来越集中,运维运营管理工作越来越复杂,其中的重复性工作较多,长期重复性工作容易导致人工操作失误、人工响应效率不及时以及运维管理经验无法有效沉淀等问题,风险较大。

1.2 运维存量系统存在的问题

1.2.1 更新较难

互联网技术迅速发展,传统的办公自动化(Office Automation,OA)、系统应用和产品(System Applications and Products,SAP)、企业资源计划管理(Enterprise Resource Processing,ERP)等信息系统尽管已经在诸多企业中得到广泛应用,但其遗留问题在数字化转型趋势下暴露出来,也无法满足新需求。而大多数企业的存量系统较多且由于阶段性的技术局限性、系统开放性不足,导致存量系统的迭代更新和升级改造成本极高,还容易因为更新引发使用操作故障问题[2]。

1.2.2 信息孤岛

传统运维系统通常按照特定领域或专业门类单独设置,形成各自为政的信息孤岛状态,无法有效互联互通,更无法用于跨部门、跨专业的数据共享、联动和综合应用,使得实际运维管理过程会耗时费力,不能快速有效查找、诊断和处理故障,影响系统和设备维护效率和质量。由于技术的限制,传统系统在业务设计和开发方面就已经遗留了当时难以解决的问题。业务系统直接的数据相互隔离形成了数据孤岛,想要融合需要很高的代价去开发,使用接口对接、集成平台、数据平台等传统方法能够解决一些问题,但笨重迟钝,无法灵活支持新商业环境下多发、多变、多样化、碎片化以及高时效的需求。

1.2.3 效率较低

企业存量系统内,仍然存在大量重复性的工作,需要耗费一定的人力进行处理,降低了系统的效率,加之人工操作不可避免的失误概率,进一步降低了这些信息系统的有效性。

2 RPA技术概述

RPA是指依托于各类先进信息技术手段的虚拟的劳动力,通过模拟并增强人类与计算机的交互过程,模拟特定操作或整个业务或IT流程中的步骤,包括操作数据以及在不同应用程序之间传递数据、触发响应或执行事务等,对任务根据预先设定的程序操作指令进行自动化的处理,实现业务流程的自动化,帮助人们完成日常工作中需要反复重复的流程。RPA不仅可以模拟人类行为,而且可以利用和融合规则引擎、光学字符识别、语音识别、机器学习及人工智能等前沿技术来实现其流程的自动化的目标。

RPA平台一般主要由设计平台、机器人、控制平台、人工智能(Artificial Intelligence,AI)平台4个部分组成。

(1)设计平台。编辑工具,利用可视化界面设计出各种自动化的流程。通过低代码或者无代码编程,结合其他编程语言,实现产品易用性、扩展性和可用性。

(2)执行机器人。机器人负责根据设计平台设计完成的程序,执行对应流程,是整个平台的执行中心。

(3)控制平台。该平台负责对执行机器人进行集中调度, 实现单机多机器人或多机协调。

(4)AI平台。该平台提供自然语言处理(Natural Language Processing,NLP)、光学字符识别(Optical Character Recognition,OCR)等AI能力,集中提供服务。

3 RPA技术优势

RPA技术是采用智能化软件程序模拟人在计算机上的操作,并增强人机交互的过程,执行预先设定的流程和规则下的大批量、重复性的任务,做到24 h无间断、零差错。RPA就像一位机器人员工,能自动化、智能化操作既定的业务流程,不但速度快,而且几乎不出错。

对比传统人工操作的工作方式,基于RPA技术的自动化运维模式是一种新型运维模式。其技术核心能力是模拟、代替人的劳动,信息系统的自动化运作有着自动执行既定流程和跨系统互联互通、协同工作的能力。通过编程控制机器人处理一些日常事务,比如处理一些重复性较强、工作量较大且主要基于规则运行的后台事务,可以通过规则引擎及调度策略建立起一套完善的运维流程机制,使其在特定的时间内触发来开展运维工作,实现对运维过程的监控管理以及成本管理,促进运维操作规范化、无纸化、智能化。整个流程可以做到可控、实时、即时,相对于人工来说,往往具有更高的准确性。具体而言,体现在“两个特性”和“三大价值”的技术优势[3]。

3.1 两大特性

3.1.1 非侵入性

非侵入性主要体现在“三不需”,首先是不需要更改存量系统的运行方式。基于RPA技术的自动化运维会严格按照存量系统的设计基础和要求,可以做到不引发和不增加存量系统的运维风险,也就不会干扰存量系统的运维秩序。其次是不需要增加存量系统的授权设定。基于RPA技术的自动化运维不会脱离存量系统的授权要求和既定设置,不需要原系统新增或开放特殊权限,也就不会造成存量系统的信息安全风险。最后是不需要开通存量系统的接口。RPA技术采用独立的第三方运行方式,不用对存量系统的代码升级改造,不影响存量系统的架构,也不需要专门新增开放式的接口。基于这“三不需”,融入RPA技术的自动化运维可以做到整合传统存量系统程序、集成协同应用,在不同企业内部复杂应用环境中避开诸多限制和障碍,从而实现灵活应用。

3.1.2 降本增效

RPA技术更易于开发、开发周期较短、开发费用低,因其丰富的可视化编程框架界面,可以通过拖拉拽、中文编写等便利方式,无需编写代码或借助少量的代码就可以快速生成应用程序,由此降低了编排的门槛。相比较代码级改造和中台系统集成开发等方式,采用RPA技术既可以基本实现相似功能,还可以缩短开发周期,并且降低了开发成本。这一特性可以满足当下绝大多数企业的升级改造需求,辅助各类企业新老系统之间整合,有利于绕开诸多限制而实现集成化应用,自动化、智能化完成工作。

3.2 三大价值

3.2.1 业务层面

运用RPA技术,可以作为接口打通存量系统间的数据,在继承人工实操经验将烦琐的、重复的流程进行预先设定和优化的同时,通过触发企业不同存量系统之间的数据,打通企业上下游业务事项,实现整个业务线的自动化运转。

3.2.2 工作层面

大多数企业存量系统普遍存在数据质量差、数据整理环节不全或缺失、手工输入整理费时费力以出错等痛点,而基于RPA技术的自动化不间断运行,只需要人工辅助操作,可以很大程度上降低人力成本,减少人为失误,将员工从低效、重复、琐碎的事项中释放出来参与更高阶的工作,进一步促进降本增效、激发创新活力。

3.2.3 技术层面

RPA技术作为传统平台开发方式的一种有效补充,与传统的ERP、OA、客户关系管理(Customer Relationship Management,CRM)等IT系统不同,可以嵌入其他如BPM等传统系统软件当中完成部门、专业的重复性工作,也可以运行在更高的软件层级,直接连接顶层软件。它不会对已有软件系统进行侵入影响,从而在协助企业提升效能过程中,保障企业已有IT系统功能平稳、运行可靠。

4 RPA机器人运维管理

目前,RPA技术在国内还属于较为新兴的应用,尚未被完全普及。笔者实践总结发现,RPA技术适用场景的关键点主要是数据密集、高错误率、有固定规则或重复性的工作、流程由系统触发以及需要在规定工作时间以外进行工作等。只要IT运维工作场景中,符合以上一个或多个关键点,均具备适用性。实际应用中,PRA平台主要由设计平台、机器人、控制平台、AI平台4个部分组成,一般着眼于以下3个方面来构建和维护RPA机器人。

4.1 权限控制和日志记录

RPA 软件的每个操作都有日志记录,保证了每个操作都有迹可循、有据可查。当遇到未知的异常情况时,可通过运行日志、状态截图分析异常发生的可能原因,并综合通过增加分支判断条件以及调整运行环境等方式方法来解决此类问题。

4.2 RPA技术的运行环境

RPA的实施需要利用脚本编程,要求在运行过程当中尽量减少随意改变运行环境的现象,不然可能因为环境的变化导致RPA运行异常。假如面对页面变化这种操作对象发生变化的“被动”状况,一般要先找到操作该页面的相关RPA 运行流程,分析RPA在该页面进行了什么样的操作,页面产生的变化影响既定流程的处理与否。如果会造成影响,则重新通过抓取页面元素、进行流程的回归测试的方式重新调整完善RPA。

4.3 必要的管理监测手段

RPA在大多数应用需要24 h自动化运行,其稳定性与管理手段密不可分,一般来说主要在于两个层面,分别是是日常运维管理和业务监测管理。日常运维管理上,需要运维人员不断在程序代码、运行程序、运行周期以及人机协同方式等方面进行优化,确保RPA运行稳定和提升。业务监测管理方面,主要通过运维监控系统运行状态、异常事件等进行可视化监控和管理,由业务管理人员和运维人员一同开展监控和管理,出现异常情况共同探讨原因或调整业务流程设计,使其达到某一预设的RPA可正常执行,且持续改进优化的业务规则。

5 基于RPA的IT自动化运维场景分析

RPA技术在IT运维领域的应用,可以帮助IT运维人员根据既定的规则进行自动化处理,降低工作量的同时,又能保障准确度。RPA在IT运维领域拥有广泛的应用空间,IT资产管理、权限管理、用户管理、系统巡查、环境部署以及数据备份等重复性运维任务都可以完成。

结合长期的运维经验,总结分析了IT运维服务中适用RAP的主要场景如下文所述。

5.1 用户密码重置

用户密码重置需要用户向系统管理员提交重置密码请求,然后等待管理员给用户发送确认邮件后,再按照指示登录绑定邮箱点击链接确认是本人操作。

在用户确认完成后,管理员才会登录信息管理系统给相关用户重置密码并发送新密码给用户。RPA机器人接收到重置密码需求后,自动发送确认重置密码的邮件到用户绑定的邮箱。用户手动登录邮箱并点击链接确认是本人进行的密码重置操作后,软件机器人自动登录软件信息管理后台查找用户信息,自动点击密码重置按钮,完成后发送带有新密码的邮件给客户,同时自动记录日志。

5.2 权限变更

随着企业IT系统架构的日趋复杂和云计算、大数据等技术的应用,网络设备、服务器、中间件、业务系统不断增加,类似于各种系统开账号、重置密码等操作会以碎片化的方式占用IT运维人员大量时间,导致更加重要的维护、部署、管理工作捉襟见肘,效果不理想。

RPA机器人会第一时间处理各个系统、平台的账号申请,自动登录主数据管理系统进行查重并执行后续步骤,包括开通、维护、同步数据、通知到人。

IT运维人员无需在多个系统间切换,进行烦琐的开户流程,节省大量时间,可用于更重要的运维工作。类似的重复操作都可以由RPA完成,不仅高效,还规范,一致便于管理。通过标准流程的建立与管理,能够提升IT运维的效率和质量。

5.3 系统巡检

许多企业的IT运维管理模式存在不足,缺乏发现故障的流程化、完整的跟踪记录和责任的划分与监督。问题出现后很难快速、准确地找到根本原因,也无法及时地找到相应的人员进行处理和修复。

RPA机器人可以定时完成各个系统的日志收集,并对信息进行分析、核查,记录系统运行状况。出现问题时,将任务派发给IT运维人员,并对执行进度进行监督、记录、汇报。

系统巡检工作转为自动化操作,故障事件能得到及时、快速的处理,减少运维延迟。凭借跟踪记录得出的完整检查报告,能直击故障症结,降低人为失误及成本。

5.4 监控预警

传统IT运维通常是等到IT故障出现后再由运维人员采取相应的补救措施,运维部门的服务质量和维护成本仍存在很多问题。由于故障预警机制不完善,往往是故障发生后才会进行处理,影响企业的业务稳定性,致使工作停滞,甚至出现严重故障,造成经济损失和难以补救的恶劣影响。

RPA机器人可以自动介入监控数据源,根据设定的条件判断异常状态,自动化执行告警,通知管理员,并会整理报表,对数据进行汇总、分析和展示,达成可视化呈现。

通过自动化监控各个系统、平台,实现故障或问题综合处理和集中管理。通过有效的条件设定,实现准确的故障预警功能,帮助企业规避IT环境的潜在风险,防患于未然,降低运维支出,增强抗风险能力。

5.5 服务器和应用程序监控

对每个IT部门来说,服务器崩溃、停机都是噩梦般的存在,任何一次意外停机或崩溃都可导致数据丢失、作业停止,从而给企业带来重大损失。为了避免这种不必要的损失并确保业务的连续性,企业可以选择在其服务器和应用程序监控过程中使用RPA。

RPA机器人可以自动关闭、重新引导、重新配置和重新启动各种类型的服务器,帮助企业降低IT运营成本,还可以在非工作时间内计划停机时间,节省开支。

5.6 自动化测试

为了减少系统功能上线后对原有功能的影响最小化,系统功能上线前常规下运维会全面测试功能级的通用测试场景,特别是重大功能割接时,往往因为测试的进度延长变更时间,加上需要人工操作,也会出现测试不全面的情况。为了确保测试环节的有效性,可使用RPA工具自动执行,并自动输出测试结果,确保新功能上线不会涉及到原有功能,避免了人为的因素,提高了测试质量。

5.7 常规问题诊断

在日常运维中,IT运维团队大多数时间更多是被简单而耗时的系统诊断所淹没。RPA机器人可围绕IT应用和基础架构自动执行各种复杂的系统管理任务,例如定期的诊断。RPA机器人的定期诊断工作使运维团队在用户注意到故障之前做出响应告警,提高了预防效率。

上述场景仅小范围列出了一些常规的运维工作场景,无法覆盖全部的场景。但原则上只要符合RAP的重复操作、规则明确两个基本规则,都可以通过RPA技术提高工作效率和运维智能化水平。

6 RPA机器人自动化应用案例

在实施RPA技术自动化运维时,需要按照一定的方法进行统筹谋划,先行评估相应企业的RPA 环境和实施方案,再结合实际设计好RPA自动化的既定流程后匹配RPA,尤其是要对核心、关键控制点和各个业务流程进行梳理、分析、研判,在实施后全面监控其实施效果。与此同时也要保证企业各个流程参与者的参与度,才能持续根据业务人员反馈和RPA运行过程出现的问题和异常情况加以改进。

以某大型国有银行为例,该银行在信贷业务合作平台业务场景中就引入了RPA技术。在信贷业务公积金信息报送事务工作中,该行业务人员需要每天在规定时间内登录柜面管理系统中,手动去做几千条数据的归集和录入工作,其中一些数据还涉及到不同业务板块的工作内容,操作起来比较烦琐且调用整合不便利。像这样重复、耗时又对时效性要求很高的工作事务,不仅占用高昂的人工成本,还容易因为人工操作不可避免的疲劳倦怠出现失误,加上银行业越来越严格的合规性要求,倒逼该银行主动寻求突破,力求解决这一痛点。通过引入RPA技术在该行的信贷业务合作平台上,RPA机器人可以自动登录相关系统,按照权限设置获取相应数据并加工,再按照既定规则进行新增、录入、删除、更新等操作,并及时提醒业务负责人审核与审批,把很大一部分重复烦琐的工作量承担起来,极大地解放了银行业务人员的双手,不仅保质保量保时完成既定工作任务,还能在规定时间内处理好大量数据并保持极高的准确度和灵敏度。通过引入RPA机器人处理基础性的信贷业务操作,大大降低了银行的运营成本,也提升了业务运营效率。

以某大型工业企业为例,该企业的门户网站是基于统一技术架构进行建设运维的,管理员无法直接通过数据库得到到门户网站数据。日常如果需调整内容,往往要进行烦琐重复的操作,这类问题也是传统软件程序开发设计局限性造成的无法解决的遗留问题。例如迁移门户主页新闻内容时,该板块涵盖了上百条视频通信和上千条文字通信。由于无法直接获取数据库来实现迁移,也无法开发专用接口作批量处理,如果此项工作全部由人工手动操作,需要经过登录、收集、修改、保存等近20个步骤才能完成一条视频新闻的迁移工作,相当于一个人单独操作需要半个月以上的时间。该企业引入了RPA机器人,通过爬取功能实现了自动化任务处理,仅用4 h就完成此项任务,实现了百分百的自动化操作,节约超万元的人工成本。任何适配并取得成效的RPA项目都不会是一种孤立性产出,都需要建立在企业实际情况的基础上,加入集体的智慧力量才能达到。

以某通信企业为例,该企业的专业虚拟网络(Virtual Private Network,VPN)系统因为安全性要求设置了90天未使用账号自动锁定的安全策略,但本系统未提供自动解锁功能,因此VPN账号解锁的功能一直采用用户电话申告管理员,然后由系统管理员人工进行自动解锁功能,耗费了维护人员大量的精力。VPN系统属于硬件类VPN产品且属于厂商提供的一体化的标准产品,原厂往往不愿意进行定制化改造,以免造成产品线功能不统一、无法统一管理。因此该企业引入了RPA机器人,通过5G消息+RPA方式,由用户自主申请解锁登记,由RPA机器人代替维护人员检查申请信息,自动进行账户解锁并及时通知用户解锁。通过此方式,真正避免了维护人员的重复性工作,既提高了用户体验、节约了开发成本,又提高了运维效率,使运维人员能够更有精力挖掘自动化场景运维场景。

7 结 论

以RPA技术为代表的创新成果不断在驱动人们生产方式、生活方式的变革,为各行业的数字化、智能化转型提供有效的思路与方法。据统计,当前我国的RPA技术市场还是一片蓝海,未来3年的增速将维持在70%以上,可见我国的RPA行业规模可期、前景可观。尽管存在一些技术改进以及数据安全的客观问题,但随着大数据和AI智能化技术的成熟和不断发展,RPA也将随着AI之势迎来更快速的发展,RPA机器人也将借助AI的能力升级改造,像人一样学会“思考”和“学习”,基于RPA技术的自动化、智能化运维模式也将势不可挡地到来。

猜你喜欢

存量运维流程
吃水果有套“清洗流程”
2020年10月30个重点城市商品住宅供求比、存量及消化周期(单位:万平方米,月)
2020年1月64个重点城市商品住宅供求比、存量及消化周期
存量时代下,房企如何把握旧改成本?
基于GPS的电力运维轨迹定位系统
与元英&宫胁咲良零距离 from IZ*ONE
IT运维管理系统的设计及应用
违反流程 致命误判
四川省高考志愿填报流程简图
腐败存量