APP下载

基于班组的现代民航信息智能运维管理实践分析

2024-12-03曹闪乐美龙张茜石磊

互联网周刊 2024年22期

摘要:近年来,随着大数据、人工智能等技术在民航业务运行生产线上的应用,以及不同代际年轻人表现出的不同特点,现代民航信息运维管理工作面临“人、机、环、管”不同方面的挑战。本文深度剖析了各方面的现状,结合班组管理、基于云的运维体系和文化管理,对现代民航信息智能运维管理思路展开研究,提出了“四梁八柱”的班组构建方法,班组与岗位的有效结合与相辅相成的方式方法,并结合现代年轻人的特点,在新技术催生的全生命周期项目管理理念的指导下,从PDCA循环角度分析了基于班组开展现代信息智能运维工作的实践思路。

关键词:运维管理;民航班组;智能运维;PDCA循环

引言

现代民航信息运维管理是一个复杂而富有挑战性的领域,需要运维团队具有广泛的技术知识、灵活的思维方式和强烈的创新精神。本文将从人机环管角度阐述相关背景与现状。目前,在运行一线承担民航信息运维工作的人员队伍中,“90后”和“00后”占比约80%,他们具有独特的个性和价值理念,有积极向上的精神和独立自主的思考方式,更注重个人的感受[1]。因此,旧有的管理方式难以充分激发这些员工的工作热情。此外,随着大数据的发展、5G时代的到来,新技术的涌入和海量数据的增长,民航信息运维管理工作成为一个异常复杂而广泛的难题,而这也是现代民航信息运维管理工作的难点之一。

1. 研究背景

近年来,随着人工智能技术在民航业务运行生产线上的应用,敏捷[2]和开发运营一体化(development operations,DevOps)成为现代信息运维管理的两大趋势,智能运维(artificial intelligence for IT operations,AIOps)也已开启探索使用阶段。敏捷方法通过直接沟通提高工作效率,从而快速响应变化,同时注重团队合作,通过良好的沟通适应各种变化的需求[3]。DevOps是一种集开发与运行于一体的软件工程方法论,旨在促进开发团队和运维团队之间的协作,以实现更快速、更可靠的软件交付。AIOps通过“去规则化”的自我学习方式,实现了由智能调度中心管理的无人值守运营[4]。云计算和容器化技术的发展在简化IT环境、降低运维成本的同时,对运维人员也提出了新的技能要求。

据最新公布数据,截至2023年末,全国60周岁及以上老年人口达29697万人,占总人口的21.1%,全国65周岁及以上老年人口21676万人,占总人口的15.4%,根据联合国标准,我国已进入“中度老龄化”社会;另据国家卫生健康委预测,在2035年左右我国将进入重度人口老龄化阶段[5-6]。然而,与人口老龄化程度的加深形成鲜明对立的,是庞杂业务和基于种类繁杂软硬件基础的上层应用的迅猛增长,信息运维复杂度也随之快速增大,这对自动化运维甚至智能运维提出了紧迫要求。自动化运维或智能运维可以降低对人工运维的依赖,有助于降低人为出错概率,同时提高检测频率与准确性。

民航系统涵盖了多个单位和组织,在数字化民航推进的过程中,民航信息系统是支撑民航系统运行极其重要的一个环节。随着被管理对象性质特点的变化、社会环境的变革,以及人工智能时代的到来,现代民航信息运维管理工作对管理思想、管理手段提出了新的要求与标准,管理者必须紧跟时代脚步,不断改变管理思路。

2. 运维管理的“四梁八柱”

班组作为民航管理工作的基本单位,是支撑起整个部门重点工作的大梁。班组以开展安全生产为目标的同时,肩负着培养可发挥部门支柱作用的技术骨干的重任。现代民航信息运维管理部门也是基于班组开展相关工作。

OSI或TCP/IP的计算机网络体系结构是IT领域的国际标准,从下到上涵盖了硬件、网络、传输和软件应用等,并分别定义了各层的特性与管辖范围。民航信息运维部门作为IT领域的专业部门,可参考OSI或TCP/IP的计算机网络体系结构划分班组。例如,可划分为硬件维护、网络与安全、系统、软件应用业务班组,也可根据部门实际人力资源情况对相近方向进行整合,如图1所示。

硬件维护班组负责物理设备、电源线缆连接、端口使用等情况的监测与维护;网络与安全班组负责网络连通性、网络策略配置与调整、网络安全策略配置与调整、网络安全规则库的更新与维护等;系统班组负责操作系统的部署、配置与调整、系统资源的规划与管理、数据库系统的管理与维护等;软件应用业务班组负责上层业务的部署、配置、软件功能与运行的维护等。

负责硬件、网络、系统、软件应用等四个方向运维工作的班组构建起民航信息运维工作的“四大主梁”,简称“四梁”,支撑起整个民航信息运维部门的总框架。

每个班组尽可能多地培养技术突出的人员,以确保互相之间能替补,确保整个班组生态的平稳运行。每个班组下两名技术突出人员可承担起民航信息运维的“八大支柱”,分别为硬件技术原理支持专家、硬件设备维护维修专家、网络技术原理支持专家、网络维护与故障处理专家、系统组成原理技术专家、系统维护与故障处理专家、软件及中间件原理与运行机制支持专家、软件及中间件维护与故障处理专家,简称“八柱”。“八柱”是成就强鲁棒性运维部门的基本形式,人力资源充足或者人员能力强的情况下,可建立更多强技术支柱或管理支柱,以便在“八柱”之间建立互备、替补等关系。

班组通过发挥“传帮带”精神,以老带新,建立技术人员和管理人员梯队,进而确保民航各单位信息运维部门管理工作在信息技术迭代更新较快的大环境下做到追新托底、稳步推进。

3. 责任承包制方式的岗位管理

班组与岗位的有机结合,可以采用承包责任制方式,将管理者与所有者之间的责任和利益紧密联系起来,通过明确责任和激励机制,有助于激发管理者的主观能动性,提升企业的经济效益和市场竞争力。

一个班组承包与本班组工作内容最相近的岗位,承包班组负责协助岗位完成岗位巡检手册、技能培训、零备件耗材的梳理与储备、主备机的储备与切换方案的制订、应急处置方案的制订与演练、自动监控项的制订与调整、故障分析、系统资源使用情况分析与预测等工作。在出现重大故障时,立即开展远程支持,随时做好到现场支持的准备;在重大业务变更前,各班组协调技术骨干分析与承包岗位相关的变动内容,根据变更内容制订变更策略与方案,各班组将最终分析结果汇总至一个变更文档中讨论定稿,在业务变更当天,参与业务变更制订的技术骨干须在现场支持至业务正式上线。

随着经验的积累和技能的不断提升,值班岗位的工作内容则可按紧急、重要、难易程度区分开,值班人员侧重点放在应急处置与紧急恢复业务上;班组可作为二线专业技术支持,更侧重研究深层次的运行原理与机制,挖掘事件背后的原因,为一线值班人员提供强大的专业技术指导,为杜绝相似故障提供解决方案并在有限期内落实解决方案。一线值班人员经过岗位上的历练,在班组的培养与带领下,不断成长为技术骨干,技术骨干的充盈进一步壮大班组,如此良性循环,可为日后紧急成立技术攻坚突击队创造优良的人力资源条件。

4. 纵横交错构建强鲁棒性业务运维网

班组和岗位是横向管理的表现形式,各班组与岗位最终服务的对象都是用户业务或系统,用户业务或系统更适合使用纵向管理方式。

横向管理必然会涉及多个班组任务的实施。如系统组对系统的维护或者备机切换,必然会引起网络方面的告警和上层软件应用业务的短暂中断;网络与安全班组对网络的调整或者安全加固,可能会引起系统间的通信暂停和软件业务应用的中断;如果硬件维护组在未准备好硬件备机的情况下遇上单点硬件设备的故障,则很可能会导致从网络到系统及上层应用的中断。

纵向管理过程中必然会涉及业务系统从硬件到系统、网络再到软件资源的管理与应用,各系统纵向的相关信息清晰地整合在一起,才能有利于高效地管理整个系统。

因此,在大数据、虚拟化、云计算和人工智能等新兴技术环境下,以及人力成本不断被压降的趋势下,如何让各班组有机地结合在一起,纵横交错构建起强鲁棒性的业务运维网,最终OfKNOlOuQoWCwCdGe24iR4o57151bof6VkoLkLCH5tQ=产出统一的、高质量的成果,支撑生产活动的有序开展,是对现代民航运维管理工作的高标准要求。

本节将以PDCA循环管理模式为切入点,阐述开展现代民航信息运维管理工作的思路与措施。PDCA循环管理模式是开展全面质量管理所应依据的科学管理程序:P(planning)——计划职能;D(design)——设计方案和布局;C(check,communicate,clean,control)——4C管理,即检查、沟通、清理、控制;A(act,aim)——对总结检查的结果进行处理,按照目标要求行事,如改善、提高[7]。

4.1 科学制订工作计划(P)

制订工作计划的方法有很多种,其中目标管理法更适合上下层级比较明显的企事业单位。上级部门通过总目标统摄全局,层层分解总目标,管理者与下属共同制定分目标,依据分目标进行自我管理,根据分目标进行考核、奖励与惩罚。

根据工作内容目的等收集资料、细致分析环境,充分估计整体工作量,确定工作任务的目标,通过目标拟定达成目标的多个方案,对各方案进行评估并选出最佳方案,针对方案设计各阶段目标,形成合理的目标结构,初步粗略估计每一阶段的工作量和难度,编制具体的行动计划,最终形成计划书。

将任务分派到各班组成员之前,运维管理者须考虑根据组员能力分派工作的同时,还须考虑其习惯和不同代际员工的心理特点。不同代际的员工思想差异是巨大的,对于“70后”的员工来说,管理人员下达指令即可;对于“80后”的员工而言,则需要在下达指令的同时讲明白其中的逻辑;而对于“90后”和“00后”的员工而言,管理人员须了解他们是否愿意接受这样的工作安排,以确保他们愿意配合开展工作,将下达命令转变为在工作计划范围内他们自我角度的观点和行动,将民航事业与他们的自我成就感建立起紧密结合,可实现整个班组的双赢局面。

在执行工作计划的过程中,管理人员需要及时进行工作检查、跟踪和调整工作计划。根据大多数民航运营管理者实行的白天休息和夜晚休息制,能够将每两周的任务安排成一个周期,并且能够在这两周内实时监控项目的发展情况,判断其是否存在困难,或者其发展情况是否良好。若上周的任务未能达成,必须深入探究其原因,并立即修改策略。若策略发生改变,则须将其影响与接下来的策略一同纳入考量并进行适当修改。

4.2 顶层设计(D)

现阶段很多单位存在管理职能分离、制度制约、数据壁垒、流程束缚、执行困难的现象[8]。底层数据存放在各种不同的平台,提取、使用与存放各自为政,因缺乏顶层设计,很难适应高速规模化的发展。因此,各民航企事业单位甚至整个民航已启用顶层设计的思想,总揽全局,打通底层数据,消除数据和应用壁垒,实现独立数据和服务的治理[8]。

解决上述难题的捷径在于问题处在萌芽阶段时,即下定决心从下到上结合当前治理技术,借助人工智能与数据中台的能力,开展数据、服务和能力的治理,制订相关的标准化规范,不断改进现有体系,破除壁垒,以便各用户高效便捷地获取不同权限范围内的服务和数据。

通过整合基础数据、构建优质的内部大数据平台,实现业务管理、生产运营、财务管理等各个数据接口的连通性,从而实现内部数据的有效交流与共享。因此,通过统一的接口进行数据输入和输出,各个系统的工作能够被统一调度,这将大幅提高工作效率。整个系统能够显著降低综合任务、重复步骤和不必要流程的消耗。

在市场竞争不断加剧、成本透明的大趋势下,体系治理是当前人工智能时代的紧迫需求,顶层设计则是开展体系治理成效最高的方法与途径。

4.3 4C管理(C)

构建纵横交错的强鲁棒性业务运维网,须转变运维开发分离的管理理念,发挥运维人员在全生命周期项目管理各环节的沟通反馈效用,深度参与全生命周期各环节对运维人员工作能力有更高的要求,随之而来的紧迫困境是人力成本也相应增加。数智化时代,基于云计算与大数据平台构建集中运维智能系统,可便于管理人员应对人工成本迅速增长对行业发展的制约。

4.3.1 全生命周期的项目管理

在传统的项目管理过程中,软件的设计开发与运维是割裂的,开发人员自完成软件交付后,工作重心便转移至下一个项目,项目上线运行后暴露出文档不全、软件缺陷较多、软件不稳定、功能与需求不一致等一系列问题。

全生命周期的项目管理关注业务应用的创建、持续集成,以及线上运行阶段的资源弹性管理,着重处理好运维和研发的协同关系,使项目高效有序推进的同时最大限度地确保软件质量、用户满意度和项目成功率。

在运行生产线上实践全生命周期的项目管理时,可从源头着手对整个生命周期链条进行分析,借助开发运营一体化(DevOps)理念协调处理好运维与研发的工作,采用持续集成/持续交付模式,让开发团队能更可靠和更频繁地更新代码,采用从代码集成、测试、产品交付和部署等环节的自动化和持续监控,实现项目的敏捷开发和持续集成的良性循环,如图2所示。

运维班组成员作为专注开展运维工作的人员,在参与项目建设期间须从运维角度审视需求、设计、测试,关注并在相应的评审阶段提出合理化建议,重点关注系统上线运行前的质量,预估上线后系统可能出现的故障,并准备好应对策略,为系统持续迭代建设给出有效的可落地建议。

4.3.2 基于云原生的运维体系

借助云计算和大数据平台,集中运维智能系统可实现弹性控制资源、智能编排应用、开发效能一体化、持续发布、智能运维运营等功能,有助于实现需求、开发、上线、运维的整体IT服务链建设,还可提供智能定位故障、智能分析数据、智能恢复业务、智能服务管理等数智化运维能力[8],从而将业务建设与智能运维有机结合起来,避免脱节建设带来的运维效率低下等问题。结合传统运维的痛点,做好监控平台、自动化工具平台、智能运维分析平台等关键性工作平台建设,同时关注服务目录迭代和演进,关注标准、规则、制度和流程的建设,关注服务的全过程管理和服务的推广工作。

4.4 执行和改善(A)

在明确了班组与岗位的工作职责和目标的情况下,为激励团队、激发员工的工作热情,须建立奖金或晋升等激励手段,建立长效、科学合理的绩效考核体系。为确保班组成员认可绩效考核结果,绩效评估至少遵循以下基本原则。

(1)公开(open):对班组成员公开计分标准,严格按照计分标准统计工作量,及时公开公示考核结果。

(2)客观(objective):根据每天的工作计划与进度,明确工作的数量与质量。

(3)合理(reasonable):充分考虑工作难易程度的差别及不同员工工作能力,通过设定难度系数等方法动态调整考核分数[9]。

(4)自律(discipline):各班组成员在班组任务计划整体框架下,自我细化工作任务,为自我工作结果计分,以此激发员工自驱力。

此外,在政策允许的条件下,在班组内形成以绩效为导向的奖惩机制,将有助于激活班组积极性,并有助于逐步培养出运行管理人才的核心竞争力。通常,薪资结构由固定收入和浮动收入两个部分构成[10]。为更好地适应民航的白夜休倒班制度,制定薪资制度时需要特别关注表现出色的一线值班人员,并适时地为他们提供相应的补助。

然而,从管理角度考虑,管理人员需要认识到更高级或更先进的管理方法是有别于物质激励的文化管理。实施文化管理的基础应该是对当代年轻人的独特性有所认识,体现在把关注员工发展、为员工搭建成长的平台放在首位,遵循以人为本、人尽其才、人企共进的思想与思路。文化管理则要求班组要注意处理好服务与要求的关系,既要不断满足组/1GFc3nxgNE7K7Ne792vyQ==员的诉求和成长要求,同时,也要激励和引导组员在岗位上建功立业,为民航事业的发展作出贡献,建立奋发向上、和谐快乐的工作氛围,让组员与民航共成长同呼吸共命运,从而将自身的利益与民航集体的利益融合在一起[11],助力组员在完成集体目标的同时实现个人价值,助其实现自豪感与责任感。

结语

现代化智能运维管理基于云计算和大数据,以自动化为核心,在提高工作效率、降低错误率的同时,释放运维人员的手动劳动,以便让运维人员将更多的时间放在策略性任务上。因此,现代民航信息运维班组的管理工作需紧跟技术的迭代升级,主动自觉变革管理体系与模式,在“IT换人”的大趋势中变被动为主动,以壮士断腕的勇气推进IT运维向智能化的方向演变。谋定而后动,主动挖掘与思考现代民航信息运维管理工作在智能化方向上的发展思路,从而摆脱现阶段运维靠人堆、产值濒临上限的困境。

参考文献:

[1]叶磊.00后大学生的群体特点及培养对策研究[J].中国教育技术装备,2024(8): 16-18.

[2]王春瑾,黄淑君,鹿洵.敏捷方法与传统方法相结合的软件项目管理模型研究[J].电子产品可靠性与环境试验,2024, 42(2):82-88.

[3]姚佳人.敏捷项目管理方法与传统项目管理方法的比较研究[J].机械工业标准化与质量,2023(12):10-17.

[4]王锋,周海.基于DevOps和AIOps的敏捷智慧运维实践[C]//中国移动研究院,中国通信学会天线与射频技术委员会,天线系统产业联盟.中国移动5G天线产业技术研讨会论文集.北京:中移铁通有限公司信息和产品开发中心,2020:3.

[5]民政部,全国老龄办.2023年度国家老龄事业发展公报[EB/OL].(2024-10-12)[2024-10-20].https://www.gov.cn/lianbo/bumen/202410/content_6979487.htm.

[6]中国新闻网.国家卫健委:2035年左右中国将进入重度老龄化阶段[EB/OL](2022-09-20)[2024-10-20].https://www.chinanews.com.cn/gn/2022/09-20/9856433.shtml.

[7]王骏驰.基于OKR的W公司机电运维管理研究[D].成都:西南交通大学,2022.

[8]李林,张亚辉,陈森,等.新集中化模式下的IT运维发展思路探讨[J].数字通信世界,2022(1):162-164,167.

[9]金正军,杨扬.以绩效管理推进班组建设[J].中国电力教育,2011(27):13-14.

[10]翟俊杰.新时代企业文化管理思考[J].合作经济与科技,2024(16):128-129.

[11]邹志伟.运维一体化下的生产人员管理体系优化研究[D].北京:华北电力大学,2015.

作者简介:曹闪,在读博士研究生,高级工程师,caoshansh@163.com,研究方向:交通运输规划与管理、IT运维。