高职院校数字化网络运维管理平台构建探析
2024-09-13张超辉江燕戴杰玲
摘要:伴随着高等教育机构信息化的建设,校园网络已经成为与水、电一样不可或缺的基础设施,成为数字化校园、智慧校园等业务系统正常运行的核心保障。然而,由于高等教育机构师生群体庞大、设备类型繁多,并且环境复杂,这给高校网络的运营维护工作带来了前所未有的挑战。这些挑战包括数据量的激增、网络安全的威胁以及远程教学的技术需求等。因此,信息化部门常常因为用户满意度低、故障响应速度慢、管理层认可度低等问题而受到困扰。本研究以广东茂名健康职业学院为案例,旨在通过构建一个包含自动化故障检测和预测性维护的数字化网络管理平台,打造全面的IT知识库,并搭建具有多层次技能的梯队型人才队伍,来提升网络服务质量和运行效率。经过两年的实施,该方案在该学院层面得到了积极的反馈,并在提高用户满意度方面取得了显著进展。具体表现在用户满意度的调查结果提升了25%,同时,系统故障的平均响应时间减少了30%。
关键词:教育信息化;数字校园;运维管理;知识库;高职院校
中图法分类号:TP39 文献标识码:A
文章编号:1009-3044(2024)22-0110-04
开放科学(资源服务)标识码(OSID)
为了适应教育信息化的快速发展和应对多变的网络安全环境,各级院校都在增加对信息化建设的投资和推广。特别是在2018年教育部发布《教育信息化2.0行动计划》和2020年7月针对高职院校发布《职业院校数字校园规范》后,教学应用、学习应用以及数字化校园建设成为了各大院校关注的重点。这些趋势和政策变化加剧了对高效、可靠网络运维服务的需求,尤其是在高职院校。
然而,在实践中,高职院校面临一些挑战。赵志辉等人的研究指出,云计算、物联网和综合服务大厅是当前高校信息化建设的关注焦点[1]。钟文锋等的调研进一步明确了与双一流和本科院校相比,高职院校的信息化建设更注重智慧校园、信息网络安全和信息化评价[2]。此外,由于技术力量相对较弱和信息化技术队伍建设受到限制[3],高职院校在信息网络安全和管理业务流程优化方面面临更多挑战。这些问题不仅影响了教学和研究,也严重降低了用户的满意度,这一点在用户满意度调查和系统性能评估中得到了明确的体现[4]。
基于以上背景,本文以广东茂名健康职业学院为例,探讨如何构建一个数字化的运维管理平台,以适应不断变化的教育信息化需求,并实现自动化故障检测和预测性维护。同时,研究还关注通过何种网络运营维护实践有效提升服务水平和响应速度。
本研究的贡献在于通过两年的实践,研究团队不仅提出了一套具体可行的数字化运维管理平台构建方案,还在用户满意度和故障响应速度方面取得了显著改善,填补了高职院校在这一领域的研究空白。具体而言,这一成果体现在理论和实践操作的改进,以及对高职院校信息化政策和实施策略的有益建议。
1 广东茂名健康职业学院信息化建设与挑战
首先,本文深入分析广东茂名健康职业学院在信息化建设方面的成就与所遭遇的挑战,为找到可行的解决方案并提出有建设性的建议奠定基础。
1.1 网络架构与资源
广东茂名健康职业学院已经建立了包括教学办公网、监控网络、学生宿舍网络和无线校园网在内的网络架构。通过与电信、移动和教科网的三个专线出口连接,学院实现了5G总带宽,满足了大部分教学和研究需求。
尽管硬件设施较为齐全,但在接入层存在部分不可网管的交换机,这增加了网络维护的压力,尤其是在信息中心资源受限、技术人员不足的情况下,这一问题显得更为突出。
1.2 业务系统与网络安全
学院已成功部署了一些关键业务系统,包括财务管理、一卡通系统和图书馆管理系统,并为它们设置了基本的安全防护。这些系统处理着敏感数据,如学生信息、员工记录和财务数据,是学院运转的重要组成部分。根据等级保护2级的建议和专家经验[5],在边界安全区配置了出口防火墙、上网行为管理系统,在数据中心隔离区配置了堡垒机、日志审计、网络应用防火墙(WAF)和漏洞扫描等安全设备。尽管已经采取了基本的安全措施,但面对网络安全的复杂性和不断变化的威胁环境,保障网络安全仍然是一个持续的挑战。除了外部威胁,如黑客攻击和恶意软件,还要注意内部风险,如员工误操作和安全漏洞。学院已经部署了一些基础安全设备,但仍然缺乏全面的风险评估和实时监控机制,这使得网络环境对各种威胁更加敏感。随着技术的发展和威胁的不断演化,学院需要不断更新网络安全策略,包括技术升级和投入更多的专业人才与资源,以构建更加安全可靠的网络环境。
1.3 用户体验与常见问题
学院在信息化建设方面取得了一定的成果,但用户体验仍有待提高。根据用户的反馈,最常见的问题是故障响应时间长和由于备件缺乏导致的维修延误。这些反馈揭示了信息中心在运营维护管理方面存在的不足,例如对个别技术人员过度依赖、缺乏标准化流程和有效的人员培训,这些问题限制了服务质量并增加了运营风险。
1.4 人力资源与管理机制
由于条件的限制,广东茂名健康职业学院的信息化管理往往偏重于管理而轻于服务,这种情况在高职院校中普遍存在[6],反映出学院信息化团队的规模和专业能力的不足。目前,该团队仅由5名教师组成,他们不仅在应对技术问题时力不从心,而且在专业发展和技能提升方面也遇到了障碍。这进一步揭示了高职院校中信息化队伍普遍人员稀缺、技术力量薄弱的问题。这种情况限制了学院在信息化建设方面的进步,并可能影响其长期的技术适应能力和创新能力。
为了解决这个问题,学院启用了学生志愿者来协助进行基本的网络维护。虽然这种做法在短期内缓解了工作压力,但学生志愿者缺乏专业知识和实践经验,可能导致操作错误和系统不稳定,也可能无意中增加了网络安全的风险。
综上所述,学院在推进信息化建设的过程中,不仅面临着硬件和软件方面的问题,而且需要重视人力资源和管理机制的完善。这些问题和挑战相互关联,形成了一个复杂的挑战网络,需要通过综合而精细的规划来解决。
2 广东茂名健康职业学院信息化建设策略
为解决上述困境,提升学院的网络运行水平和服务质量,本研究以全过程数字化运营维护作为切入方向,依托数字化运维平台,深化学生协管模式,加强网络运维团队的梯队化建设,丰富知识库。这些举措不仅直接回应了先前提到的问题,还将大幅提升教学和行政工作效率。经过一年多的发展,已逐步实现了网络运维的精细化管理。具体措施如下:
2.1 多媒体教室检查自动化
为提高学院一百多间多媒体教室的管理效率,本研究引入了物联网(IoT) 智能设备和管理系统。这些系统不仅大大减少了人工检查所需的时间和资源,还降低了由设备故障引起的课程中断。该物联网系统与学院的教务系统实现了无缝对接。在有排课时的教室里,系统会提前15分钟自动打开电脑、投影等设备,以便为授课做好准备。
为确保系统的准确性和效率,根据研究文献[7-8]的建议,通过远程摄像头将教室幕布的位置和投影内容发送到自行研发的诊断模型。该模型能自动判断是否出现了位置异常或内容异常的情况。一旦模型检测到异常,它会自动向IT资产管理系统(NMS) 发送告警。然后,由值班的协管团队根据告警信息向特定教室派发维修任务。
对模型的误报率和漏报率进行了量化评估。经过测试,当前误报率为5%,而漏报率为3%。这一数据表明,尽管还有改进空间,但模型的准确性已经达到了令人满意的水平。自从该模型投入使用以来,由于设备故障导致的教室更换频率已经从之前的几乎每天降低到现在的每周1~2次。具体而言,故障率降低了约70%。
2.2 整体网络维护简单化
通过数字化平台,将网络维护从复杂的技术性工作转化为易用的日常型任务。这不仅大大降低了技术门槛,还使非专业人员能够参与并支持维护工作,从而实现更高效的资源分配和快速响应。首先,采用链路聚合技术将4条宽带出口线路组成线路群,用于支持教学办公区和教工宿舍。经过这种链路聚合和分流,网络拥塞率减少到了低于2%。学生宿舍区则由Wi-Fi运营商提供网络,通过一个2G专线访问校内资源,并预留了30%的带宽用于未来扩容。
在安全性方面,通过网瑞达公司的IT资源管理系统(NMS) 和ZDNS的DDI系统建设,确保了DHCP、DNS等基础服务的自主管理。这样不仅实现了故障可视化,还提供了数据化的运营分析和菜单式的配置选项,为学生协管团队的接手奠定了基础。
2.3 知识经验积累案例化
通过飞书文档搭建了团队知识库,用以沉淀高价值信息和形成完整的知识体系。具体操作包括:每解决一个问题后,会进行一次总结,以文档形式记载。这里的“三轮评审”是基于“准确性、可用性和可读性”三个标准进行的。例如,当运维团队解决了一个关于网络安全的常见问题后,会将解决方案文档化,并通过团队评审来优化内容。这样做旨在将隐性知识转化为显性知识,提高团队的整体能力。文献[9-11]在知识库的前期框架搭建上提供了关键的理论支持,特别是在知识分类和标签系统的设计方面。
2.4 技术团队建设梯队化
本院实施了多层次的技术团队构建策略,重点引入学生协管团队。这一做法由教师作为导师逐步传承,形成了老带新的健康人才梯队。团队成员在每次处理技术故障前,会先查询现有知识库,掌握标准操作流程。通过故障处理后的复盘和总结,运维团队能够不断地更新和优化知识库。
除了内部培训,运维团队还聘请了来自各个硬件和软件供应商的专家进行外部咨询和技术指导。例如,进行了网络日志分析和网络安全等级保护的专业培训。同时,团队成员也接受软技能培训,以提高与非技术人员,尤其是年长教师的沟通能力。
2.5 管理与服务交付数字化
借助网络管理系统(NMS) ,所有网络资产信息已成功从Excel表格迁移到集中平台。这不仅改善了资产管理,还为网络故障的快速诊断提供了便利。基于这一平台,运维团队实现了对网络运行状况、关键业务流量以及设备配置的全面监控,为分级诊断和精准支持提供了基础[12]。
此外,NMS系统也是学生协管团队工作的依托。该系统实现了大多数工作流程的数字化,例如网络运维、资产盘点和日志审计。示例流程的数字化操作如图1所示。通过这一系统,IT资产、运维和日志等关键信息得到了量化数据的支持,实现了对团队工作量和服务质量的精准评估,显著提高了工作效率和服务水平。借助这一系列措施,学生协管团队已经解决了近80%的网络故障问题,明显提升了他们的技术和分析能力。据统计,今年已有4名同学成功进入知名网络公司实习,并受到了高度评价。
2.6 故障处理提前化
本研究充分运用网络管理系统(NMS) 的告警功能,对告警设备、指标和通知策略进行了细致的优化。这样,在网络或硬件出现故障的第一时间,告警信息就会直接发送到网络运维团队,使得故障处理可以在用户反馈前立即开始。根据近一年的数据分析,通过该机制,已解决了大多数问题,如网线松动、投影异常、幕布不能降落等,这些问题占据了超过70%的日常报修问题。
在团队的日常值班机制中,已经设立了明确的值班检查标准和流程。图2展示了日常操作的一个示例。每天,团队成员需要对网络管理系统(NMS) 中的设备运行状态进行全面检查,并定期对网络主干线、弱电井以及机房进行现场巡查。这种做法不仅使运维团队能够掌握实时的网络硬件状态,而且积累了大量有用的运行数据。这些数据用于分析网络性能、优化运维流程,并有助于预测和预防潜在的网络故障,从而确保网络的稳定和高效运行。
为了进一步提高故障处理效率,研究团队将这一标准化的日常检查和NMS平台的告警通知结合,成功地在大多数情况下在维修上报之前解决了简单问题。例如,处理了一起因网络设备故障导致的投影问题,通过NMS的实时告警,在用户报修前就已经解决了问题。
总的来看,通过这些创新措施,网络运营维护已经变得更加高效和简单化。这不仅提高了教学和行政工作效率,还为学生提供了宝贵的实践机会。通过系统的量化评估,可以清楚地看到,这些措施已经在提高设备可用性、降低故障率和增加用户满意度方面取得了实实在在的成果。
3 结束语
总体来说,学院的网络运维在初期阶段主要依赖于故障报修进行运营,这导致维护团队长时间处于忙碌状态。随着IT资产管理平台的引入和资产数字化的全面实施,情况得到了显著改善。结合知识库的构建、学生协管团队的分级建设,以及日常运营维护任务的标准化,学院的网络维护进入了更为精细和智能的管理阶段。
根据数据显示,经过一年多的系统改进,实现了多媒体教室检查的自动化,简化了整体网络维护流程,并且积累了丰富的知识和经验案例库。此外,技术团队的层级结构得到了优化,运营维护过程得以数据化管理,而故障处理时间也显著缩短。这些改进不仅显著提升了用户满意度,还增强了系统的可维护性和可靠性。
然而,随着用户需求的不断提升和技术环境的快速变化,运维团队面临着新的挑战和问题。例如,如何开发自动应答机器人和智能修复Agent,以支持用户在非工作时间进行“自助”故障修复,以及如何利用大数据分析和先进的机器视觉模型来预测并消除潜在故障,都是未来需要深入研究和发展的方向。研究团队在追求技术和服务卓越的道路上,将持续探索新的解决方案和前沿技术,以适应不断变化的需求和挑战。
参考文献:
[1] 赵志辉,宋婷玉.教育信息化2.0时代高校信息化建设实践与发展趋势研究[C]//中国计算机用户协会网络应用分会2020年第二十四届网络新技术与应用年会论文集,北京: 中国计算机用户协会,2020: 306-311.
[2] 钟文锋,陈怀楚,邹向荣,等.2021年国内高校信息化建设热点调查分析[J].现代教育技术,2022,32(7):109-117.
[3] 周建美.网络信息化下的高校网络安全建设探析[J].无线互联科技,2022,19(5):15-16.
[4] 闫思瑾.高校计算机网络信息管理安全防护问题与策略[J].数字技术与应用,2021,39(6):174-176.
[5] 邹时雨,丁桂元,杜炼.基于全光网络的高校信息化基础建设[J].信息技术与信息化,2022(1):173-176.
[6] 胡钦太.“十四五” 高校信息化思维创新与路径选择[J].中国教育网络,2021(4):13-16.
[7] 徐林波.基于大数据和人工智能的高校信息化服务研究[J].信息系统工程,2023(6):143-145.
[8] 余高.“大数据+人工智能”:高校教育信息化的必经路径[J].中国高等教育,2020(19):59-61.
[9] 杨逸时,谢之鑫.关于高校计算机网络管理与维护的思考[J].产业创新研究,2020(18):188-189.
[10] 全宇.试论高校校园网络故障的诊断与排除[J].长春师范大学学报,2017,36(1):46-48.
[11] 徐若冰.高校实验室计算机网络故障诊断技术研究[J].无线互联科技,2022,19(6):31-33.
[12] 胡波,李冰.基于云平台的综合监控系统NMS功能的探讨[J].工业控制计算机,2021,34(2):8-10.
【通联编辑:张薇】