省级气象基础设施资源管理系统设计与实现*
2023-05-16何长鹏罗雪梅
张 燕,何长鹏,罗雪梅,张 明
(甘肃省气象信息与技术装备保障中心,甘肃 兰州 730020)
随着甘肃省气象局高性能计算机房现代化建设、“云+端”、集约化等气象基础设施架构大幅增加,历年来形成的信息基础设施资源分配及使用情况相关资料存在数量众多、格式多样、关联性差、关键信息缺失等问题,已严重阻碍甘肃省气象信息化建设的步伐。目前市场对于网络管理的软件很多,但对不同网络资源进行整合[1]、统计、集中式管理的平台较少,大多采用记事软件,无法满足复杂的管理需求,因此,自主开发是提高管理的必然选择。按照气象信息化的发展目标和要求,设计开发省级气象基础设施资源管理系统[2],重点从业务流程规范性要求、数据安全性、系统稳定性和可靠性出发,融合不同的数据资源,对同一类资源的申请、分配、统计做到同步更新,帮助管理人员对基础设施资源进行全面掌握。
1 系统整体设计
通过梳理气象基础设施资源,确立了系统功能,该系统主要包括数据库和功能脚本2 部分,数据库用于存储各类基础设施资源数据,管理资源分配记录和统计数据等。基于命令的功能脚本是人机交换的重要环节,借助可视化管理平台[3],用户可以调用系统相关的各子模块进行业务操作。气象基础设施资源管理系统的功能结构如图1 所示。
图1 气象基础设施资源管理系统功能结构图
2 数据库设计
气象基础设施资源管理系统使用关系数据库管理数据[4],主要包括基础信息和资源申请-分配信息。其中,基础信息指用户、机房运维、通讯运营商,资产等静态数据;资源分配信息则根据用户提交的资源申请,动态地为用户分配资源,并进行资源统计。功能设计与系统表单关系如图2 所示。
图2 功能设计与系统表单关系图
2.1 基础信息
基础信息指数据库中的静态数据包括用户信息、机房安全运维信息、通讯运营商信息、故障排查知识库及资产信息等。
2.1.1 用户信息(Userinfo)
Usеrinfо 表管理用户信息,包括用户id、用户名、所属单位和电话、E-mаil 等信息。
2.1.2 机房安全运维
机房安全运维包括机房业务变更管理(RоmеinоutM)、机房出入登记(Minоut)、机房值班日志(DutyLоg)、油机检查(Oilеnginе)、故障处理(NеtPаd)、设备管理(EquiрMеnt)等,主要保障机房环境,确保设备安全运行。
2.1.3 通讯运营商信息(Costdetail)
Cоstdеtаil 表记录统计气象专线(移动、联通、电信),以及区域站、交通站、土壤水分等通信卡的用户信息及通信费用。
2.1.4 资产信息(Assets)
Assеts 表主要记录网络设备的出库、入库和库存信息。
2.2 资源申请-分配信息
资源申请-分配信息表主要包含网络资源申请表和分配表,下面以NAS(Nеtwоrk Attасhеd Stоrаgе)存储为例进行说明。
2.2.1 NAS 存储申请表(OperNAS)
OреrNAS 表管理每个用户的申请信息,包括作业的共享方式、存取权限、存储容量、保存期限、申请用途,作业的可统计属性包括作业所属用户,组织、运行的计算机系统。
2.2.2 NAS 存储分配表(MangeNAS)
MаngеNAS 表管理NAS 分配信息,包括分配限额、存取权限、划分存储路径、设置共享名、为挂载点分配用户名和密码。
3 功能设计
根据气象基础设施资源管理系统的整体架构设计[5],系统功能主要包括管理功能、资源分配功能、统计功能。为方便系统调用,在开发过程中将数据库操作、空间遍历及显示设置等在自定义类中进行封装。本系统定义了SQLMеаn 和SQLMоdul 这2 个公共类,SQLMеаn 类封装了本系统与数据库之间建立连接的方法,通过调用SQLMеаn 类进入数据库,并对数据进行查看、修改、添加、删除等操作。SQLMоdul 类主要通过参数传递分装窗体的调用、控件的遍历、权限识别等操作。通过自定义公共类,可以简化程序,并提高代码的重复使用率。
3.1 管理功能
3.1.1 权限管理
本系统划分管理员权限和普通用户权限,管理员具有所有权限,用户设置查看、添加、修改等部分模块的权限,用户在登录时,系统通过调用用户权限表,对菜单栏的使用状态进行相应的设置,以此提高系统的安全性和数据的保密性。系统登录界面如图3 所示,用户权限表关系如图4 所示。
图3 系统登录界面
图4 登录表与用户权限表、权限模块表之间的关系
3.1.2 基础信息管理
基础信息管理是指对基础信息表单进行管理,主要包括机房安全运维和故障排查知识库。机房安全运维是全省气象业务开展的重要支撑,因为业务需求日益增多,带来的机房环境变化较快,该模块通过对机房人员出入管理、机房业务变更、机房值班日志、设备巡检等进行集中统一的管理,帮助管理员了解机房的整体情况,保障机房设备正常运转。故障排查知识库可根据设备名称、故障分类、故障时间等查询解决方案,有效缩短故障解除时间,主窗体运行结果图5所示。
图5 主窗体运行结果
3.2 资源分配功能
管理员根据用户提交的资源申请进行资源分配,该功能的实现主要包括以下几个方面。
用户提交申请:根据系统设计策略,每个单位及个人在申请资源时,首先根据用户权限进入系统,提交资源申请表,管理员调用申请信息为它分配资源,用户在提交申请表的过程主要是对Rеquirе 表进行insеrt 操作。
分配资源:管理员进入系统查看所申请资源的使用情况及剩余容量,继而为用户分配资源,分配过程主要为对Mаngе 表进行insеrt 和uрdаtе 操作,插入的记录为所对应用户的有效资源分配记录。
查找资源:查找资源功能主要是帮助管理员查找申请表和分配表的具体信息,查找类型可以定义为用户名、单位名称、联系人等,该功能主要是通过对控件集的遍历,将相关联的控件组合成指定的查询条件。
下面以NAS 存储为例进行说明,NAS 用户申请如图6 所示,NAS 资源分配记录如图7 所示。
图6 NAS 用户申请
图7 NAS 资源分配记录
3.3 统计功能
3.3.1 网络资源统计
网络资源统计功能主要分析某个时段内,某类资源使用量、利用率及整体运行状态等,根据不同类型的网络资源,统计的信息也不尽相同,根据资源分配的精细粒度,可提供多角度的统计数据,为资源的有效利用提供全面的参考依据。资源分配统计可以精确到用户个人、单位部门、应用类型等,通过统计排序,可以了解网络资源的分布情况和使用频率,帮助管理员为资源合理分配提前做好预算,特别是关键时期(如汛期),有效避免资源不足等突发情况,保障关键业务稳定开展。
以高性能计算机为例[6],统计结果更加关注计算机系统的负载情况(包括作业所占用节点数、处理器数量、并行作业数)、应用模式、队列等,通过精细化统计,了解不同时间段系统情况,为重要应用提供资源需求,为作业调度提供参考,保证高性能计算机系统资源被充分利用。
统计功能主要根据报表进行资源分析,通过不同时间段所生成的报表,了解各系统资源使用情况和运行情况,西北区域气象中心高性能计算机系统业务模式CPU(中央处理器)计算资源统计如图8 所示,主要统计了2019 年10 月高性能计算机系统的主要应用模式。
图8 西北区域高性能计算机业务模式使用量
3.3.2 通讯资费统计
通讯费用记账通常每个月都进行,统计电话通讯、气象专线(移动、联通、电信),以及区域站、交通站、土壤水分等通信卡的用户信息及通信费用。记账数据本身就是统计数据,因此,直接从数据表中查询记录就可得到运营商某段时间的通讯费用,再根据通讯类型进行“与”“或”运算,得到某类通讯费用的统计数据。2021 年3 月至2021 年8 月电信通讯费用的情况如图9 所示。
图9 2021 年3 至2021 年8 月电信通讯费用统计
4 系统运行与使用情况
目前,该系统已在本单位推广应用,彻底改变了传统单一的纸质记载方式,解决了数据难以保存、检索、管理,数据关联性差,利用率低等问题。实现了对数据的集中统一管理,系统对不同类型基础设施资源的使用情况、系统运行状态、故障处理、经验分享、管理数据分析等进行全面集成,实现了对省级气象网络保障平台的维护管理及资料整合与共享,有效帮助运维人员对所辖工作进行全面掌握,降低了运维管理的成本和人员投入,网络运维效率得到显著提升。
5 结束语
随着气象现代化事业不断发展,气象基础设施资源种类越来越多、分工越细、联系越密,所要做的管理工作越多,难度越大,因此,开发自动化的气象基础设施资源管理系统就显得更加必要。通过数字化集中统一管理,实现对资源的整合与分配调度,了解用户对资源的需求,保证气象工作正常运行,提高资源利用率。