APP下载

电力信息系统运维管理自动化解决方案

2012-06-17

山东电力技术 2012年1期
关键词:安全策略脆弱性运维

温 超

(国网信息通信有限公司,北京 100031)

0 引言

2006年国家电网公司开始实施SG186工程,经过几年的研究、开发、运行与更新换代,目前国家电网公司信息系统己经具有相当的规模。随着业务的不断增长,系统数量的不断增加,国家电网公司的信息系统运维也变得复杂,同时运维人员的工作量也呈倍数增长。运维项目多、运维管理乱、人力成本高,因此虽然拥有专业的运维团队,同样面临很大的困难。由于这是一个随着信息技术的深入应用而产生的新课题,这方面的知识积累和应用技术还刚刚起步,因此研究如何进行有效的信息系统运维管理,具有广阔的发展前景和很大的现实意义。

1 现状分析

随着运维管理问题的出现,国家电网公司已经制定了一系列的运维管理办法,采用了一些运维管理工具来解决这一问题,但当前的信息系统运维管理还不是很成熟,还存在一些不足。

1.1 信息系统运维服务主动性有待提高

现有的信息系统运维服务大多都是做“损坏-维修”服务,而这种直接的服务方式不能避免事故损失,成本很高,效率低下。信息系统运维如果以主动、预防的方法将提升效率、性能和可用性,通过自动化平台统一对信息系统运维进行管理,则能够节省大量的成本并提高管理效率。

1.2 运维人员的工作量大

随着虚拟化、云计算和分布式计算等技术不断应用,IT基础架构正日益复杂。这些解决方案可以帮助用户的业务按指数增长,但同时要求系统管理员投入更多的精力。而目前运维管理依赖的依然是多头管理策略,针对不同需求而分别部署单点工具,容易造成管理混乱,使信息系统运维人员的工作量呈倍数增长,人力成本攀升。针对现存问题,有必要将电力信息系统中运维相关的独立的设备和系统集成一个有机的信息系统运维自动化平台[1]。

2 平台整体架构

信息系统运维自动化平台的整体设计采用B/S架构,纵向分为技术操作层、管理调度层、决策指挥层,功能结构如图1所示。

图1 信息系统运维自动化平台功能结构

技术操作层通过各种技术手段和工具对电力信息系统中各种网络设备、安全设备、重要服务器、数据库和重要应用以及数字资产的状态、传播进行监控,确保电力信息系统处于可监控状况。运维调度层通过专业的运维人员对电力信息系统运行中产生的各种信息进行分析处理,并在其专业知识的支撑下对通过技术操作层对信息系统进行查看和维护,确保信息系统的正常运行。决策指挥层通过对信息系统运行中产生的数据进行深度挖掘、提炼和宏观分析,从更高层次上查看整个电力信息系统的运行状态,协助决策者依据电力信息系统中各类系统运行状况并作出正确决策。

3 平台系统

3.1 设备管理子系统

设备管理以企业经营目标为依据,通过设备信息管理、设备监测、风险评估、设备维护、统计报表等措施,对设备的全过程进行的科学管理,即实行从设备的规划工作起直至报废的整个过程的管理。

设备信息管理:实现各类设备信息的集中管理,具体包括设备库、设备履历、设备关联视图、服务响应模型、备件库、仪器仪表库等管理。

设备监测:对设备运行状态进行24 h监控,及时发现异常情况,并进行配置策略优化;当监控到系统出现异常情况时,及时向客户提供告警服务,将最新的异常信息和补救方法通知客户,在威胁还未造成重大伤害或扩展时,及时采取措施进行消除。

风险评估:实现中心设备运行风险评估与安全管理体系管理功能,包括运行分析、设备风险评估、SMS管理、决策支持等功能。

设备维护:实现设备日常维护、维修的等级与管理功能,具体包括设备维护、维修、备件检测、仪器仪表测试、更新改造以及履历管理等。

统计报表:实现运行报表与专业报表统计功能,包括运行日报、功能报表、运行统计、干扰报表等功能。

3.2 业务监控子系统

业务监控子系统实现对操作系统、数据库、中间件、WEB应用、应用系统的状态进行实时监控,并且通过实时流量分析、访问控制等功能有效、多方位地进行网络信息系统的运行安全监控和优化,全面提高企业网络使用价值。对发现的安全问题可快速抑制,降低信息系统出现安全事件的几率,减少系统遭受的损失并增强信息系统抵御攻击的能力。

服务监控。对各种应用支持软件如数据库、中间件、群件以及各种通用或特定服务的监控管理,实时获取这些应用的运行状态,增强分析、预警功能,保障业务应用的正常运行。

流量分析。提供了实时流量采集、分析和展现功能,支持实时流量数据自动刷新,并提供IP地址、应用、通道、带宽等各种实时流量图表,让用户可以全面掌控网络带宽的使用情况,使得网络运行状况、应用情况、带宽使用情况等状况实现完全可视化,同时可以对出现的异常流量进行及时预警与处理。

访问控制。系统能够勾勒企业终端接入的安全基线,屏蔽一切不安全的设备和人员接入网络,规范用户接入网络的行为。对于未安装终端代理软件或已安装终端代理软件但不符合安全策略要求(防病毒软件、病毒特征库升级、补丁、系统安全设置、违规软件等)的终端设备,能够禁止其访问网络,或进行网络VLAN隔离。

3.3 数字资产管理子系统

数字资产管理子系统主要关注电力信息系统中数字资产在网络中的创建、使用、传播、销毁,关注数字资源、网络资源的使用情况,利用桌面终端控制软件以及证书和权限管理,做到对每个数字资源访问人员的身份明确、权限最小,访问可溯,不容许超越权限的非法接入和非法访问。数字资产管理子系统以权限为中心,以证书为凭据,以访问控制为手段,以桌面终端软件为依托,围绕文档安全管理为核心,实现电力信息系统的数字资产的安全,保障信息系统中的数据安全。

证书管理。管理电力信息系统的证书的颁布、变更和取消等生命周期状态。证书的管理主要围绕证书的发放为核心,涉及证书从生命周期开始到生命周期结束的各个环节,对应于证书的申请、审核、下载、更新、注销等各个具体的流程。

权限管理。管理证书对应的在电力信息系统的权限,授予证书对应最小权限,是子系统的核心。系统管理员可以根据系统设置的安全规则或者安全策略为不同用户分配不同权限。用户可以申请加密权限、文档授权权限、文档解密权限、修改密码权限、离线使用权限。

安全文档管理。采用“驱动级透明动态加解密技术”对指定类型的文件进行实时、强制、透明的加解密。并能对文档进行细分化的权限设置,确保加密信息在特定授权范围内进行指定操作。

访问控制:利用802.1x和动态安全网卡等技术控制非法用户的非法接入,只容许接入用户在指定权限内访问合法的数字资源,并记录用户的访问过程。

3.4 运维支撑子系统

安全运维支撑子系统依托强大的知识库支撑体系从技术和管理的角度对安全脆弱性进行收集、分析、管理以及跟踪,并对整个安全运维人员、流程和结果进行管理,然后采用主动防御技术,为整个安全运维提供技术支撑。

安全运维流程管理。安全脆弱性运维流程管理是对安全运维工作人员、工作内容、工作步骤、工作信息的统一管理,和工作流管理以及人员管理模块协同工作。

电子值班。实现各级部门的电子化值班登记与信息通报功能,具体包括排班、巡视、汇报、交接班等基本功能。包括故障管理、无线电管理、停机管理等核心业务管理功能,包括专项活动、安全整顿等动态业务管理功能。

安全应急响应。实现事件驱动的统一告警管理,用户可对重要资源设置阈值,并定义事件的优先级。系统同时提供联动策略引擎,使得用户可以根据管理需求定制管理策略,当某类告警事件发生时,能够在第一时间由系统自动执行特定的安全管理操作。

脆弱性收集。安全脆弱性收集通过多种渠道多种方式尽量全面的收集资产的安全脆弱性,收集渠道包括:漏洞扫描结果、检查程序和脚本结果、人工检查和问卷调查结果、第三方系统脆弱性结果。

脆弱性分析与统计。对收集上来的安全脆弱性根据内置的定性定量分析矩阵进行脆弱性的分类识别,针对脆弱性的各种条件的统计分析,并根据用户的需要输出用户比较感兴趣的信息,报表输出的格式支持 XML、HTML、RTF、EXCEL 等格式。

安全工具管理。安全工具管理主要是管理收集脆弱性的检查程序和脚本,这些安全工具为脆弱性的收集提供了途径。

知识管理。建立中心知识库,实现对各类运维知识进行分类、点评、审核功能,实现基于全文检索的知识库查询功能,实现对考试、论文及技术资料的知识化管理。

3.5 安全审计子系统

为了对整个电力信息网络的状态全感知,各种网络设备、安全设备服务器和应用系统应该通过日志或者事件的方式向安全运维服务综合管理平台报告自身的各种状态变化或者异常情况。安全审计子系统将对电力信息系统中的运维原始数据进行全存储、并提供多维度的原始日志分析和查询功能,以便安全管理人员全面的分析评估安全信息,掌握安全状态,调整所执行的安全策略。

原始事件日志审计。鉴于系统设备数量大,产生的信息多,基于监控的分析原理,信息安全综合监控管理系统对所获取的原始数据需依据安全策略进行过滤和归并后进行分析处理以实现对安全状态的实时知晓。原始日志审计子模块将对原始数据进行全存储、并提供多维度的原始日志分析和查询功能,以便安全管理人员全面的分析评估安全信息,掌握安全状态,调整所执行的安全策略。

该模块通过各种收集手段获取网络中各个网络设备、安全设备、操作系统以及各应用系统的日志信息,使得不同设备之间的日志信息能够在同一个平台上进行审计,同时客户也能在同一个界面上查看各个不同设备的日志审计信息。

操作记录审计。综合利用身份认证技术、访问控制技术、操作审计技术、高可用性技术和集群技术,结合SOX、COBIT、ITIL等相关法案及ISO17799、国家等级化保护等IT内控相关标准,实现对“人(操作者)”在“服务器集群等重要资源(操作对象)”上的“操作行为(操作内容)”的集中管理、集中审计。

3.6 安全决策子系统

安全决策子系统基于一系列的评估指标(攻击频率、攻击严重程度、攻击目标、链路流量、端口流量、风险级别等),结合网元信息及服务、主机本身的重要性,从应用、服务、主机及网络系统4个层次感知系统的安全状态,结合外部的安全情报信息,提供宏观的安全态势演化曲线。同时,建立自适应的阈值设定模型,实现危险状态警报阈值的自适应调整,并依据设定的阈值,对系统的危险安全状态产生警报,并为用户提供安全事件解决建议。

安全预警功能。在信息系统安全态势感知分析的基础上为防护体系提供决策依据,为应急响应体系提供预测。安全预警根据安全态势的分析结果建立自适应的阈值设定模型,实现危险状态警报阈值的自适应调整,并依据设定的阈值对系统的危险级别达到一定程度的安全状态产生警报,并定期输出安全态势评估报告,有效帮助相关领导掌控信息系统自身和外围的安全态势,更准确、高效的进行安全决策。

安全策略管理。在安全态势感知的基础上根据ISO27001系列国际标针对电力信息系统安全管理体系拟定电力信息系统及业务专网的安全总体策略,并提供统一管理安全策略,负责策略生成、策略下发、策略解析以及策略有效性、一致性验证等功能。提供安全策略生成、编辑、检索功能,能根据条件或与任务关联向下级系统进行发布。系统提供安全策略的有效性验证功能。

4 结语

信息系统运维自动化平台提供贯穿整个IT基础架构的,全面、清晰的可视界面,既给运维工程师一个整体的管理视图,又为其提供了深入分析单独的系统或系统组的能力。通过运维管理自动化解决方案取代用户目前使用的多个管理工具,降低了管理的复杂性。通过主动、自动的运维方式,帮助运维工程师减少在重复性工作上投入的时间,提升整体工作效率与效果。

猜你喜欢

安全策略脆弱性运维
基于飞行疲劳角度探究民航飞行员飞行安全策略
运维技术研发决策中ITSS运维成熟度模型应用初探
风电运维困局
一种防火墙安全策略冲突检测方法*
浅析涉密信息系统安全策略
杂乱无章的光伏运维 百亿市场如何成长
煤矿电网脆弱性评估
杀毒软件中指令虚拟机的脆弱性分析
基于ITIL的运维管理创新实践浅析
基于攻击图的工控系统脆弱性量化方法