基于仪控系统的网络安全系统防护体系模型的构建与实施
2022-11-11谢磊,杨鑫,杨林
谢 磊,杨 鑫,杨 林
(1.山东核电有限公司,山东 海阳 265116) (2.国核自仪系统工程有限公司,上海 200241)
核电站网络安全系统是核电站综合安全系统的重要组成部分,因为单一节点宕机或其他网络相关系统的故障造成的核电站整体仪控系统故障,可能导致仪控信号延迟,甚至造成操作指令延迟,最终酿成全系统的重大事故或隐患。
周振海等[1]为了增强企业网络架构的弹性,使用智能弹性架构(intelligent resilient framework,IRF)虚拟化技术简化网络运行,降低了运营成本、扩展了带宽容量和端口密度,使企业网络具有更好的扩展性,但无法执行人为干预。盛建平[2]通过具体案例分析了虚拟机抓取交换机端口镜像数据包故障问题。黄冬燕[3]为了解决自动化系统改造过程中的联调问题,提出使用交换机端口镜像技术,不改变远端主机配置,不影响旧调度自动化系统的实时数据,缩短了联调周期,提高了自动化系统的建设效率。潘瑞恩等[4]使用智能调度对电力调度数据网中数据的采集和储存进行了改进,对电力调度数据网中的海量数据使用旁路无损采集技术进行采集;对数据和应用层内容进行解析,然后对具体的数据报文进行解析从而获得结构化数据,最后将得到的数据存入数据库。金海峰[5]借助路由器、交换机等仿真设备,设计了数据通信模型,分析和验证了TCP/IP数据封装和传输过程,并得出研究结论。目前还没有针对核电站仪控系统网络安全系统防护体系的研究。
本文基于上述研究在核电站仪控系统中构建的镜像接口(m-Uplink),通过多种神经网络算法对数据进行整合优化,再通过系统运算分析,实现各仪控系统的预警。
1 数据抓包分析与心跳线安全保障硬件系统
核电站仪控系统中存在大量的物联网设施,包括可编程逻辑控制器(programmable logic controller,PLC)系统、微控制器(microcontroller unit,MCU)系统和单片机微型计算机(single-chip microcomputer,SCM)系统。使用专业的工业网桥设备或中段数据采集系统将仪控系统信号转化为通用信号后,进入仪控系统核心交换机的下行接口(PLC-Link),同时数据会经过上行接口(Uplink)上传到其他控制类数据分析系统。在网络安全控制中,一般采用热备份的方式使用2台核心交换机控制2套工业控制网络完成自主切换,自主切换过程通过交换机的RS-233接口连接心跳线,该线路通过交换机内部自主控制程序实现主动切换,无法执行人为干预。但交换机的Uplink接口可以构建镜像接口(m-Uplink),该系统通过对交换机m-Uplink接口的数据进行拆分分析,实现各仪控系统节点的预警分析。上述逻辑如图1所示。
图1中,通过m-Uplink接口采集的数据,根据不同的数据报文端口号进行分割,未分割数据为全数据,经过分割的数据为单端口数据。将全数据和单端口数据分别执行数据挖掘后,各自形成1个标识码,即有n个监测端口时,产生(n+1)个数据分析标识码,将上述(n+1)个数据分析标识码形成多列神经网络后,每列会产生一个预警值。其中数据提取任务和各个标识码的分析任务,以及各预警分析任务,均采用独立的浮点计算,并依照计算结果由主机系统执行相关操作,其中计算主机之间根据图1的连接方式形成数据硬件连接。计算主机之间配置独立网卡,用于连接预警系统的独立交换背板,即主要数据传输采用P2P专线连接,控制数据使用预警系统的独立背板与交换机连接。
2 基于虚拟机神经网络的网络安全防护体系模型
核电站的网络安全故障及隐患的评价响应周期应足够短,预警提前量应足够大,所以其算法结构应足够简化。如果使用神经网络算法模型,则模型中的节点量应足够小。核电站仪控系统一般包含数千个数据节点,网络拓扑复杂度较高,网络分析难度较大,即使其最小化的神经网络算法模型仍有很大的节点量,需要很大规模的算力硬件支持系统。而数据分析中,因为需要较高的敏感度,所以一方面应在节点量得到最大优化的前提下最大限度提升数据挖掘深度,使用足够的算力硬件确保其最短的评价响应周期,另一方面可以通过牺牲部分特异度指标换取更高的敏感度。该模型逻辑建构采用基于差值序列的超限学习机算法,用于提取数据的周期性特征,使用空间卷积算法强化数据特征,在与窗口数据合并后,采用基于六阶多项式的通用模糊神经网络挖掘数据规律。超限学习机和模糊神经网络的输出数据,使用小节点量的对数神经网络实现数据整合的同时,对数据落点位置进行优化重排,并将数据交由后续分析模块做进一步数据挖掘。该算法逻辑如图2所示。
图2 虚拟机神经网络安全防护体系模型逻辑架构
图2中,时序数据包含图1中的全数据和单一端口数据,单一端口数据中包含了PLC数据、MTU数据和SCM数据,后续分析指图1中针对特定节点状态预警的分析模块。
超限学习机模糊神经网络模块的统计学意义是利用模糊神经网络对周期性数据进行分析,输出1个包含数据特征的双精度变量。因为核电站仪控系统采集的数据属于周期型数据,所以在核电站仪控系统相关的模糊神经网络设计中,使用超限学习机模块。超限学习机的算法结构,首先对离散序列数据生成差值序列,然后在差值序列的基础上采用三角周期函数实施深度迭代,最后进行回归计算。
差值序列构建算法基函数如式(1)所示:
(1)
式中:S{tn′}为差值序列构建算法基函数;tn′为差值序列的第n个值;tn为原始序列的第n个值;n为神经网络的节点数;n′为差值序列神经网络的节点数。
在超限学习机中输入式(1),得到式(2):
(2)
式中:y为神经网络节点的输出值;i为指针变量;A,B,C,D为回归变量;xi为上一层神经网络输入的第i个变量。
多列模糊神经网络和用于参照变量生成的前置模糊神经网络均采用六阶多项式深度迭代回归函数,其基函数如式(3)所示:
(3)
因为核电站仪控系统给出的原始数据为大宗数据,所以使用前置卷积神经网络的方式对超限学习机和模糊神经网络的输出数据进行归一化处理,节点基函数使用对数深度迭代卷积公式:
(4)
针对各节点数据进行预警的模糊神经网络采用三段式设计,依次为对数模糊神经网络(对应的函数表达式为式(4))、六阶多项式模糊神经网络(对应的函数表达式为式(3))、二值化神经网络。二值化神经网络的函数表达式如式(5)所示:
(5)
式中:e取近似值2.718 281 828。
上述算法逻辑中,共包含4种神经元节点模式,分别为超限学习机节点、六阶多项式模糊神经网络节点、对数模糊神经网络节点、二值化神经网络节点。其中,每个标识码算法模块(如图2数据分析过程)的神经元逻辑结构相同,每个数据预警单列神经网络模块(如图1预警过程)的神经元逻辑结构相同,在相同的神经元逻辑结构下,根据不同的数据分析需求分别进行训练,使其分别收敛,最终形成机器自主学习成果。
神经网络的收敛程度根据二值化神经网络的收敛程度进行判断,二值化神经网络的输出值域为[0.000,1.000],其中绝大部分输出数据在[0.000,0.005)和(0.995,1.000]内。当输出数据落点位于[0.005,0.995]时,认为神经网络收敛不彻底,持续输入随机验证数据,当连续出现5倍训练数据量的落点均脱离[0.005,0.995]时,可以认定神经网络已经充分收敛。
3 仪控系统的网络安全系统防护模型仿真
在MATLAB下加载Simulink组件,以此构建仿真环境,实现对上述算法模型的仿真分析。在仿真环境中进行测试,原始数据来自某核电站2019年—2021年共3年的全年全系统数据,之前仪控网络安全监测预警系统的预警结果数据作为本次分析的参照组,即为以下出现的旧系统数据。
比较方法采用SPSS数据分析软件下的双变量t检验,当对比结果t<10.000时认为数据之间存在统计学差异性,当t<0.001时认为数据具有绝对的差异性,当t>10.000时认为数据之间存在统计学一致性;P来自比较结果的Log值,当P<0.050时,认为比较结果位于置信空间内,当P<0.010时,认为比较结果具有显著的统计学意义,当P<0.001时,认为比较结果具有绝对价值。通过仿真验证分析,发现本系统与旧系统相比,具有一定优势。
3.1 预警提前量与预警敏感度、特异度的对应关系
电力系统控制和复杂系统控制配套的数据预警系统,目前较为成熟的是Python工具集或MATLAB工具集中的曲线估计算法。曲线估计算法的数据预警提前量受制于原始数据量,当预警周期大于原始数据周期10%长度时,数据预警敏感度快速下降。由此可知,延长数据预警提前量能够降低曲线估计算法的预警敏感度。旧系统采用的是曲线估计算法,在5 s提前量的目标下有较高的数据预警敏感度和特异度,但数据预警周期超过15 s时,数据预警敏感度和特异度均快速下降。但使用本文设计的算法模型后,增大数据预警提前量、延长数据预警周期并不会大幅降低数据预警的敏感度和特异度,详见表1。
表1 新旧系统预警敏感度、特异度的对比结果
表1中,敏感度是指所有比较结果中所有预警结果中预警准确结果的比例,特异度是指所有比较结果中所有不预警结果中应该预警结果的比例。
5 s预警提前量的目标下,两套系统的比较结果为t<10.000、P<0.050,具有可置信的统计学差异;15 s预警提前量的目标下,两套系统的比较结果为t<10.000、P<0.010,具有显著的统计学差异;60 s预警提前量的目标下,两套系统的比较结果为t<0.001、P<0.001,具有绝对的统计学差异。
3.2 预警系统本身的稳定性比较结果
为了检验预警系统的稳定性,对该系统和参照组进行比较分析。旧系统的数据延迟时间、计算响应周期比较长,丢包率为0.029%,宕机时间比也比较长。使用本文设计的预警系统后,降低了数据延迟时间、丢包率和计算响应周期,同时宕机时间比也有所减少,详见表2。
表2 预警系统本身的稳定性比较结果表
表2中,数据延迟指检索或存储数据包的时间;丢包率指测试中丢失的数据包数量与发送的总数据组的比率;计算响应周期指测试中从提交数据到数据返回的时间差;宕机时间比指机器出现故障停机时间与运行时间的比率。
在数据延迟时间、丢包率、计算响应周期和宕机时间比的比较中,两套系统的比较结果为t<10.000、P<0.010,具有显著的统计学差异。
4 结束语
本文开发的基于仪控系统的核电站网络安全系统防护体系模型,通过基于差值序列的超限学习机算法,可以提高系统的敏感度、特异度和稳定性,能够提高核电站网络安全系统防护体系的精确度。目前基于仪控系统的核电站网络安全系统防护体系只是仿真系统,还没有进行商业化开发,后期还需要做进一步开发。