基于报文动态特征的信息处理系统优化
2018-02-28周浩文余杰
周浩文 余杰
摘要
随着产业界计算与存储能力的不断提升,专用信息处理系统的规模剧增,且智能化的需求也越来越大,系统复杂性明显增加,因而带来设计与维护方面的新课题。本文以此类系统的体系结构为对象,借鉴时间序列分析及循环神经网络等方法,试提出一种提取系统内网络报文动态关联规则的思路。用以优化系统,及为系统的智能化提供支撑。
【关键词】信息处理系统 动态关联规则分析系统优化 智能化
随着信息化的进一步深化,以及智能系统概念的全面普及,越来越多的专用系统的设计,也吸取了通用系统的设计理念。与此同时,专业系统在设计时面临着一个愈发明显的问题。当其复杂性变大时,其在设计实现及维护等多个层面,都会面临着潜在脆弱、设计不到位等问题。系统变得难以被把控。因此,有必要研究一种新的方法,结合传统系统设计自顶向下的方式,以一种新的动态关联规则分析的方法,从系统行为中分析优化方向。本文试就这一思路的基本概念与方法做简单阐述。
1 模型
在设计专用信息处理系统时,一般会涉及以太网、信息交换技术,数据库技术、以及计算设备、存储设备等等。在系统内部,各分设备间往往采用统一格式的网络报文。对于此类复杂功能的系统,若其设计还是只依赖从顶层概念到功能细分,则其随规模以幂律提升的复杂性将越来越难以掌控。另外,此类系统的维护中,会由于过于复杂,而增大问题定位难度。因此,就这种系统,有必要利用智能化的方式,利用其动态行为信息来辅助设计与维护。
目前智能方法在计算方面已经应用得较为广泛。一类系统引入智能算法用于预测未来的趋势。比如推荐系统正是利用用户行为,得出该类用户更可能的未来的行为。另一方面,关联规则是数据挖掘中的一个典型的算法,其正是利用历史数据在数据库中已成确定格式的基础上,静态分析矩阵化的数据项之间的关联规则。
这两个思路的结合,可以构成一种动态关联规则方法。我们认为可以此思路来解决复杂局域网系统的设计实现与维护问题。在复杂局域网信息处理系统的设计中,采用以太网作为统一通信的方式。那么在通讯协议的设定之中,会确定一个固定格式的报文头。在这个报文头中,包含了发送方的IP地址,接收方的IP地址以及设备类型,时间信息,以及报文功能等。并且与一个确定的命令码相联系。在系统运行的时候,会有大量的网络报文产生。若系统十分关注效率,则UDP组播将成为网络通信的一个较有效方法。如图1所示。
若信息处理系统包含一个数据库设备,那么可以在数据库设备之中记录这类报文。我们可以设计UDP组播报文分析软件,其基本功能为获取在数据库中的报文,通过分析报文中的源与目的IP地址,以及时间信息,命令码,功能信息等提取报文之间的关联规则。即各种报文同时出现的概率,或报文的时间序列特征,即报文的时间序列是确定的,是周期性出现的还是以一种变化的趋势出现。我们可以引入循环神经网络(RNN),LSTM或ARMA模型作为技术手段。
此类分析完成后,有望提取出此信息处理系统在运行时的各种行为,并且可以将其与系统设定的工作模式挂钩,即分析在每一个工作模式下,其产生的网络报文行为。可以确定,当这样的系统经过足量数据的动态关联规则分析后,具备对系统未来短时间内的行为进行预测的能力。在此意义上,可以记录系统的异常行为。当异常行为出现时,该软件就会对其进行侦测捕获,甚至可以定位异常。在系统维护时,就可以通过日志,为维护人员定位解决问题提供参考。
另一方面,当专用信息处理系统足够复杂时,其智能化的需求也愈发迫切。现有的有效智能化方法从图形感知出发,针对的是人机交互界面,如卷积神经网络,生成对抗神经网络等方法。在此过程中,前文提及的针对其网络报文的动态关联规则分析所提取出的特征,也可以提供信息支持。即可以从网络报文的关联规则反演产生这些报文的人机交互的行为,以更好地指导智能算法設计与训练。或者指导系统的性能优化。
2 总结
本文提出了一种动态关联规则方法的思路,用于分析专用信息处理系统中的网络报文,对其关联性特征进行提取,用以预测系统行为,从而指导设计及维护时的问题定位。并且为系统智能化提供通信行为特征支撑。本文阐释了其基本思路。未来,我们将进一步对其做原理分析与仿真实现。
参考文献
[1]赵昊,汪涛,许凡,方彦军.时序动态关联规则挖掘中趋势变化与预测[J].河南科技大学学报(自然科学版),2015,36(06):40-45+7.
[2]刘宗成.基于动态关联规则的网络用户行为分析[D].兰州交通大学,2015.