基于改进型关联规则挖掘算法的光纤故障预警系统
2017-03-17陈津
陈津
摘 要
历经三次科技革命,信息技术飞速发展,网络几乎已经覆盖全球,光纤技术应运而生,光纤网络的容量也随之逐步增大,相应的业务种类也涉猎范围逐渐增大。网络性能和服务质量无疑在网络环境中占据优势地位,换言之,两者在信息业之中是支柱。要使光纤覆盖几十万公里,传输设备除外,还要充分考虑对光传输物理路由实施自动保护的技术有哪些解决办法,考虑到办法的可行性,安全度、可靠度、灵活度、抗灾害性、抗阻断性以及推广价值的高低。通过对光纤故障预警相关影响因素的研究,笔者结合改进型关联规则挖掘算法,设计和研究了一套基于该算法的光纤故障预警系统。
【关键词】光纤网络 故障预警 改进型关联规则挖掘算法
1 引言
我国边界近乎三分之一濒临海洋,海洋建设是不可阻挡的一股力量,为此,光纤通信在各大岛屿之间的覆盖成为挑战,各大岛屿间为构建通信环路开始利用海光缆,这就要求通信的可靠性逐渐提升,当前重要一项挑战是如何做到传输干线的无阻断通信。利用对系统光缆分段应急也就是将光缆利用人工调度到预安排的同一段落不同路由的光缆上,这是对于传统干线的维护办法。这种方法显然响应故障速度非常慢,系统受阻断的时间较长,对于系统故障指标的影响较为严重,即使目前光纤自动切换保护技术可以解决一些传输光功率变化的检测、告警信息的分析的问题,以此发现问题和隐患,当出现的故障较为严重时,可以快速自动切换的备用通道,短时间内(不超过50ms)便可恢复通信,恢复光纤故障。然而,光纤线路会产生许多光功率告警信息,这些信息通过光保护网存入数据库,通过更进一步的深入研究来了解这些告警信息、预测光纤运行的情况、从数据中提取信息进行研究,从而可以较好快速而有效的提炼出光纤故障预警信息,提高预警能力。
2 改进型关联规则挖掘算法介绍
改进型关联规则挖掘算法是在关联规则算法的基础上进行改进的,在对该算法进行介绍时,首先需要对关联规则算法的基本原理进行明确,而后才能对其改进内容进行分析。关联规则算法的基本原理主要是通过前一个频繁项集Lk-1进行分析从而得到下一个频繁项集Lk,在此分析过程中会产生相对应的候选项集,而后利用关联规则算法所具有的性质进而去对产生的候选项集中的非频繁项集进行逐步删除,在进行具体操作时,会对数据库进行不断扫描,而后利用subset函数来对具体交易记录中所产生的所有子集进行发现,由此累计每个候选项集的支持频度,最终能够满足最小支持频度的候选项集便对频繁项集L进行了确定。虽然通过此过程能够找到所需的频繁项集,但是整个过程所产生的不必要的系统开销是较大的,特别是在所需的频繁项集很长的情况下,此算法便不太适用。
为了能够较好的解决此问题,提高算法的效率,通过利用引用变量进行事务修剪以及哈希函数等方式,在不影響搜寻结果的前提下,进而减少相应的数据库的扫描时间,提高找到所需频繁项集的速度,具体采取了以下五个方面的步骤:
(1)通过利用哈希函数来对数据库进行扫描,进而得到频繁2-项集;
(2)通过所得到的频繁2-项集来对数据库进行修剪,得到新的数据库。在对数据库数据进行修剪时,主要是对不属于频繁2-项集的项目进行删除,从而去对交易记录长度进行缩短,进而去减少分组表中的存储空间;
(3)将数据库中的N个项目交易记录分别存储到N个分组表中;
(4)从频繁2-项集开始,通过结合第N-1层所得到的频繁项集,而后利用剪枝操作,得到所需的第N层候选项目集。
(5)通过候选项目集的不断对比,来产生所需的频繁项目集,在对比过程中候选项集的支持度如果能够满足大于等于所有分组表中最小支持度时,便可以确定该项目集就是所需的最终的频繁项目集。
3 光纤故障预警系统的设计
在光纤故障预警系统中,为了能够对光纤故障预警信息进行提炼,对光纤线路的运行状况以及光功率告警信息间的关系进行挖掘,就需要通过相关算法对光网络中的大量的历史光功率数据以及实时的光功率信息进行分析和挖掘,进而去对其关联关系进行挖掘,从而对光网络的故障信息进行预判和提前告警,通知相关工作人员。通过系统的分析,整个光纤故障预警系统主要由三大模块组成,分别为光功率监测模块、光功率预警分析模块以及光纤保护主控模块,具体的光纤故障预警系统功能结构图的设计如图1所示。
3.1 光功率监测模块
该模块是整个光纤故障预警最为基础的一个模块,通过该模块对光纤中的光功率值进行实时的监测,所监测的光功率值将直接给后续的光功率预警分析模块,如果监测的数据明显超过设定的门限值,光纤保护主控模块将会主动发出指令进行光纤路由切换。
3.2 光功率预警分析模块
该模块是整个光纤故障预警最为重要的一个模块,主要包括光功率数据分析模块以及数据挖掘模块这样两个部分,在该数据分析子模块中可以对光功率的数据进行自动分析,并能够自动生成相应的分析曲线,对其数据进行更加直观的显示;数据挖掘子模块则主要采取改进型关联规则算法对光功率数据进行更进一步的分析,通过该算法对光缆运行状况和光功率数据之间的关联规则进行不断挖掘,进而推出相应的预警信息。
在对光功率数据挖掘子模块进行设计时,根据改进型关联规则算法,主要需要通过以下三个步骤来得到所需的关联规则:
第一步为数据预处理阶段,通过对光功率监测模块和数据分析模块处理后的光功率数据库中数据表的相关字段进行预处理,从而将冗余的字段信息进行删除,进而能够得到供后续挖掘使用的光功率历史记录信息表;
第二步为采用改进型关联规则算法对频繁项集进行确认,在此过程中,需要设置最小支持度,而后通过该算法对光功率历史记录信息表中的数据进行不断读取和比较,最后找到所需的频繁项集;
第三步为推导关联规则,通过设置的最小置信度,和频繁项集进行相互关联,进而对满足条件所需的关联规则进行推导和确认。具体的数据挖掘模块工作流程图的设计如图2所示。
4 结论
通过对光纤故障预警系统的研究与设计,笔者当前仅对具体设计结合对改进型关联规则挖掘算法在MATALB中进行了仿真,通过建模和仿真发现,通过改进型关联规则挖掘算法,能够对数据库中的具体交易记录数量进行大幅度的减少,根据项目集的支持度判断其是否为频繁项集,能够使得数据库数据的搜寻次数以及时间复杂度均能起到有效的降低,预警准确率高。
参考文献
[1]毛国君.数据挖掘技术与关联规则挖掘算法研究[D].北京:北京工业大学,2013.
[2]刘巍,蒋华.挖掘关联规则中Apriori算法的改进与优化[J].计算机与现代化,2013,11.
[3]AlexandrosNanopoulos, YannisManolopoulos.Memory-adative association rules mining[J].Information Systems,2012,7,29(05).
作者单位
海军工程大学 湖北省武汉市 430000