APP下载

基于决策树算法的无线参数优化方法

2012-08-09徐晶孙艳民付旭轮沈骜

电信工程技术与标准化 2012年1期
关键词:决策树无线节点

徐晶,孙艳民,付旭轮,沈骜

(1 中国移动通信集团设计院有限公司,北京 100080;2 中国移动通信集团河北有限公司,石家庄 050021)

1 概述

移动通信网络是一个动态的网络,话务密度分布不均、频率资源紧张,网络配置未达最佳且长期处于不断变化之中。近年来,无线通信网络的规模又不断扩大,如何能够在有限资源和超大网络规模的情况下有力的保障网络的服务质量,这对无线网络的维护和优化工作提出了巨大挑战。

通用的无线网络优化方法是对正式投入运行的网络进行数据采集、数据分析,找出影响网络运行质量的原因并且通过参数调整和其他技术手段,使网络达到最佳运行状态。目前对无线参数设置的调整主要依赖优化人员的经验来实施,要靠人工对繁杂的网络数据进行及时的分析和对比得出优化方案是不可能的。通常是借助于单一类型的数据进行分析,例如首先统计某一类话务量,然后根据统计的话务量进行网络优化;例如根据路测数据统计网络覆盖情况,然后进行相应分析和调整。而对于大规模的数据的分析能力相对较弱,尤其是无线通信设备的无线参数配置数据规模很大,结合无线参数配置数据进行模型分析的手段较少。无线通信设备上无线参数的数据量较大,通常在网络质量出现问题或收到投诉后才进行参数设置的排查。对于大规模数据的分析,数据挖掘可以从海量历史数据中提取隐含的、未知的、具有潜在用处的信息,应用于现网数据的分析。着眼于现状,本文主要研究了如何将数据挖掘中的决策树算法应用于无线网络的智能管理和无线网络优化。

2 基于决策树的网络性能检测模型的设计

本文提出一种基于决策树的网络性能检测方法,通过训练无线参数配置数据,建立决策树分析模型,实现相对独立的无线参数数据分析系统。使用一种主动预测的模式利用数据挖掘中决策树的方法通过对无线参数组的数据定时记录分析,确定哪个参数属性域作为目前最好的分类指标,即该参数的算法是关系网络质量的重要配置。本文的做法是穷尽所有的参数属性域,对每个属性域分裂的好坏形成量化,计算出最好的一个分裂,量化的标准是计算每个分裂的多样性。

2.1 决策树检测算法的提出

总体思路参数描述是:数据由集成商从OMC上采集得到,并将大量已有历史数据提供给数据挖掘服务器,获取参数数据的信息,并建立决策树模型,并对模型进行评估。在建立模型之后,通过不断采集新数据,定时预测无线网络的性能。

实施的具体流程由图1表示,包括以下步骤:

步骤1:从OMC上采集无线参数数据,提取无冗余的特征属性数据集合,并将该特征属性数据集合分为特征属性训练数据和特征属性测试数据;

步骤2:利用步骤1得到的训练数据集生成决策树;

步骤3:利用步骤1得到的测试数据对决策树进行裁剪生成目标决策树模型,即网络性能检测模型;

步骤4:利用新采集的参数数据对目标决策树模型进行评估,选择最优决策树模型;

步骤5:定时采集无线通信设备的参数数据,建立联机分析数据仓库;

步骤6:利用已构建的决策树分析模型,联机分析处理无线参数的配置数据,主动查出无线网络性能的检测结果。

2.2 模型算法的具体描述

在建立决策树检测模型的过程中,各个步骤具有不同的关键点。其中决策树各节点的生成算法是建立准确模型的关键。通过不同节点的判断,不仅可以预测网络性能是否符合期望,同时可以根据节点的属性及阈值,得出参数配置的合理值。

根据2.1章节的叙述,详细描述具体步骤如下:所述步骤1具体为:

(1)定时对从OMC采集到的数据进行记录的数据清洗,将冗余的或无关的数据从数据集中删除;

(2)提取剔除冗余的数据,组成特征属性数据集合,并根据对应的性能指标参数的取值确定分类属性的类别。

图1 算法流程图

所述步骤2是生成决策树模型。采用C5的算法,对特征属性训练数据进行不断的切分,每一次对应一个无线参数特征属性的判断并同时对应一个节点,直到切分的层数到达了预定的层数为止。

设训练数据集合D。一组数据作为一个数据项记为Di,对应特征属性记为Ai,对应的分类属性记为Ci,用Ci,D表示D中属于类别Ci的数据项构成的子集。选取的无线参数作为特征属性,选取的无线参数对应的网络性能优劣作为分类属性。

|D|和|Ci,D|分别表示集合中的数据项的数目;用公式(1)来计算信息:

式中Pi表示集合D中任一数据项属于类别Ci的概率,用|Ci,D|/|D|估计,Info(D)称为集合D的信息熵;

假设集合D中的参数数据使用某个参数属性A作为分类节点,则将集合D划分成v个子集{D1,D2,…,Dv},属性A达到纯净所需的信息量表示如公式(2):

Gain(A)表示属性A的信息增益,如公式(3):

用划分信息量来控制在节点上分支过多对算法的影响,如公式(4):

信息增益率(Gain Ratio)定义如公式(5):

选取增益率最大的特征属性作为根节点属性,然后针对根节点划分得到的若干子树求取子树的根节点,依次由上至下生成每一个节点。

所述步骤3具体为:

(1)将特征属性训练数据进行切分处理得到预定的数据决策层,并选择裁剪节点生成决策树;

(2)使用特征属性测试数据对决策树进行裁剪处理,生成目标决策树模型。

当测试无线参数组数据进入决策树并达到叶节点时,用测试无线参数组数据的分类类别与叶节点的分类类别比较,得到每个分支的出错率,通过对每个分支的出错率进行加权平均,计算出不剪枝该节点的错误率,并判断剪枝是否能够降低错误率,如果是,则减掉该节点的所有子节点后,通过测试数据校验出错率,生成错误率相对最小的目标决策树模型。

所述步骤4具体为:使用特征属性测试数据集及新采集的数据集,分别对生成的目标决策树模型和正在使用的决策树模型进行评估,如果评估结果大于预先设定的误差阈值,则返回步骤3;否则判断生成的目标决策树模型的误差值是否大于正在使用的目标决策树模型,如果判断结果为是,则使用该正在使用的目标决策树模型;如果判断结果为否,则使用该生成的目标决策树模型。

所述步骤5具体为:

(1)对目标决策树进行分析,生成分类规则集;

(2)使用该分类规则集,生成分类参数数据库;

(3)对网络性能进行分析处理,检测出性能低于期望的参数配置。

所述步骤6是对现网无线参数数据进行OLAP分析,检测出使网络性能下降的无线参数配置情况,图2为系统网络拓扑。

图2 系统网络拓扑图

3 案例分析

分析SDCCH信道是否有拥塞,在采集到的无线参数历史数据和性能指标历史数据中提取特征属性数据集D。取参数T3101、MAXretrans(最大重发次数 )、T3107、T3103、T3122、CELL RESELECT OFFSET、T3212等作为特征属性向量,每一个参数作为一个特征属性。分类属性的类别设置为SDCCH拥塞率大于1%和SDCCH拥塞率小于1%。当SDCCH拥塞率小于1%时,默认为此组参数的配置符合期望的网络性能。当拥塞率大于1%时,检测出该组参数的配置值使得网络质量不高。在检测结果预告网络性能受影响时,通过分析从根节点到预测类别的路径,能够得到需要调整的参数集,以及建议调整的取值。

在本案例中选取部分历史数据提取为训练数据集和测试数据集,数据集表示如表1所示。

计算各参数特征属性的增益率,从根节点开始选择各个节点以哪个属性作为分裂属性。建立决策树模型之后,对决策树进行剪枝、评估,得到最终的决策树模型,从而进行评估网络性能。由以上示例数据建立的简单决策树模型如图3所示。

表1 案例数据集

图3 案例建立的决策树模型

利用获得的模型分析联网采集到的参数配置数据,预测出网络性能的优劣。若对某组参数配置检测得到的结果为影响网络性能,则根据使用的分支规则列出存在问题的参数子集。如果预测分支的规则为T3101≥3且MAXretrans<3.56且T3122>10,则该组参数配置的分析结果是SDCCH拥塞率大于1%。同时可以得到T3101、MAXretrans和T3122的修改方案。

4 结束语

目前的绝大多数网络优化手段没有深入挖掘无线通信设备无线参数配置数据的历史信息。本文提出的方法利用数据挖掘的决策树分类算法分析无线通信设备上无线参数的配置数据,以检测或者预测网络性能。这一方法能够充分分析无线设备参数的配置,并利用历史数据及现网数据自动构建分析模型实现智能的优化手段。

[1] 姚家奕,姜海,王秦. 决策树算法的系统实现与修剪优化[J].计算机工程与设计,2002,23(8):75-77.

[2] Jiawei Han. 数据挖掘概念与技术[M]. 北京:机械工业出版社,2007.

[3] 韩斌杰, 杜新颜, 张建斌. GSM原理及其网络优化[M]. 北京:机械工业出版社,2010.

[4] 李仲令, 李少谦, 唐友喜, 武刚. 现代无线与移动通信技术[M].北京:科学出版社,2006.

猜你喜欢

决策树无线节点
CM节点控制在船舶上的应用
Analysis of the characteristics of electronic equipment usage distance for common users
《无线互联科技》征稿词(2021)
基于AutoCAD的门窗节点图快速构建
一种针对不均衡数据集的SVM决策树算法
无线追踪3
基于ARM的无线WiFi插排的设计
决策树和随机森林方法在管理决策中的应用
ADF7021-N在无线寻呼发射系统中的应用
基于决策树的出租车乘客出行目的识别