数据挖掘在通信企业管理系统中的应用
2017-03-08石可孟令旸
石可+孟令旸
【摘要】 通信企业客户数量多、数据存储量大、响应及时性要求高,其数据仓库对基于大数据的挖掘需求强烈。基于上述需求,提出数据挖掘在应用的方法,用以提高其运营效率。
【关键词】 数据挖掘 大数据 通信企业 应用
通信企业具有客户数量多、数据规模大、数据及时性需求高等特点。应用数据挖掘技术对通信企业收集到的数据进行建模可以帮助企业对现有的运维、计费、市场中的运营进行深度研究,得到系统存在的问题、用户支付情况等信息,为企业改善自身系统提供新的支撑。具体来讲,通信企业可以通过数据挖掘技术实现系统故障管理、系统计费管理和用户管理。
一、数据挖掘在故障管理系统中的应用
1.1 网络故障管理系统概述
故障管理是通信企业网络管理的重要组成部分,故障管理是否有效直接关系到整个网络的可靠性,其目的是迅速发现和纠正整个网络的告警故障,维护网络的可用性。通常需要对故障时间点附近所有告警进行分析才能够发现故障的根本原因,数据呈现告警数据库巨大、数据具有关联性和告警数据的关联性只能反映系统当前状态等特点。故障管理系统的特点决定了使用关联模型不仅可发现告警数据的关联性还能够高效地更新和维护已经出现的数据和数据间的联系规则。
1.2數据挖掘方法的应用
1.2.1 重复项增量挖掘
重复项增量挖掘是关联模型应用中的一个基本问题。由于并非每条告警都表示某故障的根本原因,需要对告警数据进行规则处理,将多个告警合并成一个包含更多信息量的告警,以便确定反应故障根本原因的告警,从而对故障进行定位。然而对所有数据进行分析处理数据量过大,导致系统效率低下,因此需要通过设置反映需要监测的告警数据频繁程度的支持门限实现重复项增量挖掘。支持门限增大算法效率会提高,但会减少处理的告警项目;支持门限减少算法执行效率会下降,但可以处理更多的告警项目。因此需要针对用户需要不断调整支持门限,并采用不同算法来对数据进行处理。当需处理的数据为日常事件、常规数据时,可采用CHARM算法,使用混合搜索策略跳过树的多层进行重复项搜索,提高搜索效率;若处理故障性数据时,通常采用BODHI算法,通过数据间的关联和削减,确定关键数据,然后判断系统故障节点[1]。
1.2.2 告警增加时增量挖掘
随着告警数据增加,已有挖掘结果也会受影响,此前所用模型可能不再适用。为保证规则有效性需要及时应对数据更新带来的变化,但若每次都不利用现有结果而重新发现所有数据,将会造成巨大浪费。
本文发现,若每次增加相同数据集,则支持门限越小,性能提高越显著;若支持门限相同,则数据集增加量减少,性能提高越显著。此时可采用PADMAN算法[2],该算法复杂度取决于支持门限以确定的重复项个数,而跟数据量大小关系不大,在支持低门限条件下,算法对稠密数据库性能改善更为显著。从重复数据项中发现关联规则的经典算法是APRIORI规则产生算法[3],其可从重复数据中发现所有满足支持门限和置信门限的强关联规则。
二、数据挖掘在计费管理系统中的应用
2.1网络计费管理系统概述
计费管理也是通信企业网络管理的重要组成部分,计费管理的有效性直接关系到通信企业计费结算业务是否能够平稳开展。计费管理主要提供账单查询等各种收费报表的查询统计,为企业各种服务决策提供数据支持。随着计费管理越来越多的业务数据和网络数据,需要对数据进行全方位的提取和分析,进而进一步分析用户行为,并定期总结用户流量信息。
2.2 计费管理系统中的数据挖掘方法
2.2.1 关联挖掘
应用关联模型发现诸如IP端口使用频率,IP端口和数据包之间等网络IP流量之间的关系。正常行为下,IP-端口的对应关系是多种多样的,数据包的大小也不固定;若应用关联挖掘模型测出某IP-端口使用率非常高而数据包却不大,则有可能是网络攻击等异常行为。此外,关联挖掘可根据IP-端口对应和数据包的使用频率更变网络策略。如“10k-100k,d-80”说明80端口使用率较高,大量用户在浏览网页,可据此调整网络策略[4]。
2.2.2 序列挖掘
通过建立时序模型,连接挖掘项目和时间,对在线人数、在线记录、发送帧数、发送字节数、接收帧数、接收字节数等时间相关联数据进行处理。时序模型通过自身的时间和度量值构成二维曲线反映网络情况。正常行为下,曲线都是平稳有规律性的;曲线出现抖动、暴增、骤降等,都可以看为不正常行为,可据此判断有网络故障或存在入侵行为[5]。
2.2.3 分类挖掘
分类挖掘可以帮助网管人员根据用户购买的不同业务属性判定用户喜好。分类模型可组合二维及以上的筛选浏览,并可进行细化和汇总,进行多重统计工作[6]。
三、数据挖掘在用户管理系统中的应用
3.1用户管理系统概述
通信领域竞争日趋激烈,企业除需面对同行之间的竞争,还要面对OTT企业的进入。企业亟需应用数据挖掘分析客户数据,按照客户价值、离网倾向、产品需求和服务需求等多个维度分析客户信息,建立一个良性的交互平台系统,进而有效改善运营商服务水平、改进客户关系、提升企业竞争力。
3.2用户管理系统中的数据挖掘方法
3.2.1 用户细分
用户细分通过分析用户、潜在用户的特征,根据用户个体特点、消费特性及用户价值的不同将现有用户及存量用户分解,确定不同的用户等级并描述。该过程把消费群体分成多个细分群体,同一细分群体内的用户具有相似性。通过用户群体分析,可对用户行为做出预测。RFM分析法[7]是管理用户分析的基本方法,可用于用户特征细分。细分用户主要基于用户的消费行为,有近量、频度和消费和三个变量。通过用户细分进行用户消费解析,运用累计的信息分析用户价值,对用户流失、用户满意度、贡献值、响应度、客户附加需求等做出预测,提升用户监管水平,提高用户满意率,指导企业研发销售。
3.2.2 精准营销
通过用户细分了解用户需求,把产品和用户需求正确连接起来,再通过适合的营销方式销售给客户。应用数据挖掘实施精准营销的流程[8]主要包括用户数据库搭建、主表设计、用户分析、特征刻画、用户开发、销售策划、目标用户选定、营销活动准备、营销活动和评估改进等环节。
四、结束语
综上所述,本文针对当前通信企业所面临的机遇和挑战,结合客户规模大、数据量大、数据及时性需求高,競争日趋激烈的特点,提出应用数据挖掘方法提高企业运运营效率。提出数据挖掘算法在故障管理系统、计费管理系统和用户管理系统这三类系统中的应用,能够为电信企业解决现存问题提供支撑。
参 考 文 献
[1]. 冯玉才, 冯剑琳, 关联规则的增量式更新算法 [J].软件学报,1998,9(4).
[2]. 刘康平, 李增智. 网络告警序列中的频繁情景规则挖掘算法[J]. 小型微型计算机系统,2003,24(5).
[3]. 徐丽霞, 网络故障管理告警关联技术分析 [J].电脑知识与技术,2008,4(28).
[4]. Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques. 高等教育出版社,2007,5.
[5]. 何健. 基于时间序列的网络流量分析与预测. 中国科技信息,2005,22.
[6]. 蒋川, 田盛丰. 利用数据挖掘技术提取用户行为特征. 铁路计算机应用. 2001, 10.
[7]. Padmannabha B, Tuzhilih A, On the use of optimization for data mining: theoretical interactions and eCRM opportunities. Management Science, 2003,10.
[8]. Robert M, Elliott. Data Mining Cookbook Modeling Data for Marketing, Risk and customer Relationship Management, John Wiley&Sons, 2003.