浅析数据挖掘技术在高校无线网络优化中的应用
2018-07-28董雪
董雪
摘要:目前,高校无线网络主要通过路测获取数据后进行人工分析得到优化策略,但由于路测数据不仅数量庞大而且格式多样,仅依靠人工不能全面有效地找出影响网络性能的关键因素,因此数据挖掘技术的应用十分必要。本文介绍用数据挖掘技术分析影响无线网络性能的关键因素,以便指导我们高效、有针对性的提升无线网络性能。
关键词:数据挖掘;数据分析;无线网络优化技术;影响因素
中图分类号:TP311.13 文献标识码:A 文章编号:1009-3044(2018)11-0038-02
1 前言
高校信息化建设是我国信息化建设的重要组成部分,网络是高校信息化建设的基础保障。近年来,随着无线网络技术迅猛发展,无线网络信号的覆盖范围越来越广以及个人手持终端性能的不断提高,师生们对数据传输业务依赖也越来越高[1]。而高校作为无线网使用密集区,已经无法满足过去低速率的数据传输,更多关注的是不受时间和空间限制的高速率大流量数据业务,这一需求的出现就要求无线网络能够高质量、快速稳定运行[2]。
我国大多数高校无线网络在初期建设时,不可避免的会出现整体规划不科学、不合理等问题,造成无线网络性能不理想,因此需要对无线网络进行合理优化[3],无线网络在运行过程中会产生大量数据,通过数据挖掘技术的应用,找到影响无线网络性能的关键因素,分析与网络性能提升密切相关的数据,为无线网络优化提供决策性意见,有针对性并且高效的提升无线网络性能,使得其在资源设备有限的情况下,资源利用率更高、网络整体性能更优、用户满意度更高,尽可能消除初期建设时的规划不合理。
2无线网络性能指标
无线网络优化是指经过对现在已有并已经投入运行的网络进行话务数据分析、现场测试数据采集、站点参数分析等手段,找到影响无线网络质量的问题所在,并且通过站点参数的修改、网络结构的调整以及重新调整设备配置和采取某些技术手段,确保系统高质量、稳定的运行,使现有网络资源得到最充分利用[4]。
反映无线网络运行状况以及性能的指标主要包括以下内容:接入点的信号强度、认证的成功率、吞吐量、丢包率、信噪比、用户的掉线率、网络时延以及误码率等 [5]。这些指标是通过路测获得的真实数据,与无线网络性能息息相关,利用数据挖掘技术对这些主要影响因素进行分析,有助于准确、快速定位故障点,并找到影响因素间的相互关系,直击故障发生的源头。
(1)接入点的信号强度。在通常情况下我们认为-70dbm以上为理想的信号强度,-70dbm~80dbm为中等信号强度,小于-80dbm为弱信号强度。
(2)认证的成功率主要体现了用户与AP连接成功与否。
(3)吞吐量是指在没有帧丢失的情况下,设备能够接受并转发的最大数据速率。
(4)丟包率是指数据以数据包的形式传输,传输过程中出现的数据丢失现象, 丢包数据占总传输数据的百分比,一般情况下丢包率为0是正常。
(5)信噪比是指信号与噪声的比值,一般情况下,信噪比越大,则信号质量越好,混在信号里的噪声越小,否则相反。
(6)无线用户的掉线率是指(eNodeB发起S1RESET导致的UEContext释放次数+UE Context异常释放次数)/(UE Context建立成功总次数+*小区遗留UE上下文个数)*100%,一定程度上反映了无线网络的质量优劣,如若掉线率过高则会使无线网络性能下降,用户感知下降。
(7)网络时延是由过大的网络流量造成的设备反应缓慢,网络时延在1~30ms之间时,用户几乎感受不到延迟,大流量的数据传输业务都非常顺畅,在31~50ms之间时,用户没有明显感觉到延迟的情况,大流量数据传输业务都可正常进行,在51~100ms之间时,用户能明显感觉到延迟,大流量数据传输业务稍有停顿,当大于100ms时,大流量数据传输业务无法正常进行,有明显的卡顿、丢包并掉线现象出现。
(8)误码率是评价数据在一定时间内进行传输时的精确性指标,一定程度上反映了信号质量的好坏。
3 数据挖掘技术的应用
无线网络质量的优劣和各个性能指标的变化以及指标间的相互联系密切相关,它们客观反映了无线网路的运行状况。无线网络运行过程中会产生大量且格式不一的性能指标数据,人工分析这些数据费时又费力,而数据挖掘技术可以准确并高效的帮助我们完成大量性能指标数据的分析,从而达到对整个无线网络从整体到局部的细致检查,精准找到问题的关键点,进而有针对性地进行网络优化。
数据挖掘技术是从大量的、无规则的数据中提取出有价值的决策性信息的一种数据分析技术。无线网络运行过程中每一分每一秒都在产生数据,这些数据日积月累越来越庞大,在这些海量的数据中,存在着有用数据,如与无线网络性能分析紧密的性能指标数据,也存在着大量的无用,甚至因为人为或者设备本身造成的错误数据,仅仅依靠个人经验对这些数据进行分析时,由于分析人员本身的专业知识与能力的差异会给分析结果加入不可控的个人主观色彩,导致分析结果不够客观和全面,数据挖掘技术可以有效克服这些客观原因带来的缺陷。
数据挖掘在20世纪中期,随着机器学习、统计分析等关联学科的发展而发展起来,它被定义为从数据中找到未知且有价值知识的不平凡过程,它可以对数据自动地进行分析处理并进行归纳推理,从中找出数据所含有的深层次模式,它的模型如下图所示,数据挖掘流程共有6个阶段:
(1)问题定义。第一步是分析无线网络优化问题要干什么以及怎么办,也就是说在对高校无线网络进行优化时,具体需要优化哪些方面,例如网络安全方面、网络资源分配方面还是网络故障方面,为问题设计一个总体并且详细的计划。
(2)数据理解。首先确保路测数据真实有效,然后对数据质量进行一个初步评估,例如掌握数据集数量的大小、分析数据特征并进行统计、分析数据是否存在噪声以及是否完整等方面。
(3)数据准备。对各个路测设备收集来的数据进行数据清洗、统一存储,融合成为一个更全面、更准确的综合性无线网络优化相关数据集。
(4)模型建立。经过上述数据处理过程后,就要利用数据挖掘算法来对数据集进行分析,数据挖掘算法是数据挖掘过程中的核心部分,算法的选择决定了无线网络优化模型的功效。挖掘算法从功能角度划分主要有分类算法、序列模式发现算法、数据预测算法、关联规则、聚类算法等,其中,分类算法分析已有数据集的差异实现对未知数据的分类预测;序列模式发现算法与关联规则分析数据记录彼此之间的联系;预测算法分析数据本身特性并找到数据之间潜在规则并对其某方面进行预测。由于关心的问题不一样所选择的的数据挖掘算法也会有所不同,建模是一个需要反复多次进行的过程,需要不断调整算法参数,已得到更可靠的无线网络优化模型。
(5)评估。对所建立的无线网络优化模型的评估是整个数据挖掘过程中的重要环节,但是经常被忽略。这一步是验证所建立的模型以及建模过程中的每个步骤是否有效,确保模型能能够提供给我们无线网络优化方面的决策性指导意见。
(6)部署。无线网络优化模型所给出的决策性意見由于专业性强,需要在该阶段经过专业人员的解释,再呈现给无线网络优化师。
4 结语
随着大数据时代的到来,高校作为网络用户密集区域对无线网络各方面的要求都不断增多,无线网络的抵御攻击的能力、上网速度以及稳定运行等方面都是高校师生所关注的重点,利用数据挖掘技术能够帮助无线网络优化师有效提升网络性能。由于高校学生宿舍区、教学区、办公区等区域的划分,数据挖掘还能够分析不同用户行为,实现无线网络资源的合理分配,使无线网络资源达到利用率最大化,全面提升高校师生无线网体验,更好地为高校信息化建设服务。
参考文献:
[1] 马煜. 基于数据挖掘对校园网用户网络行为的分析[J]. 科技创新与应用, 2016,21(34).25-26
[2] 杨莉君. 基于数据挖掘技术的校园通信用户模型建立[J]. 黑龙江科技信息, 2013,13(20):165-165.
[3] 李慧芳, 白珊, 马强,等. 基于Spark的智慧校园数据挖掘研究[J]. 智能计算机与应用, 2016, 6(6): 106-107.
[4] 杨国静. 基于数据挖掘的高校教学数据分析研究[D]. 河北师范大学, 2015.