数据挖掘与网络运营管理思考
2020-04-20张磊
张磊
摘 要:在大数据时代下,信息数据的重要性变得越来越高,各种数据收集、处理技术也因此在网络运营管理领域得到了应用,而数据挖掘技术则是其中应用较为广泛的一种。本文对数据挖掘技术与网络管理分别进行了介绍,同时结合各领域网络管理的实际情况,对数据挖掘技术在网络运营管理中的应用展开了探讨,希望能够对数据挖掘技术的有效推广应用起到一定帮助。
关键词:数据挖掘;网络运营管理;关联规则
中图分类号:TP3 文献标识码:A 文章编号:1671-2064(2020)01-0013-02
0 引言
在当前网络环境下,人们的出行、购物、工作等各项活动虽然都会产生大量的数据,但由于网络资源本身具有很强的异构性与动态性,因此传统网络管理技术往往无法对这些重要数据进行有效捕捉,这不仅会影响到网络运营管理决策的准确性,同时也会使网络运营管理的功能性因此下降,而对数据挖掘技术的运用,则可以通过在网络中的数据抽取、转换、集成来游戏有效解决这些问题。由此可见,数据挖掘对于网络管理来说十分关键,对于数据挖掘在网络管理中应用的思考,则是非常具有现实意义的。
1 数据挖掘与网络运营管理概述
1.1 数据挖掘技术
数据挖掘简单来说就是将数据库(信息库)中的数据提取出来,通过数据集成、数据归约、数据变换、数据清理等一系列步骤对其进行处理,最终抽取出符合需求、具有价值、可被理解与应用的数据,从而为海量数据的有效应用提供支持。从功能上来看,数据挖据技术主要可分为分类、估值、预测、关联规则、聚集、描述、可视化、复杂数据类型挖掘等几种功能,由于不同功能在数据挖掘方式上存在一定差异因此,通常会被划分为直接数据挖掘与间接数据挖掘两大类。其中直接数据挖掘是以可利用数据为基础,有针对性的建立数据模型,之后依据数据模型对剩余数据及特定变量进行描述,如分类、估值、预测、关联规则都属于直接数据挖掘中的一种,而间接数据挖掘则在建立数据模型的同时,用数据模型对模糊变量进行描述,主要包括聚集、描述、可视化以及负责数据类型挖掘。由于数据挖掘技术是面向应用的,因此其不仅能够以特定数据库为基础,完成数据检索、查询、调用等简单操作,同时如数据统计、数据分析、数据推理、数据间关系确定等,也同样可以通过对数据挖掘技术的应用[1]。
1.2 网络运营管理
网络管理可以简单理解为对通信网络资源性能、使用情况进行检测、控制、资源配置、分析、评价、记录的一系列活动,通过有效的网络管理活动,不仅能够保证网络的有效运行,同时也可以使网络变得更加高效、安全、稳定,因此在网络系统中,网络运营管理一直都发挥着极为关键的作用。从功能上来看,ISO定义的网络管理功能主要包括配置管理、故障管理、性能管理、安全管理、计费管理几部分,其中配置管理的主要内容是对网络配置情况进行的数据收集、运行监控与调整,网络拓扑结构规划、硬件设备插板配置、重构网络资源、修改或删除网络资源等,都属于配置管理的常见内容。故障管理是指在硬件设备与网络路径出现问题后,根据系统发出得报警信息来进行分析,以判断出故障的位置、原因并为故障的有效处理提供支持。性能管理是一项持续性的管理功能,在网络运行过程中,系统会定期收集网络资源性能的相关数据,并提交给网管中心,网管中心在得到网络资源性能测量数据后,会判断出网络资源的性能并将这一性能情况作为历史记录保存起来,这样当网络运行效率过低或是系统性能出现问题时,就可以根据这些历史记录展开分析,以实现系统性能的有效优化。安全管理主要是针对网络资源及计算机设备的非法访问问题,具体方法是通过对加密机构的密钥进行管理,以实现对网络资源及设备访问权限的加密,这样在为掌握密钥的情况下,非法访问行为就可以被及时发现并制止。计费管理主要是针对各种电信业务资费标准,其内容相对简单,主要包括电信用户业务使用情况管理和电信用户费用管理等。
2 数据挖掘技术在网络运营管理中的应用
2.1 网络入侵检测
网络入侵检测是为针对当前黑客网络攻击、病毒入侵等网络信息安全问题所展开的一种网络管理活动,在这项网络管理活动中,任何可能会损害网络系统保密性、完整性、可用性的行为都需要准确识别出来,并及时加以制止,同时还要向系统发出警报,确定后续处理方案。现阶段常见的网络入侵检测方法主要可分为异常检测与误用检测两种方法,二者虽然都是通过从计算机网络关键点信息的收集、分析来检测违法安全策略的入侵行为,但误用检测是以攻击特征为基础,将已知的各种攻击特征编写为程序存入到专门的数据库中,之后在通过计算机网络关键点信息与攻击特征信息的对比来进行检测,如两种信息匹配度较高,则说明网络系统遭受到了攻击,反之则说明网络系统正处于安全状态。而异常检测则是以用户行为及网络资源使用情况为基础,对各种行为与正常行为进行对比分析,如用户行为与正常行为间的偏离度较高,则说明系统遭到了入侵。这两种入侵检测方法虽然都具有着较好的应用效果,但也同样无法识别未知入侵行为、技术不够成熟等问题,因此为保证网络入侵检测的有效性,完全可以将数据挖掘技术中的关联规则、聚类分析应用到网络入侵检测中来,对当前检测方法进行优化。例如在误用检测中,可以利用关联规则来识别各种频繁项目集,之后对项目集的支持度、可行度进行分析,如可行度与支持度小于用户规定法制,则说明系统可能会遭到入侵,这样即便网络系统遭到了未知入侵行为攻击,系统也可以有效识别出来并予以制止。而在异常检测中,则可以利用反应聚类分析来识别数据对象的内在规则,将数据分布规律确定下来,并据此提出相应的入侵检测算法,为入侵检测提供有效支持。
2.2 网络资源应用
在互联网高度普及的今天,网络上的各种数据信息、文件资料已经在教学、管理等诸多领域中得到了较为广泛的应用,但由于网络上的各种资源较多,用户很难从海量数据中找到自己想要的资源,因此针对当前网络资源应用存在的问题,同样也可以对数据挖掘技术进行应用。以教学资源应用为例,面对数量众多、良莠不齐的网络资源,首先可以利用关联规则挖掘关联特性,根据自己想要的网络资源来从关系数据库中提取合適的关联规则,搜索网络上的各种相关教学资源,并找出其中出现条件概率较高的资源。而在建立学习平台的情况下,则可以对学生网页浏览情况进行检测,收集其网络浏览习惯,并根据各个网页的内容展开综合分析,确定学生学习特征以及知识点之间的内在联系,这样既可以将网络学习资源中的各个知识点连接起来,同时也可以找到符合学生特征与知识认知情况的新学习资源,使学生的个性化学习需求得到满足。其次,则可以对学生的学习情况、能力情况进行全面收集,之后再根据模糊集判断、决策、识别等数据处理方法,对学生进行定性的模糊式评价,通过模糊式评价结果,教师可以获知学生的学习习惯、学习特性、兴趣爱好,进而展开针对性的教学策略推理、学习资源推荐、学习引导,以达到分层教学的效果。最后,由于聚类分析能够将相似度较高的数据对象归为一类,因此在网络教学资源的应用过程中,还可以基于聚类分析技术设计推荐功能,根据教师已掌握的网络教学资源来为其推荐相似度较高的其他教学资源,或是根据学生的专业背景、层次信息、所学知识点等信息来筛选出相关度较高的资料,从而为教学与学生学习提供个性化服务。
2.3 网络故障处理
当前的常规故障管理主要是通过网络设备运行、流量等信息的收集检测来判断网络系统是否存在故障,并根据对故障的识别分析来为故障有效处理提供数据支持。在理想状态下,网络故障发生后只要能够被系统检测出来,系统就可以发出警报,警告网络管理终端进行故障分析、识别与处理,但由于网络系统每天检测到的故障隐患非常,所发出的故障警报已经远远超出了网络管理平台的处理能力,因此网络管理很难单纯依据警告信息来进行有效的网络故障处理。针对这一问题,同样可以利用关联规则来对网络系统中的不同警报信息进行关联性分析,确定不同警报信息间的关联性,之后从中去除一些关联性较小或完全无关的警报信息,在将这些信息剔除后,上交网络管理平台的信息数量大大减少,警报信息的语义表达也会更加明确,平台处理起来自然也会更加高效。同时,根据关联性较大的警报信息,网络管理平台还可以快速找出故障的真正原因,并通过故障定位等手段来尽快完成故障处理,恢复网络服务,降低网络故障对网络用户的影响。
2.4 网络营销管理
网络营销作为一种依托互联网发展起来的一种营销模式,其对于客户的各方面信息数据需求非常之大,虽然从目前来看,大数据技术的支持使得很多企业都能够可以对用户在日常生活、工作中产生的相关数据进行收集,并通过对海量数据的分析来探究客户及市场需求,制定针对性的营销策略。但由于网络营销中涉及的数据种类较多、数量也非常大,因此如何从中提取出有价值的新信息,并将这些新数据信息有效应用到营销工作中来,就成为了网络营销的一大难题。针对这一问题,企业完全可以以数据挖掘技术中的关联规则为基础,对海量的网络营销数据展开关联性分析,确定网络营销数据的特点,之后一句數据特点展开数据筛选、提取、转化,将原本关联性较低的数据转化为可利用的营销数据,从而为网络营销决策提供支持。
2.5 网站平台运营
各类网站平台的运营管理需要对海量数据进行处理,因此在这类网络管理工作中,数据挖掘技术所能够发挥出的作用同样是非常多样的。例如在用户经营方面,用户注册并登录网站平台后,其所有操作信息都会被记录下来,这时平台方就可以利用模糊集算法来对用户浏览方式、浏览内容、操作习惯、不同页面停留时间等信息来对用户访问习惯展开推断,并根据其访问习惯来为期提供个性化服务(如商品推荐等),或是针对用户喜好来对网站运营模式进行更新,这样可以有效提升用户对网站的好感度,而网站的运营效益也会因此得到提升。另外在一些以商品销售为主的网站上,由于网站上销售的商品较多,因此用户通常会根据自己想要的商品来进行关键字搜索,以找出网站上所有的该类商品,根据用户的这一习惯,网站运营管理部门则可以通过用户的购物偏好(由模糊集算法确定)来主动为其选取一写关键词,并显示在搜索栏中,这样用户在想要查找商品时,就可以从关键词库中提取出部分符合其购物偏好的关键词,为用户提供提示,这样就可以使搜索服务更加个性化,从而帮助用户购买到更为理想的商品。
3 结语
总而言之,数据挖掘技术在网络运营管理中能够发挥出十分关键的作用,无论是对网站平台的运营,还是在网络营销管理工作中,亦或是针对网络系统故障的处理,都可以通过对数据挖掘技术的灵活应用来解决各种问题,因此未来必须要要对数据挖掘技术基于更高的关注,并根据其技术特点将数据挖掘应用到更多的网络运营管理工作中来。
参考文献
[1] 马亭新.数据挖掘在通信运营企业管理中的应用[J].信息系统工程,2019(10):50-51.