基于数据挖掘对校园网用户网络行为的分析
2016-12-23马煜
摘 要:校园网作为在校师生学习办公的现代化信息工具,已经成为使用者日常生活中不可缺少的部分。文章通过利用数据挖掘技术分析了校园网用户的网络行为特点,为校园网络部门在日常管理工作中从优化校园网络服务、保障网络安全等角度考虑,合理地提出和完善了相关的管理措施。
关键词:校园网;数据挖掘;网络行为;网络安全
引言
随着计算机网络的迅速发展,计算机网络已经成为科研、学习、娱乐等不可缺少的一部分[1]。校园网作为国内各大院校学生的网络用户聚集地,而在日常管理维护中,学校中心数据机房会将用户的网络行为记录在数据库中,随着大数据时代的来临,人们开始关注大数据集中隐含的潜在有用信息,因此,如何利用现代信息技术分析校园用户网络行为已经成为校园网管理者密切关注的问题。
1 数据挖掘概述
数据挖掘是现代化信息技术的产物,它融合了数据结构、统计学、数据库原理、算法设计等多门专业学科知识,面对如今的大数据时代,数据挖掘技术面对庞大的历史数据可以根据不同的用户需求进行数据分类、数据关联等统计分析。对于校园网络,尽管与开放性网络相比有着局限的受众群体,但在中国尤其一些高校分布较多的省市,校园网的用户量依然可观。在用户数据信息管理方面,数据挖掘技术可以科学有效地提供辅助,其挖掘过程可以分为数据采集,即采集特定时间段、特定用户的网络信息,其中包括家属区、学生公寓的浏览数据和流量数据;数据库建立,即将获取的信息数据分类录入,期间剔除重复无用信息以便提高数据分析效率;数据挖掘,即按照选择的算法设置相应的参数,通过参数的合理设定去除模糊、含有噪音的数据,提高挖掘结果的纯度;结果分析,即根据得出的数据结果总结不同类型的用户的网络行为习惯。数据挖掘技术根据所得结论为校园网络管理可以提供可靠有效的参考数据,通过针对校园不同区域的流量控制及虚拟局域网设定,合理地提高整体校园的网络质量[2]。
2 校园网用户分析
通过采集网络用户信息可以建立分析数据库,用户信息主要包含用户类型、所在区域、时段、浏览数据、流量数据、实时数据等,根据数据挖掘结果,可以发现校园网用户具有以下几个特征。
2.1 用户基数大
高校内部校园网用户主要是学生与教职工,以陕中医为例,教职工与在校学生超过一万两千人,校园中所有楼宇放置接入交换机与无线AP设备,加上用户上网设备多样化,这不仅增加了用户接入端设备参数要求,也对中心机房汇聚、核心设备的技术参数有了更高的标准。
2.2 网络行为多样性
因为校园网用户基数庞大,不同用户有着各自的网络需求,也就造成了他们的网络行为多样化[3]。通常而言,校园网络主要目的是为学生学习提供丰富的可利用资源,学生可以通过校园资源平台复习上传的精品课程要点,也可以通过在线图书馆检索收录的参考文献。然而根据实际流量统计,绝大多数学生倾向于网络娱乐行为,其中链接视频、新闻、游戏、P2P下载占绝大多数,尤其在晚高峰期间校园网络负载达到峰值。
2.3 网络安全意识低
在校园网使用过程中,大部分用户对于网络安全概念模糊,个人计算机安全防护软件设置缺失,由于对钓鱼、木马等类型网页、软件分辨能力低,致使用户在使用校园网过程中会造成个人信息泄露、财产受损等,严重的会感染病毒造成校园网络瘫痪。所以校园网管理部门,在做好校园内网与外网防护工作的同时,也应重视因校园网用户不当的网络行为可能造成的网络安全问题。
3 校园网的合理化管理
通过对校园网用户网络行为数据挖掘的结果分析,发现校园网用户在校园内部基数庞大,且不同时段不同区域的用户对网络的使用具有多样化需求,与此同时,由于大多数用户缺少相关计算机网络知识致使对网络安全意识淡薄从而造成个人损失。因此,在完善网络管理部门现有管理策略的同时,也要根据实际的用户网络行为制定合理化措施。
3.1 特定区域流量时段控制
目前,陕中医校园网分布区域主要有行政楼、教学楼、图书馆、学生公寓、家属楼。周内工作时段教职工、学生白天主要集中在工作学习区域,网络管理部门需要提高行政教学楼、图书馆的带宽速率,为教职工工作、学生查找文献学习提供便利,且同一时段对学生公寓、家属楼区域进行宽带限速。周末休息时段,由于教职工、学生大多集中在公寓、家属楼区域,流量控制策略应当倾向于提高该区域的用户上网速率。
3.2 调整无线网络覆盖范围
根据数据挖掘结果,无线AP接入设备在学生主活动区域负载较高,其中包括图书馆、学生公寓、教学楼,连接设备类型以手机、平板电脑为主,说明了网络用户倾向于移动上网设备。在设备安置数量上,可以适当减少不活跃区域的AP数,其中不活跃区域为体育馆、操场、会展中心、医史展览馆、食堂等,将更多的无线接入设备安装在学生主活动区域。通过对网络用户时段属性挖掘分析,教学楼中的无线AP设备常在上课期间处于高负载状态,且信息数据大多数属于社交软件和娱乐信息,因此可以适当减少教学楼每层无线接入设备数量且将常用娱乐软件信息端口关闭,使学生可以专注于课堂时间。
3.3 网络安全管理工作
重视网络安全是校园网管理部门维护校园网络服务的首要前提,将网络安全牢固树立在用户意识中是避免个人损失的重要保障[4]。由于陕中医学生、教职工对计算机网络知识匮乏,因此管理部门应当做好以下工作完善校园网管理模式提高网络安全。首先在部门首页及账号登录界面标识网络安全教育宣传;其次在公共资源平台上传可供用户下载的安全防护软件保障个人计算机安全使用,定期更新服务器中对不良信息网站的禁止访问列表;最后严格设定不同类型用户在不同区域的使用权限,禁止学生账号、家属区账号、行政办公账号跨区域使用。
4 结束语
在如今的互联网时代,网络对于丰富在校大学生学习、娱乐等方面起到了决定性作用,利用数据挖掘技术对校园网用户网络行为进行挖掘分析,完善管理部门制定的网络管理措施可以极大地提高校园网运行的安全性和稳定性。
参考文献
[1]李卿.数据挖掘在校园网日志分析中的应用研究[J].软件导刊,2011,10(12):168-169.
[2]陈诚.基于数据挖掘的计算机网络流量控制策略[J].广西教育:职业与高等教育版,2014(7):187-189.
[3]杨顺敏.浅谈高校校园网安全风险及解决方案[J].黔南民族医专学报,2015(3):214-215.
[4]陈庆云.校园网安全设计与研究[J].2012(1):107-109.
作者简介:马煜(1989-),男,陕西咸阳人,2014年毕业于Federation University Australia,初级工程师,硕士研究生学位,研究方向:算法设计与分析,物联网应用,校园网应用。