APP下载

校园网数据分析平台建设与应用探索

2020-04-07皇甫大鹏陈平田小萍

中国教育信息化·高教职教 2020年3期
关键词:无线网数据分析校园网

皇甫大鹏 陈平 田小萍

摘   要:校园网运行和管理是高校推动教育信息化的重要组成部分。在校园网运行管理方面,管理员需要综合认证计费系统、网络管理系统、出口流量管理系统和无线网管系统的数据,通过查找、定位、监控,解决校园网运行中存在的问题。文章基于上述校园网管理系统的数据,构建了校园网运行分析模型和平台,并利用数据挖掘技术分析了校园网用户的上网行为特点,为校园网管理部门在日常工作中优化校园网络服务、保障网络安全提供了支持。

关键词:校园网;认证计费;无线网;数据分析;网络安全

中图分类号:TP393.1 文献标志码:A 文章编号:1673-8454(2020)05-0054-04

进入“大数据”时代,如何收集数量大和种类齐全的数据,成为决定大数据分析质量的关键问题。校园网的运行质量和维护速度,需要大量系统数据进行支撑,校园网支撑的主要系统包括认证计费系统、网管系统(有线网与无线网)和核心出口设备数据。用户关注个人上网情况,上网的账单、时长、流量和使用地点成为师生关注的焦点,通过分析和挖掘认证计费等系统,可以给学生提供一份完美的账单。

同时,对于网络管理和运维人员来说,校园网中软件系统运行情况和硬件设备运行状况的清晰、便利查看,成为一个痛点。通过分析网络系统数据和硬件运行情况,量化网络运行指标,建立网络运行模型。主要包括:上网行为分析,即用户流量、人数、时长和地点等综合分析,为计费策略提供依据;网络运行分析,主要通过统计核心设备和楼宇的带宽,提供线路和设备优化方案,即量化无线AP的利用率,提供无线AP的优化方案,量化交换机的利用率,提供交换机的优化方案;出口链路分析,即量化出口链路质量和饱和度,为链路优化提供依据。

一、分析平台功能

1.集成网络业务数据,梳理数据质量

针对认证计费系统数据库、无线探针数据库、校园网网络设备运行管理系统数据库、校园网出口智能流量管理系统、校园网MRTG流量数据进行数据梳理,基于标准化的数据模型实现数据集成,检测数据质量,提供数据接口。

2.构建数据分析模型,为分析决策提供支持

在北京师范大学数据中心基础上构建数据分析模型,提供信息检索服务,并充分利用数据挖掘等手段,为学校领导、网络与信息化建设领导和有关部门信息利用、数据监控、数据评估和决策咨询提供参考。

3.建设信息展示平台,提供个性化服务

基于北京师范大学网络分析实际需求,构建信息展示平台,用户可根据个人爱好和需要任意设置和调整信息界面,使学校领导、网络管理人员可以浏览到想要的、需要的和必需的所有信息。

4.提供管理规范和管理工具,保障系统持续运行

逐步建立数据中心的日常维护和运作保障机制,制定管理规范、技术规范、工作流程、服务章程等各项规章制度,提供数据审计、数据监控工具,保障北京师范大学网络行为监控与分析平台的持续运行。

二、分析平台架构

网络行为监控与分析平台考虑到现有信息系统实际情况,采用B/S结构、Linux操作系統、Oracle或MySQL数据库。开发技术要考虑跨平台和兼容特性,采用J2EE标准、组件技术及在数据交换上对XML的支持,使系统功能最优化,同时将整体系统内部在技术上的相互依赖性减至最低。平台架构图如图1所示。

逻辑架构包含四个层次,分别是网络系统数据及相关数据源、数据加载ETL、数据仓库DW与多维分析模型、数据展示平台。

其中,认证计费系统和两套网络管理系统数据及相关数据源层包括上网行为和设备终端运行数据和各类业务数据,涵盖校园网络所有准备集成到数据仓库的业务数据。数据ETL采用数据集成工具实现,使用管理信息标准,对异构数据库的数据进行交换,通过定时抽取、增量更新、触发更新、日志挖掘、策略抽取等多种方式同步数据。支持Oracle、SQL Server和Mysql等主流数据库,以及Access、Excel、dBase/Foxbase、Tabled Text、WebService、JDBC/ODBC等多种数据源。数据仓库是一个数据库集合,存储大量的多维数据,为上网行为分析提供数据支撑。

展现层提供的统计数据,从为领导决策、师生服务、数据管理和数据审计等多层次进行展现,为学校管理者和师生提供各类服务。

三、分析平台功能建设

校园网数据分析平台建设包括校园网数据仓库建设、数据集成平台建设和数据分析平台建设三个方面。

1.校园网数据仓库

校园网数据仓库以主题模式进行建设,存储校园网相关的多维数据,实现灵活钻取的功能。数据仓库建设是一件复杂的系统工作,通过确定问题域和系统责任、确定待分析的对象、归纳现实对象、抽象设计类、建立类层次结构等过程,最终形成统一的校园网公共数据模型。其中数据模型是数据分析的支撑,数据模型包括事实表、维度表、维度级别、关联关系、逻辑列等。

(1)分析维度

时间维度:年、月、日、时。

空间维度:区域、楼宇、楼层、房间。

主体维度:师生、院系、学科、年级。

形式维度:有线网、无线网。

(2)主要数据指标

结算数据(认证计费系统):账号、流量、费用、时长。

上网明细(认证计费系统):账号、IP地址、上线时间、下线时间、入流量、出流量、总流量、总时长、消费金额、产品名称。

有线网管系统:账号、IP地址、MAC地址、交换机地址、交换机端口、上线时间、下线时间、入流量、出流量。

无线网管系统:账号、IP地址、MAC地址、无线AP名称、无线控制器IP。

无线AP对应表:无线AP名称、楼宇、楼层、房间号。

配线架对应表:交换机端口、配线架端口、楼宇、楼层、房间号。

2.校园网数据集成平台

数据集成平台实现数据仓库与原有各业务系统之间的数据交换工作。完成数据集成过程,其中包含集成过程、集成方法调用以及集成架构和集成策略。集成的过程即为ETL,它是将数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程,完成数据从数据源流向目标数据库。ETL过程通过ETL工具自动进行,实现自动抽取、转换、清洗和装载。

3.网络行为分析平台

网络行为分析平台主要包含三个方面的内容分析,如图2所示。

(1)上网数据行为分析

从学校领导的角度出发,需全面掌握师生的上网行为情况,对全校师生的上网费用、流量、人数、时长、目标网站,结合人群特点、地点变化、不同学科、不同年级等进行数据分析挖掘,展示各种上网报表,清楚地掌握各种上网数据,为制定政策、优化工作提供分析决策依据。例如:分析哪些目标网站是师生经常访问的,提取后即可以调整优化目标网站的链路,提高访问速度,提升上网体验;通过对比不同学科的上网时长、流量,分析各学科的上网特点,上网需求大的学科可适当增加流量,以满足教学科研的需要;通过分析贫困生和一般家庭学生的上网费用,来适当减免贫困生的上网费用等。

(2)网络运行监控分析

从网络管理人员的角度出发,收集统计校园网设备以及流量监控、故障等信息,分析校园网整体运维情况,为网络运行管理人员提供分析趋势图,以便进一步减少运维故障,提高网络性能。同时,根据核心设备之间的流量,及楼宇出口流量和人数的使用情况,提供设备和线路带宽调整的依据;根据接入交换机的利用率,判断是否需要更换交换机,判断当前交换机是否需要升级、增加或减少设备,以提高利用率;统计无线AP的利用率,判断AP的调整和升级等。通过量化网络指标,为网络的建设、运行和维护提供决策依据。

(3)网络流量实时地图

从普通师生的角度出发,发布校园网的相关图例,让师生更加了解校园网。定时发布校园网相关数据趋势图例、校园网访问互联网实时出口链路质量图、校园网各楼宇(带宽、流量、上网人数)实时流量地图。校园三维地图上展现校园无线网终端散点分布图,让师生更加形象直观地了解校园网的使用情况,为上网行为提供分析决策。另一方面提供网络流量的历史数据,供师生参考,比如:学生的历史数据可显示带宽和流量趋势图,晚高峰相对比较拥堵,在线人数也相对较多,网速相对其他时间也较慢,而白天则相对晚高峰有很大的优势。

四、网络数据分析案例

上网消费预警:主要针对师生上网流量预警、上网时长预警和上网费用预警。针对出现上述预警的师生定期进行人工分析,根据实际情况汇报给其辅导员或院系办公室。师生缺勤预警,尤其是学生宿寝预警成为高校的重要关注点,为了实现该预警,除认证计费系统数据外,还需通过探针监测用户终端位置信息(用户手机即使未接入无线信号,也可以收集其信息),探针部署在主要路口和楼宇大厅,可以收集到用户的时空信息。

上网行为轨迹:为用户一天在校园内的行为轨迹,该数据结合师生在办公室、教室、宿舍和食堂等空间上的上网数据,通过路口与楼宇大厅的探针,画出学生的行为轨迹,如图5所示。

无线网定位:众所周知,GPS定位的精准度有待提高,同时在建筑物内无法定位具体楼层。室外定位主要靠GPS实现,室内定位靠接入AP及周围AP信号衰减值确定,也可以使用无线厂商的定位算法。

优化校园资源:①无线AP资源优化:根据用户接入情况,可以撤销部分长期无用户接入的无线AP;对长期高密接入无线AP的位置,适量增加无线AP或者更换高性能无线AP。②公共资源调整:通过该系统分析食堂和自习室等场所的使用情况,根据用户情况,考虑下一期建设优先投入资源。

自习室推荐:根据学生在教室的上网信息,分析自习室座位剩余情况。需要协调教室管理部门提供教室排课信息及教室座位信息,根据教室座位剩余情况和学生历史自习室情况,推荐合适的楼宇和教室。

五、结束语

校园网数据分析平台通过量化网络指标,建立网络运行模型,基于用户上网行为分析用户流量、人数、时长等综合指标,为学校资费调整、网络建设提供决策依据。该平台的用户使用密集度为制定网络重点建设部位提供决策依据;学校网络资费平均2年调整一次,也需要依赖该系统提供数据支撑。

参考文献:

[1]任华,张玲,叶煜.数字化校园中用户网络行为大数据的分析与监控[J].计算机与数字工程,2017,45(9):1814-1818.

[2]杨敏,何海涛,赵琼.流量大数据安全分析平台的设计与实现[J].通信学报,2018,39(1):104-109.

[3]田小萍,陈金焘,王兴建,符佳佳.校园卡数据分析平台建设与应用探索[J].华中师范大学学报(自然科学版),2017(1):100-103

[4]王法玉,姜妍.基于自组织神经网络和模糊聚类的校园无线网用户学习兴趣度行为分析[J].计算機应用研究,2018,35(1):186-189.

(编辑:王晓明)

猜你喜欢

无线网数据分析校园网
试论最大匹配算法在校园网信息提取中的应用
NAT技术在校园网中的应用
让咖啡和无线网走开 伦敦独立书店回归阅读初心
浅析大数据时代对企业营销模式的影响
VPN在校园网中的集成应用
北大无线网