APP下载

中国农业大学数据分析敲响学业警钟

2019-10-15劳凤丹李军仇莹

中国教育网络 2019年8期
关键词:成绩排名全校校园网

文/劳凤丹 李军 仇莹

信息技术的蓬勃发展以及教室、实验室和宿舍无处不在的校园网络为大学生学习、生活带来便捷和高效。同时也因为网络信息的丰富性、开放性和虚拟性,引起了部分学生对网络的依赖。因此,了解大学生使用网络的情况和特点,寻找网络时代下学生教育的途径和方法,成为新时期高校大学生教育管理的重要内容。

现阶段部分高校正在建设高校大数据分析系统,但其主要侧重于学工数据分析,基于校园网出口流量大数据进行的高校大学生上网数据分析仍较为少见。本文基于中国农业大学校园网出口流量数据和业务系统数据,设计并研发实现了高校校园网上网数据分析系统。

高校校园网上网数据分析系统构建

图1为高校校园网上网数据分析系统的架构图。学生上网行为分析数据库采用Oracle系统,数据来源于网关计费系统的学生基本信息、用户上网详单;流控日志系统的应用协议流量分布、夜间游戏流量明细;Netflow系统的访问特定资源(例如图书馆数据库资源)日志;教务系统的学生成绩数据、不同学业预警级别学生数据;网络教学平台的学生或教师访问课程日志明细、课程教学资源统计等。网关计费、教务系统和网络教学数据可直接通过学生学号进行关联分析;流控日志和Netflow日志并无用户帐号信息,但通过上网IP、上网时间范围与网关计费上网详单中的上网IP、上线时间和下线时间进行关联查询也可精准定位到学生学号,从而实现所有信息的统一身份认定。

学生上网行为分析数据库中数据获取的方法为通过任务计划定期调用后台程序,从数据来源库中提取预先设计好的统计数据或明细数据,并将其写入学生上网行为分析数据库。例如,按月汇总统计每个学生的上网流量、上网时间、上网费用;按月统计出口设备上应用协议流量分布,抽取夜间玩游戏的用户上网清单;按学期、年度和学年分别统计上网流量Top 400的学生上网汇总数据及学生清单;按学期节点抽取学生的学习成绩数据、网络教学平台使用日志数据等。

图1 学生上网行为分析系统架构

校园网上网数据分析系统基于Java语言进行开发,可根据提供的多个查询条件进行组合查询,并将查询结果以图表方式展示,还可将查询的结果导出到excel表中,以进一步进行线下分析。目前本系统正在不断丰富统计数据及其查询功能。

校园网上网数据分析系统的统计数据既可从总体上把握现阶段大学生群体上网的特点,也可进行特殊学生群体之间,或其与全校学生之间上网的对比分析,以及大学生上网与学业成绩之间的关联分析。此外,系统可自动检索并将因过量上网而影响到学业成绩的特殊学生信息反馈到教学管理部门,从而发挥校园信息化助力学校管理和人才培养的作用。

现阶段大学生总体上网特点

基于校园网上网数据分析系统,分析目前大学生总体的上网特点。

学生上网方式

图2 有线和无线上网终端数量比较

图2为中国农业大学校园网一个月内有线和无线上网终端数量的对比情况,目前无线上网终端的数量约为有线上网终端数量的3.5倍。这是大部分学生公寓楼尚未部署校园无线的统计结果,可以预见,如果全部学生宿舍均已覆盖校园无线,则二者的比例差距将会进一步扩大。数据表明,移动互联技术的迅速发展导致大学生的上网方式已随之发生了重大改变,目前校园网中学生每天使用无线终端上网的数量已经远超有线终端数量。因此,建设高性能、稳定的校园无线网,满足学生在校内主要区域能随时随地使用无线终端设备方便、快速的访问校园网和互联网资源,应成为近期校园基础网络建设的重点项目。

学生上网Top流量应用

图3给出了2017年12月校园网上网Top流量应用的排名。数据表明,近几年校园网的Top流量应用绝大部分是主流视频观看或下载等要求高带宽、低延迟的应用,此种现象目前在各个高校校园网中均普遍存在。大学生作为网络和新媒体使用的主力军,对大带宽的需求尤为明显,包括使用在线视频学习、在线娱乐、在线即时通讯等,从而对校园网出口带宽造成极大冲击。为给校园师生提供良好的上网服务,近几年来各个高校均在大幅扩容校园网的出口带宽。

图3 学生上网流量Top应用

图4为2017年12月校园网移动应用的Top流量统计情况,可见学生主要使用手机,其次才是使用iPad等平板电脑移动上网;此外,学生移动上网主要用于学习和生活需求(查询资料、邮箱、打车、网盘),以及社交需求(微信、脉脉、QQ、微博)。

图4 学生移动上网流量Top应用

不同学生群体上网和学业成绩的关联分析

目前学校每年有极少数大学生因学业成绩达不到培养要求而无法取得学位。探究这些学生学业成绩不理想的原因,才能有针对性的对其进行学业辅导。为此,本文进行了不同学生群体之间上网的统计分析,以及学生上网和学生学业成绩的关联分析。

Top上网流量学生的上网统计分析

图5对2017年上网流量排名Top 400的学生及其2017年秋季的GPA成绩排名进行比较分析。

图5 流量Top 400学生成绩分布情况

2017年上网流量排名为Top 400且未毕业的本科生共计302名,其中成绩排名为专业成绩倒数20%以内的学生比例高达45.4%,成绩正数20%的学生比例仅为4.7%,二者差异显著。另有33.7%的学生成绩分布在(50%,80%]的靠后区间,而仅有16.2%的学生成绩分布于(20%,50% ]的区间。

继续分析2017年成绩排名正数和倒数Top5%学生的月均上网流量分布区间(图6)发现,成绩倒数Top5%学生中月均网络流量为高流量区间的人数比例远高于成绩Top5%的学生,体现在成绩倒数Top5%的学生中月均流量>40G的学生比例高达45.1%,而成绩Top5%的学生比例仅为7.2%。

图6 成绩排名靠前与靠后Top5%学生的月均上网流量分布对比情况

对图5和图6的数据分析得出,上网Top流量的学生中,专业成绩不理想的学生比例远高于成绩理想的学生。这些专业成绩倒数而上网流量为Top的学生有可能是因为过量上网导致学习成绩不理想,应引起学院、辅导员或班主任的重视。

预警学生群体的上网统计分析

预警学生群体指的是不及格课程门数超过一定数量的学生。在教学管理中将学生的预警级别分为红色、橙色和黄色预警,其不及格课程门数分别定义为:大于5门、4~5门和2~3门。

预警学生的类别大体又可分为:民族生、特殊招生(体育特招、艺术特长、留学生)、双培生、预科转入学生、正常统招学生等;而预警学生的身份还可从不同年级、不同性别、不同省份、不同学院等进行细分。本文仅侧重于不同预警级别学生之间、及其与全体本科生的上网流量对比分析。

本文给出了两个时间节点的数据分析,2017年春季的预警分析和2018年春季的预警分析。

1.2017年春季学习预警学生的上网统计分析

2017年春季学习预警分析基于如下数据集进行: 2017春预警学生、 2017年3月学生成绩、2016年度学生上网流量。

(1)预警学生成绩排名情况

2017年春季预警学生的成绩排名情况为389名学生的成绩排名区间处于(90%,100%]的区间,约占预警学生总人数的76.1%(红色、橙色和黄色预警人数分别占同类预警级别人数的92.7%、82.2%和65.6%);其次,约84名学生的成绩排名区间处于(80%,90%]的区间,约占预警学生人数的16.4%(红色、橙色和黄色预警人数分别占同类预警级别人数的6.6%、15.8%和21.6%)。

(2)上网流量Top 400本科生中预警学生分布

图7 2016年度上网流量Top 400本科生中包含的预警学生人数分布

图7对上网流量Top 400本科生中预警学生分布情况进行分析,2016年度上网流量Top 400的本科学生中,有81人在2017春被学业预警,占2016年度本科学生上网流量Top 400的20.3%。在这81人中,红色、橙色和黄色预警的学生人数及比例分别为(36,44.4%)、(13,16.1%)和(32,39.5%),其又分别占红色、橙色和黄色预警总人数的26.3%、12.9%和11.7%。统计结果表明学业预警学生中确实有较多学生存在过度上网问题。

(3)学业预警学生与全校学生的上网横向比较

再将2017春预警学生与全校本科生在2016年度的人均上网流量进行横向对比(如图8所示)。

从整体统计,2016年度全校本科生的人均年上网流量为183.4G,但2017年春红色、橙色和黄色预警学生则分别达到了438.0G、336.3G和318.0G,分别为全校学生人均年上网流量的2.4、1.8和1.7倍。从个体统计,预警学生中约有58.7%(全校则仅约有32.8%)的人数比例超过全校学生人均年上网流量。图8可看出学业预警学生人均上网流量远高于全校学生的平均水平,进一步说明学生成绩不佳与过度上网之间存在明显的相关关系。

2.2018年春季学习预警学生的上网统计分析

考虑到学业预警学生中有部分学生本来学习基础较弱(例如体育特招、艺术特招、民族生、预科班转入学生、留学生等),但正常考分入学(统招生)的学生则不存在此类问题。对统招入学但被学业预警的这部分学生而言,其上网情况到底如何?是否有新的特点?为了解以上情况,表1分析了2018年春季成绩预警学生与其在2017年秋季的上网情况。

表1数据表明:

(1)从整体统计,2018秋全校本科生的人均上网流量为132.3G,但红色、橙色和黄色预警学生则分别达到了308.3G、225.5G和190.8G,分别为全校本科生人均流量的2.3、1.7和1.4倍;从个体统计,预警学生中约有60.0%的人数比例超过全校学生人均年上网流量(红色、橙色和黄色预警的比例依次为70.2%、62.1%和56.0%),而全校学生中则仅约有36.7%的人数比例超过。

(2)统招入学的预警学生中,无论是人均上网流量还是超过全校学生人均流量的比例均高于同级别的预警学生数值,红色预警的统招学生尤其明显,其人均上网流量高达357.9G,是红色预警学生的1.2倍,是全校的2.7倍,且超过全校本科生人均流量的比例相比红色预警学生提高了5个百分点(75.7% vs 70.2%)。这说明被学业预警的统招生中,过度上网现象更为严重,这也可能是导致其成绩不理想的一个重要因素。

图8 2017春预警学生与全校本科生的上网流量对比

表1 2018春预警学生与全校本科生的上网流量对比

(3)2017春和2018春预警学生的上网统计分析结果很接近,均能说明有相当比例的学业预警学生存在过度上网的问题,且预警级别越高,过度上网情况越严重,约1/5的红色预警学生以及约1/8的橙色预警学生进入流量Top 400学生的排名清单。

学霸/学习困难学生群体的上网统计分析

本文将学习困难学生定义为:专业成绩排名倒数第一、倒数第二的学生;学霸学生定义为:专业成绩排名第一、第二的学生。本小节基于2018年4月的学生成绩和2017年度上网流量数据进行统计分析。

1.学霸/学习困难学生与全校本科生的上网对比

表2给出了学霸、学习困难和全校本科生的上网流量对比明细。专业第一、专业第二的学霸们的上网流量接近,均稍低于全校学生平均水平,二者超过全校本科生人均年上网流量人数比例均接近25%;而专业倒数第一、倒数第二的学习困难学生,其上网流量不仅远高于全校平均水平(约为2倍),且超过全校本科生人均流量的人数比例则激增到了60%以上。

2.学霸/学习困难学生在Top 400大流量本科生中的分布

图9给出了2017年度Top 400大流量本科生中所包含的学霸/学习困难学生的分布情况。其中,学霸学生4人(专业第一、第二各2人),占学霸学生的0.8%;学习困难学生67人(专业倒数第一、第二分别为39和28人),占学习困难学生的14.0%,学霸和学习困难学生中包含的Top 400流量人数及比例差异显著。

表2 2018春季学霸/学习困难/全校本科生的上网流量对比明细

图9 上网流量Top 400中学霸/学习困难学生分布

3.学霸/学习困难学生的月均流量区间人数分布

图10为学霸及学习困难学生的月均上网流量区间分布情况,学霸学生的月均上网流量大部分集中于30G以内(82.3%),(30G ,50G]区间有14.1%的分布,但超过50G的人数寥寥无几(3.5%)。学习困难学生在30G以内虽然人数也较多(45.6%),但远低于学霸相同区间的人数比例,在(30G,50G]流量区间为31.3%,在(40G,50G]区间达到了20.4%,在超过50G的大流量区间中,学习困难学生人数比例则远超学霸学生(23.0% vs 3.5%),此与前面部分分析结果类似。

图10 学霸/学习困难学生月均上网流量人数分布

通过校园网上网数据分析系统对学生上网行为进行分析,得出以下结论。

1.移动互联已成为上网新趋势。学生移动上网主要用于生活学习需求以及社交需求,建设稳定、可靠、全覆盖的校园无线网络非常有必要。

2.大学生上网流量大、善于运用网络新媒体获取新闻信息,上网目的呈现多样化、视频化的特点,这势必对校园网出口带宽造成极大冲击。如何通过技术手段平衡出口不断增长的大带宽需求与有限的实际带宽之间的矛盾,实行精细化带宽管理,及时掌握学生上网态势,应成为新时期校园网管理的一个重点工作。

3.大部分大学生能够处理好网络与学习生活的关系,其网络态度总体呈现良好发展态势,但也有少量学生过度沉迷于网络。对学业预警、学霸和学习困难等不同学生群体的上网统计分析均表明了成绩不佳与过度上网之间存在明显的相关关系。尤其是学业预警级别越高,成绩排名越靠后,Top大流量的学生越多,其人均上网流量也远高于学校学生平均水平的现象应引起教学管理部门足够的重视。

校园网上网数据分析系统,既可分析全校学生的总体上网特点,为校园网管理决策提供基础数据,又可追踪特殊学生的上网情况,以便教学管理部门能及时对其进行学业指导,很好体现了校园网络大数据分析助力教学管理的指导思想。

猜你喜欢

成绩排名全校校园网
知其师则知其学:多维成绩评定方式的迫切性与必要性
合伙教育,家校共育——在考试后全校家长会上的广播讲话
数字化校园网建设及运行的几点思考
本科生成绩排名计算方法的研究
中超联赛职业足球俱乐部赛季初的资金投入和比赛表现与赛季末成绩排名的相关性研究
试论最大匹配算法在校园网信息提取中的应用
基于VRRP和MSTP协议实现校园网高可靠性
开会
NAT技术在校园网中的应用
学生成绩排名还是继续公布为好