APP下载

基于IPv6 的大学生学业预警系统架构研究与设计

2019-02-27聂国平罗汉云

中国教育网络 2019年1期
关键词:预警系统学业界面

文/聂国平 罗汉云

为了拥有一个更加安全、可靠的网络环境,传统网络架构的优化和调整工作势在必行。加之IPv4 地址随着使用人数的增加而变得越来越少[1]……为了解决这些问题,一些新兴技术如雨后春笋般迅速发展壮大,像NAT444、隧道技术以及IPv4/IPv6 双栈协议等等。目前,成熟且在投入使用的技术是NAT44 技术,作为IPv6 过渡技术的IPv4/IPv6 双栈协议以及隧道技术尚处于试运行阶段。为了推进IPv6 技术的发展,各高校都在为丰富IPv6 的网络资源而努力。大学生学业预警系统正是安庆师范大学在IPv4/IPv6 双栈模式的网络环境下开发的。这篇文章主要分为IPv6 技术的现状、系统需求分析、系统研究对象和方法、系统平台的设计和维护、系统中的关键技术,系统升级与优化六大部分。

IPv6 技术的现状

国内现状

在中国,广泛应用于商业的是IPv4 地址资源,所投入使用的主要技术是NAT44技术。IPv4/IPv6 双栈协议和隧道技术等[3]IPv6 过渡技术仍然处于研究阶段,主要用于一些科研机构。为了加快推进IPv6 发展,各高校已经开始在学校的网络基础设施中部署IPv4/IPv6双栈协议和隧道技术;同时,《推进互联网协议第六版(IPv6)规模部署行动计划》也在加紧进行当中。

国外现状

美国和欧洲国家在IPv6 部署方面处于领先的状态。美国互联网用户的IPv6 使用率达到22%,超过五家美国电信运营商的IPv6 使用率平均超过40%。印度的IPv6 部署率达到17%,已经超过日本成为亚洲第一。日本的三大运营商在2017 年内开启全面IPv6 服务。美国、欧洲国家的网络向IPv6 升级,是国家级战略部署,并得到坚决执行。因此美国、欧洲国家的IPv6 部署率一直在快速增加,各家电信运营商、教育机构、政府机构,ICP 服务商的网络都在积极向IPv4/IPv6 双栈、甚至向IPv6-only 演进[4]。

总而言之,全世界各个国家都清醒认识到:IPv6 不仅仅是互联网发展的一个趋势,更是未来的必然选择。

系统需求分析

价值需求分析

作为师范类高校,安庆师范大学一直关注着本科教育体制机制的改革,着力研究提高本科教学质量的方案。研究大学生网络行为对自身学业的影响便是我们的重要课题之一。众所周知,对于学生,网络在使用过程中利弊共存[5],在提供相关网络资源和不同于传统学习渠道的同时也会干扰学生的正常学习、影响学业。那么,学生网络行为到底与学业之间存在着怎样的关联?如果能找到学生网络行为与学业之间的某些细微的关联,就能够通过对学生网络行为的观察及时进行相应预警,做到防患于未然。此次的课题正是在IPv4/IPv6 双栈协议的网络环境,通过对数据挖掘与分析技术的深入学习来研究学生的海量网络行为数据并开发出大学生学业预警系统的一个过程。

大学生学业预警系统的开发不仅仅是为了丰富IPv6 的网络资源,它还承载着教育价值。基于该特性,系统设计过程中注重教育管理者与学生之间的双向交互性。即管理者线上获取学生日常网络行为数据,线下制定相应策略对学生进行良性引导。这种方式同样符合未来本科教育的要求。

功能需求分析

学业预警系统从根本上解决了网络行为审计系统和认证计费系统的数据无法直接使用的问题。通过该系统,我们可以利用研究对象的网络行为数据,管理员用户不仅能够清楚地看到处理分析过后的学生网络行为数据,而且能够通过对学生网络行为统计数据的观察进行教学方面的决策,针对学生学业状况提出合理的建议;甚至配合校学生管理处,对学生的学习、生活等方面出台相关的规定和政策。该系统的整体模型如图1 所示。

系统研究对象和方法

对象

学校教务管理系统中获取到的2015年、2016 年,2017 年的学生补考名单和获得国家励志奖学金、国家奖学金的学生名单真实可靠。

根据学生名单,利用接口工具从审计系统和认证计费系统中导出的他们对应的网络行为数据客观存在。

图1 大学生学业预警系统平台模型

方法

为了使学生网络行为所反映的问题更具有代表性,本文研究了获得奖学金学生以及补考学生的上网行为。将学生拿奖学金还是补考作为因变量,将学生各上网行为数据作为自变量建立函数关系。由于因变量为虚拟变量,所以本文建立二分类Logistic 回归函数。利用2017 年的学生网络行为样本数据建立函数模型,通过2015 年和2016 年的学生网络行为和学业情况的样本数据进行验证。通过大量的学生样本数据利用SPSS 来建立二元Logistic回归函数。结果如下:

其中p 表示学生获得奖学金的概率。变量x1、x2、x3表示的是对学业有影响的网络行为数据变量,C 表示影响因素。

利用2015 年和2016 年的补考学生和获奖学生的网络行为数据对该公式进行验证,通过获得奖学金概率p 来进行反馈,当获得奖学金概率介于0~0.5 之间时,说明学生学习状态较差;若获得奖学金概率在0.5~1 之间,说明学生学习状态良好。p 值越大时意味着获得奖学金概率越大,表明学生学习情况越好;p 值越小时意味着学生挂科概率越大,表明学生学习情况越差,最后将p 值所反映情况与原情况相对照。由于本文对研究对象是否获取奖学金的情况是已知的,所以通过两者对比就可以验证预警系统的准确性。在模型建立高度精确的情况下,将学生上网行为数据代入便可预测还未发生的情况。如2018 年,学期进行了一半,此时可以通过对学生的网络行为数据的观察,利用预警系统进行预警。其功能的简单层级数据流如图2、3 所示。

图2 为学业预警模块的数据流

图3 后台处理模块的数据流

系统平台设计与维护

平台设计

以网站为媒介的大学生学业预警系统界面简洁、美观。能够给管理员用户带来一种视觉上的舒适感,方便其更好地了解学生信息。网站的语言选择简体中文,整体结构为垂直型网站结构。管理员用户通过分配的账号和口令即可登录预警系统。进入系统后可看见导航区域分布在整个界面的上侧,通过点击上网时长、网上学习、网上娱乐、学业预警等系统功能名称即可跳转到相应界面,完成不同功能的操作。本系统的流程如图4 所示。

功能介绍

图4 学业预警系统的逻辑流程

预警系统的界面主要分登录界面和主功能界面。登录界面作为区分普通用户、教师管理员用户和数据库管理员用户权限的界面,只有管理员用户通过分配的账号和口令才能够进入相关主功能界面。主功能界面是供教师管理员用户操作的界面。其中,除预警系统功能以外,其他功能提供的是数据库相应数据的查询、插入服务,而学业预警功能为主要服务,在该功能的子界面中教师管理员用户可通过输入学生对应的网络行为数据变量,点击检测按钮后后台经过对算法的调度会计算出一个介于0~1 之间的值,该值会配合相应的饼状图在界面呈现,此时教师管理员用户即可根据页面的呈现情况对该学生网络行为进行分析。此外,系统当中还有一个数据库管理员用户,其主要负责对数据库的相关数据进行维护操作。系统会为数据库管理员用户提供不同于教师管理员用户的操作接口。本系统的用户及其权限情况见表1。

表1 系统目标用户及相应操作权限

维护

对服务器软件环境和硬件环境的维护。对可能出现的问题进行评估,制定响应时间[6]。安排专门的技术人员定期检查服务器周围的环境。

对数据库进行维护。有效地利用数据是网站维护的重要内容,因此数据库的维护要受到重视。对数据库的维护工作主要包括对数据规模的维护、进行数据备份等等。

对网页相关内容进行更新和调整,定期更新首页的相关新闻动态信息等。

制定相关网站维护的规定,将网站维护制度化、规范化。

与系统相关的技术

Eclipse Jee Oxygen

大学生学业预警系统平台使用Eclipse Jee Oxygen 进行开发。通过IDE(集成开发环境)手动搭建SSM 框架(Spring、SpringMVC、MyBatis)。SSM 框架作为当下主流的开发框架,具有很好的稳定性和安全性,适用于这种基于数据库的网站系统的开发。系统前台使用JSP、HTML、CSS、JavaScript 等技术实现管理员用户与大学生学业预警系统之间的交互。过程中注重CSS 的各种样式、特效以及div布局与现在的主流浏览器的兼容情况,利用editplus 文本编辑器编辑相关的代码,使用火狐浏览器进行调试。对于完成html+css+js 相关代码的过程当中,利用具有所见即所得特性的Dreamweav 软件作为美工和相关查询手册。确保系统平台能够在面向专业的Web 开发用户(开发人员的浏览器多数为谷歌浏览器、火狐浏览器)和普通用户(普通用户多数使用IE 浏览器、360 浏览器)时,都能够正常显示。后台使用基于Java 面向对象编程语言进行业务逻辑的控制,Java 作为一种强类型的面向对象语言,可以更好地防止XSS(跨站脚本攻击)和SQL 注入等安全隐患[7]。

MySQL

大学生学业预警系统使用MySQL 数据库管理系统来存储研究对象的网络行为数据,使用视图化操作软件Navicat for MySQL 对数据系统进行管理。

MySQL 作为时下比较流行的关系型数据库管理系统,被广泛应用于研究型系统平台的搭建。其开源灵活等特性不仅可以快速开发出应用型系统,而且,当系统在运行过程中出现故障时,开发人员可快速发现问题并迅速解决。

Tomcat 服务器软件

考虑到系统针对的用户是教师管理员用户和数据库管理员用户,在投入使用的过程当中并发用户并不会很多,所以系统的开发选择了Tomcat 服务器软件。

Tomcat 容器可以很好地支持和数据库有大量交互的动态Web 页面,符合学业预警系统的特性。预警系统选择的服务器软件的版本是Tomcat-7.0.85 版本,具有较高的安全性,可以很好的防止CSRF(跨站点请求伪造)。

IPv4/IPv6 双栈协议

大学生学业预警系统除了课题本身具有现实意义和价值之外,我校接入了作为IPv6 过渡技术之一的IPv4/IPv6 双栈协议是又一个有利条件。所谓双栈协议[8],是指在一台服务器上同时启用IPv4 协议栈和IPv6 协议栈[9]。终端用户通过校园网,启动DHCP 可自动获取到IPv4 协议和IPv6 协议的地址,从而通过IPv4 地址访问服务器上的IPv4 资源,通过IPv6 地址访问服务器上的IPv6 资源。

IPv6 的地址长度是IPv4 地址长度的4倍[8]。也就是说,一旦IPv6 技术真正投入使用,就可以在今后相当长的一段时间里解决IPv4 的地址资源不足等问题,满足互联网用户的各种需求。但是IPv6 技术的现状却是鲜有普通用户了解和使用过,原因在于IPv4 技术投入使用的时间过长,网络上绝大多数资源都是IPv4 资源。如果要使用IPv6 资源,就需要对网络上的IPv4 资源进行整改,这需要巨大的经费;而有些IPv4 资源正运用于现代化建设当中,整改过程中出现不稳定的状况就会对现实生产造成极大的影响。所以,IPv6 过渡技术是不二选择。

隐私数据的界定和分析

国际国内环境及定义

近几年来,关于个人隐私数据的保护已经成为国际国内的一个热门话题。对比我国的隐私数据保护的相关规范和欧盟的GDPR,我们对隐私数据有了一个清晰的认识和了解。个人隐私数据是指一旦被泄露、非法提供或滥用可能危害人身和财产安全,极易导致个人名誉、身心健康受到损害或歧视性待遇的个人敏感信息数据。本文中涉及的个人隐私数据主要包括个人身份信息(学号、姓名、性别等),学习状况信息(获奖学金、挂科)以及上网行为信息(上网时长、浏览网页的URL、邮件收发、账号登录、IP 地址、网页标题等信息)。

隐私数据收集处理的依据

本文中的学生获奖信息是学校在每学期都会在官网上发布的公开信息,互联网用户具有下载和浏览的权限;对于学生挂科信息,我们在经过学工处的授权后,由教务系统的管理员从教务系统中所获得;关于上网行为信息,我们则是从校网络行为审计系统和认证计费系统中获得,该系统是用于对内部用户连接到外部网络的行为进行检查和审计的,是符合信息安全等级保护要求的国产安全设备。我们出于学术研究的目的对网络行为数据的收集和分析在《中华人民共和国网络安全法》、《中华人民共和国个人信息保护法(专家建议稿)》、公安部151 号令《公安机关互联网安全监督检查规定》等都可以找到相关的依据和支持。

隐私数据脱敏性处理

本文对学生网络行为数据进行脱敏性处理,对敏感的关键词进行剔除及合并,且以较为宽泛的描述来呈现,并在网站系统的呈现过程中删除了学生姓名和性别等字段信息,对唯一标识学生信息的学号按照特定规则进行重组,以保证在网站系统的数据泄露时入侵者无法利用和识别网络行为的实体及其敏感信息。

网络行为数据挖掘与分析

网络行为数据挖掘

图5 校园网主干网络拓扑

从审计系统和认证计费系统中获取到的网络行为数据量庞大且繁杂,每一个获得励志奖学金的学生或者重修补考的学生需要从行为审计系统中导出他们为期半年的网络行为数据;从认证计费系统中导出他们为期一年的上网时长数据。由于认证计费系统的数据类型较为规则,所以导出过程相对顺利。对于审计系统,通过积累的导出数据的经验,我们制定了比较符合现状的导出数据方案,即根据学生网络行为的网页标题、外发信息,邮件收发和账号登录等选项,以星期为单位向外导出数据。每个学生学期的总数据量为一万条到十万条不等,借助脚本工具按照导出方案完成数据导出工作。

网络行为数据处理

对每一个研究对象的原始数据。我们经过调查与研究之后人为的将其分成了三大类,即上网时长、网上学习和网上娱乐。上网时长又细分成学习日上网时长和休息日上网时长;考虑全校学生的课表课程安排情况,将星期一至星期五的总上网时长作为学习日上网时长,将星期六至星期日的总上网时长作为双休日的上网时长。最后统计该学生在这一年总的上网时长、总的学习日上网时长,总的双休日上网时长,最后得出其年学习日上网时长所占年总上网时长的比例情况和年双休日上网时长所占年总上网时长的比例情况。对于网上娱乐,我们将其细分成游戏、影视娱乐、社交购物;对于网上学习,将其细分成文学、专业课和IT。我们通过网页搜索、网页标题、外发信息和社交购物中的相关信息来判定该记录是属于游戏、影视娱乐当中的哪一个小的类别。例如网页标题中的关键词为“首页-优酷视频”,那么我们将该记录归类到影视娱乐的类别下面。最后统计相关记录数的条数。

网络行为数据分析

通过相关变量的具体范围划分等级,确定其定序变量。针对上网时长,根据年学习日上网时长占年总上网时长的比例情况划分范围,例如面对700 个研究对象的上网时长,年学习日上网时长占年总上网时长的比例在0%~80%之间;将其划分成三个范围即0%~26%,26%~52%,52%~80%。分别对应的等级数为3、2、1。其中3 表示年学习日上网时长占年总上网时长的比例在0%~26%之间;2 表示年学习日上网时长占年总上网时长的比例在26%~52%之间;1 表示年学习日上网时长占年总上网时长的比例在52%~80%之间。同样根据网上学习和网络娱乐下的相关分类也进行等级的划分最后得到其等级值。根据相关数值化了的维度变量进行二分类多元Logistic 回归函数建立相关模型以及对模型进行优化。

通过数据挖掘与分析技术,我们将海量网络行为的原始数据经过处理后得到了建立数学模型相关数值型变量,最后通过将数值型变量代入函数模型来检验函数模型的精确性。

系统升级与优化

在后续工作过程中,我们会根据系统的使用状况对系统的功能以及对用户的友好程度进行进一步优化与升级。对于系统功能,我们考虑在原有基础上再进行拓展,包括对具体的学生用户进行展开,让他们了解自己的网络行为习惯以便于更好地对自己的上网行为进行调整。而关于具体的界面,我们可能会增加更加快捷、简单的操作方式,譬如在学业预警模块将用户输入学生网络行为数据相关变量的过程整合到后台算法当中。

本文将IPv6 技术和数据挖掘与分析技术并用到了大学生学业预警系统当中,搭建了基于IPv6 的大学生学业预警系统平台。考虑到系统的预测准确性需要海量的网络行为数据的支持,在今后的工作过程当中,课题组将继续收集新的学生网络行为数据,扩充数据库当中的网络行为数据量、更新算法,使我们的系统预测性更加精确,进一步为本科教育体制机制改革,为未来IPv6 技术的发展贡献出我们的力量。

猜你喜欢

预警系统学业界面
艰苦的学业
微重力下两相控温型储液器内气液界面仿真分析
民用飞机机载跑道入侵预警系统仿真验证
国企党委前置研究的“四个界面”
基于数据挖掘的学业预警模型构建
一种基于CNN迁移学习的井下烟、火智能感知预警系统
一种可用于潮湿界面碳纤维加固配套用底胶的研究
音乐提升学生学业表现
基于ZigBee与GPRS的输电杆塔倾斜监测预警系统
基于FANUC PICTURE的虚拟轴坐标显示界面开发方法研究