APP下载

教学数据可视分析方法研究与实践

2021-04-06赵金晖程学林张圣扬尹天鹤

计算机技术与发展 2021年3期
关键词:功能模块数据仓库考勤

赵金晖,程学林,张圣扬,张 微,尹天鹤

(1.浙江大学 软件学院,浙江 宁波 315100;2.宁波数联软件有限公司,浙江 宁波 315100;3.宁波工程学院,浙江 宁波 315100)

0 引 言

近年来,各类在各级教育中的信息均取得了丰硕的成果,基础教育,职业教育,高等教育和继续教育与自己的需求相结合的领域,都出现了扩大资源的覆盖面,促进教育公平和提高教育教学质量等的利用信息技术的典型应用,教育信息化带动作用日益凸显[1]。

目前,云计算、大数据、物联网等新兴技术正广泛应用于各行业,信息社会作为一个整体的程度不断加深。同样,互联网思维在传统教育行业中的实践方兴未艾,教育行政部门和学校都积极推进教育信息化改革[2]。

教育信息化在各个阶段的表现包括但不限于多媒体教学、家校互动以及教学教务线上化、覆盖教学测评的题库组卷和阅卷系统、丰富的线上教学资源。教育信息化水平日渐提高,但测试仍然是重要的学业评价和控制手段[3-4]。教育信息化不仅包括教学活动信息化,还包括校园生活管理系统,丰富的校园生活数据是优化教务教学管理决策重要的参考,如围绕校一卡通收集的消费、考勤等行为数据。

在信息化进程中,不仅要建设与安全并重,在注重硬件与软件协同发展的同时,还要重视数据采集和维护管理。数据是教育信息化中科学决策、精细管理、即时分析的基础。然而粗放式数据管理普遍存在,标准化的数据流程势在必行,最终实现数据的有序开放与共享[5-6]。

另一方面在新高考政策下,高考从标配走向自选,从选课到教学的多个环节对信息化需求日益旺盛。学生如何选课、学校如何开设课程、教学如何考核、学业水平如何分析等成为学校和教育信息化企业关注的焦点。其本质是满足教学的个性化需求[7]。

该文以宁波市某中学教学数据应用为场景,基于该学校采集和存储的学生个人信息、考试成绩、校园一卡通等丰富的校园数据,结合数据可视分析和数据仓库的理论方法,探索面向学生、校园的数据分析体系,设计并形成可视化数据分析门户,为教学数据可视分析提供敏捷方案,从而更好地服务精细化教学管理工作[8]。

1 关键技术

教学数据可视分析的实施以学校原有系统正常运行为基础。教学数据可视分析系统的数据架构则关注数据上云和数据仓库的建设[9-11],最终数据可视化分段则通过商业智能工具,构建可视分析门户[12-13],并结合具体教学数据分析模型,展示教学数据的可视分析结果[14]。该方案采用的整体数据处理架构如图1所示。

图1 数据架构

教学数据源,通常是分布在不同的教务系统和数据库中,为了便于从多源异构的数据源中抽取、转换、加载数据,保证数据采集过程规范化和文档化,该文提供了专门的ETL过程解决方案,可以实现数据上云过程的文档化和自动化。

数据仓库是系统的数据中心,也是数据源和商业智能间的数据中转站。借鉴企业信息化工厂体系,在关系型数据库上建立数据仓库和数据集市,数据集市中的数据直接供给商业智能工具。数据源到数据仓库,数据仓库到数据集市的ETL过程承载了计算的负荷,从而加速商业智能响应。商业智能工具直接从数据量较小的数据集市调用数据,数据检索的负荷低,响应快。

图2是分析学生成绩数据建立的ER模型,其中测验实体是该ER模型的核心,一个班级进行的一场考试就是一场测验,也可以涵盖少数群体的考试。一次考核包括多科目的测验。ER模型还涉及学生班级年级间的隶属关系、班主任和班级间的对应关系、任课教师和班级间的对应关系。

图2 数据仓库ER建模

图3则是在图2的基础上,面向成绩主题分析建立的星型模型,其中的实体表和联系表派生于ER模型。成绩单事实表为成绩单联系表(即学生-测试联系表)。事实表与学生、教师、日期、考试等维度表进行关联,并通过ETL进行数据的聚合。

图3 数据仓库星型模式建模

2 实现方案

2.1 指标体系

教学数据可视分析系统面向全体在校师生,基本的数据分析需求可以简单地划分为学生域数据分析和群体域数据分析,从多个维度对数据进行描述性统计分析,将积淀的数据以直观的方式呈现出来。校园师生通过登录教学数据可视分析系统可以获取自身相关的历史或截面数据。客观数字图表有助于掌握教学现状,辅助教学计划调整。该文更进一步地探索了人工智能在学习分析中的应用,满足学生成绩预警的需求。

图4和图5从学生域和群体域分别展示了在分析学生成绩和消费、考勤的过程中采用的数据指标。

图4 部分成绩可视分析数据指标

学生域数据分析跟踪各个科目历史考试成绩,明确学生当前学科成绩分布特点以及未来成绩趋势,为学业干预提供主要基本输入。监控学生校园消费,汇总按月、按周、按日统计消费额度和频数,为消费异常预警提供输入。分类汇总学生考勤信息,作为学业干预的辅助信息输入。

群体域数据分析则从年级、班级、科目等维度跟踪并汇总历史考试成绩、校园消费、考勤记录、选课信息。群体域数据分析跟踪了群体指标数据的历史变化趋势,探索了群体指标数据的分布。

其中学生成绩包括原始分、Z标准分和T标准分。原始分即考生卷面实际分值。单个原始分既无法直接呈现接收相同测评的考生间的差异,也无法体现同一考生在不同测评中的表现差异。Z标准分和T标准分通过式(1)和式(2)计算得到。

(1)

T=50+10×Z

(2)

学生在高考时除语文、数学、外语三门为必考科目外,考生要从思想政治、历史、地理、物理、化学、生物、技术七门选考科目中,选择三门作为选考科目。所以群体域数据分析需包括对选课信息的跟踪和汇总,为教学资源的合理调配和开课形式的多样化提供参考。群体域分析结合学生域分析,共同辅助在校师生合理制定和调整学习计划。

2.2 功能设计

该文提出的方案在不影响原有系统的基础上,实施教学数据可视分析系统的搭建,系统面向全体师生和教务部门。教务部门拥有系统访问的最高权限,系统服务教务部门进行学习分析和教学资源调配,优化教学管理活动。教师可分为任课教师和班主任,班主任可访问所带班级数据和班级学生数据,任课教师可访问所带学生成绩相关数据。学生可访问自身历史数据,及时调整学习计划和校园生活。

图6展示了该系统包括的十大模块。学生、教师、班级和学校画像实现了基本数据分析需求中学生域数据的可视化展示,各校原系统数据面向全校师生,充分可达。系统以可观的数字和直观的图表自动跟踪学生成绩、消费、考勤数据的描述性统计指标。

图6 教学数据可视分析系统功能设计

学生对比分析和班级对比分析功能模块为教务部门和教师提供了快速定位学生或班级的有效手段,实现优势互补,促进学生、班级共同进步。

选课分析功能模块、消费分析功能模块、考勤分析功能模块、成绩预测功能模块在画像功能模块的基础上,更深入地探索数据。

选课分析功能模块包括选课组合占比分析、选课关联分析、选课组合竞争分析。其中选课组合占比分析和选课关联分析共同辅助教师资源调配、课程开课形式多样化以及科目教学合作。选课组合竞争分析功能,发掘各选课组合竞争激烈程度,呈现各水平学生在的选课偏好,为学生制定学习计划提供参考。

消费分析功能模块和考勤分析功能模块都提供了预警功能,及时发现异常消费或考勤行为,辅助教学管理活动。其中消费分析功能模块直观呈现消费频数、额度分布,辅助定位贫困生,结合学生画像、考勤分析和对比分析,实现更精准的帮扶。

成绩预测功能模块则是人工智能技术在教学管理领域的探索。

成绩预测功能模块为了体现学生成绩在一定范围内波动的合理性[15-16],将学生成绩划分为不同的等第,对数据进行离散化的处理。

可用于预测学生考试成绩的特征包括成绩历史属性、学生自身属性、消费考勤数据等等。成绩历史属性又可以取最近多场次成绩指标、最近多场次成绩指标环比变化等。学生自身属性则包括年龄、性别、家庭状况等。学生近期消费频次、消费额度、考勤状况等则可以作为可能影响学生成绩的校园生活数据特征。

决策树作为分类算法具有良好的解释性,选择信息增益算法自上而下构建决策树,来选择对成绩预测有显著影响的特征。D表示训练集,A表示可能用于预测成绩的特征,n表示划分的成绩等第类别数,m表示当前节点子节点数量即特征A的可能情形数。H(D)经验熵表示当前节点的混乱程度,H(D,A)条件经验熵表示根据A特征构建的子节点总体混乱程度,g(D,A)信息增益表示A特征的影响是否显著。每次取信息增益最大的特征构建子节点。经验熵或信息增益为零不再构建子节点。经验熵、条件经验熵和信息增益分别按式(3)~式(5)计算得到。

获取显著特征后,输入特征到神经网络进行成绩预测。和传统的机器学习方法相比,神经网络具有拟合任意函数的能力。神经网络能够在模型训练过程中学习到特征组合到结果的映射,不仅仅是各个特征单独或少数特征组合对预测结果作用能被体现,特征间潜在的联系对预测结果的作用也能被神经网络学习到。

(3)

(4)

g(D,A)=H(D)-H(D,A)

(5)

3 实现结果

可视分析部分采用Quick BI进行实现,限制篇幅,下面仅展示以学生为主题实现的可视分析结果页面。

图7展示了学生画像的部分内容。在该界面,左侧展示的是学生基本信息,右侧以词云的方式展示了该学生的标签信息。标签信息根据学生历史成绩、消费、考勤数据进行自动计算产生。

图7 学生画像

图8展示了学生某次考试的各门学科成绩,包括总分、班级排名、年级排名。还展示了近五次考试总分变化趋势。

图8 学生成绩分析

图9展示了学生月消费额和平均消费额趋势,近8个月总消费额,近5天消费趋势。

图9 学生消费分析

4 结束语

以宁波市某中学为研究案例,通过挖掘学校数据可视分析需求,制定学生域和群体域数据分析指标和相应的可视化方案,进行了功能模块和技术框架设计,探索了人工智能在教学管理中的应用,最后通过商业智能分析工具进行了可视分析实现。整个实施过程,应用了云计算、ETL过程、数据仓库等多种技术,提高了校园教学数据管理化水平,推动了智慧校园的建设。

猜你喜欢

功能模块数据仓库考勤
国有企业考勤管理的问题和对策探究
基于数据仓库的数据倾斜解决方案研究
三级甲等医院应用PDCA循环提升考勤管理的创新
商业模式是新媒体的核心
数据仓库系统设计与实现
基于ASP.NET标准的采购管理系统研究
基于校园卡的学生考勤系统研究
高校二手交易网络平台功能及技术框架分析与设计
数据复用在存储数据仓库中的运用
木卫四:挣扎吧!在考勤夹缝终生存的汉子们!