基于学生综合素质评价的行为画像系统的构建与实现
2021-08-31涂旭东蒲飞赵正辉陈苗
涂旭东,蒲飞,赵正辉,陈苗
(重庆医药高等专科学校,重庆,401331)
0 引言
《国家教育事业发展“十三五”规划》中指出要建立科学评价体系,充分发挥教育评价对科学育人的导向作用,构建科学的职业教育评价制度,将学习者职业道德、技术技能水平和就业创业能力作为评价的主要内容,改进高校人才培养质量评价。随着5G,大数据,人工智能和区块链等新技术的飞速发展,新一代信息技术正在对教育行业产生深远的影响,学生的生活习惯和学习方式发生了明显变革,尤其是新冠疫情期间信息技术在教育教学方面更是发挥了巨大作用[1]。当前大数据技术为学生综合素质评价提供了新的思路和方法,将学生的评价数据拓展到了课堂内外,非正式的学习环境、学习活动和生活表现,能更真实地反应学生的综合素质。利用学生在校期间产生的校园大数据,通过数据挖掘手段和预测技术,有效地对学生的综合素质进行评定,是当前亟待解决的问题[2]。
1 学生综合行为画像构建
学生行为画像的本质是利用学生在校期间通过消费,学习和参加活动等行为产生的各种结构化和非结构化数据,描述学生或者群体的过程,通常是使用标签或者短语的形式来反映学生的个体特征,比如“学霸”,“喜欢晚归”或“不爱吃早餐”等等。群体画像则是指通过构建学生群体的集合来反映学生群体的总体特征,比如“先进班级”。
图1 学生行为画像构建的步骤
对学生进行综合行为画像分析,可以从多角度精准了解学生在校的生活状态。任课老师根据班级综合行为画像信息及时调整教学方法和改进教学方式。辅导员或者班主任可以借助学业预警和不在校预警信息,及时跟踪学生的在校状态和学习情况。学生本人可以利用画像信息,及时修完相应的学分,调整自己的生活习惯和作息,改善自己的学业情况[3,4]。本文接下来从数据采集,数据预处理,数据标签化三方面,介绍如何构建学生的综合行为画像系统。
1.1 数据的采集
通过智慧校园平台采集校园网络认证系统,一卡通系统,教务管理系统、图书借阅系统、学工系统、网络教学平台、超星学习通平台、门禁系统,实习实训系统,虚拟仿真系统,第二课堂活动系统等11个系统中的学生行为数据。
1.2 数据的预处理
(1)摸清家底。经过详细盘点,上述11个系统中涉及有学生基本信息和行为数据,其中基本信息包括姓名,性别,民族,有效联系电话,年龄,班级,专业,学院,课程成绩。行为数据主要包括学生在校期间食堂、校医院就医、水卡和超市的刷卡记录、图书借阅记录、校园有线和无线网络的认证记录、宿舍和图书馆的门禁记录、课程学习记录、第二课堂活动、学生党建和团建、实习实训等产生的各类数据。
(2)落地标准。不同系统之间相同字段的数据编码不统一,导致无法进行正常的数据交换。需要按照从国标、省标到校标的优先级顺序,在最大程度满足上一级数据编码标准的基础上,建立一套适合学校的统一的数据编码标准和体系,是保证各系统之间的数据能够进行正常交换和分析的前提和基础。
(3)搭建平台。针对数据存在缺失值,重复值和数据编码标准不统一等情况,搭建数据治理平台和数据质量管理平台,完善元数据和主数据的管理,对主数据进行必要的清洗和转换。部分数据系统无法处理时就需要人工干预和处理。在系统梳理学校数据编码标准的基础上,最终建成校园数据的原始库、标准库和中心库。
(4)明确职责。迎新系统、学工系统、教务系统都有学生的基本信息数据,到底哪一个系统才是学生基本信息的唯一来源?在此要明确数据产生的源头部门和数据责任的权威部门,落实数据的管理职责。与此同时,数据的管理责任要精确落实到每个系统中具体模块对应的管理员,最终实现数据的常态化治理和全生命周期管理。
(5)共享交换。通过建设数据共享交换平台,实现各系统之间数据的互联互通和共享,包括目录服务、服务交换和平台管理等,最终实现各类数据资源和共享资源目录的统一管理。
1.3 数据的标签化
数据的标签化是指从学生的校园行为数据中抽取相关的行为变量或者指标,对其进行数据分析和处理之后,通过使用短语的形式为其贴上“标签”的过程。标签分为静态特征标签和动态特征标签,其中静态特征标签主要包括学生的个人基本信息和荣誉奖惩;动态特征标签主要包括学生的社交关系、体育情况、德育综合素质、消费水平、学习水平和三餐规律等。
(1)个人信息。主要包括学生的学号,姓名,性别、专业和班级等基本信息
(2)荣誉奖惩。主要包括学生在校期间获得的比赛、征文获奖、荣誉证书和惩罚等。
(3)社交关系。通过利用宿舍或图书馆门禁,一卡通消费,和网络的接入点等数据产生的时间,判断学生校园期间行为轨迹的相似性,分析两个或多个学生在短时间内共同出现在同一地点的频率。另外还可以通过学生的专业,民族,来源地,性别等信息,挖掘出学生的个性化社交需求。进一步通过社团发现算法识别出学生的社区群体,进而从这些社区群体中找出社交孤独的学生,加以重点关注。
(4)体育情况。通过分析学生的体育课成绩和体质测试成绩(由坐位体前屈、50米、跳远、仰卧起坐、800米、个人总分和同年级平均分),并与同年级平均分进行对比,来对体育情况进行评价
(5)德育综合素质。通过辅导员的德育综合素质评分数据和学生参加的第二课堂得分情况对学生进行评价。
(6)消费水平。通过一卡通数据分析学生每月的消费金额,与全校所有学生、以及全校相同性别的所有学生每月消费平均值进行对比,同时,结合消费场所(食堂、洗澡、水果店、校医院、超市、其他),消费结构(小吃,米饭,面食,饮料),消费地点(一食堂,二食堂,...)等数据综合判定学生的消费水平情况。
(7)学习水平。利用学生个人课程成绩的平均值、所在专业所有学生课程成绩的平均值、专业排名情况、课程准点、已修学分和逃课情况,综合判定学生的学习水平情况。
(8)三餐规律。通过一卡通数据分析学生的就餐时间和金额,将学生个人就餐时间与所在专业学生总体的就餐时间进行对比,判断三餐就餐是否规律,并将三餐就餐规律分为五个等次(不规律、 较不规律、一般、较规律和很规律)。同时统计学生近半年每月的三餐消费金额,并与全校所有学生(校平均值)、以及全校相同性别的所有学生(男生校平均)每月三餐消费的平均值进行对比,判断学生的三餐消费金额趋势。
图2 某学生的综合行为画像
2 学生行为画像系统
如图2所示,为某学生的综合行为画像,此学生的综合特征为:男生,获得过“我和我的祖国征文比赛”二等奖、道德素质较高,社交圈子较广、是一个月消费中等,三餐就餐规律的学霸兼体育达人。
3 结论
本文利用学生在校期间产生的校园数据进行预处理和分析,通过数据标签化实现了社交关系画像、身体素质画像、德育素质画像、消费画像、学习画像、三餐画像等画像系统。对学生进行综合行为画像分析,能精准分析学生在校的行为习惯和学习特点,能不断提升高等职业教育人才的综合素质评价方法的科学性和准确性,有效解决医药职业类人才培养的综合评定问题,为构建高等职业教育的人才培养模式,完善人才培养质量提供重要参考。