基于一站式服务平台的学生画像研究
2024-09-15王晓敏
摘要:基于数据治理的学生画像模型研究旨在通过构建精准的学生画像模型,提升数据治理水平,推动个性化教育的发展,并探索数据驱动的教育创新。提升教育质量,优化学生管理,促进教育领域的进步和发展。本文通过基于一站式服务平台的学生画像研究,从国内外学生画像的发展现状,通过对一站式服务平台和数据分析算法学习研究,构建学生画像模型,分析学生画像的应用。
关键词:一站式服务平台;学生画像;K-means算法
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2024)24-0085-03
开放科学(资源服务)标识码(OSID)
1 研究现状
随着大数据、云计算、人工智能技术的发展,我国高校的教育信息化进程也在不断加深,越来越多的高校开始对校内各信息系统进行整合和融通,力求消解信息隔阂和信息孤岛,建设让“数据多运动、学生少跑路”的一站式服务平台。平台的建设在方便师生的同时,也能够对海量的教学数据进行分类治理。如何让这些数据产生实际的价值,充分服务于学校的管理和教学,提升管理效率,实现个性化教育,是目前高校信息化建设的重点课题。
学生画像研究正是在这样的背景下发展起来的,其实就是运用数据挖掘技术创建的学生个性化模型,此模型包含一卡通消费信息、教务成绩信息、上网行为信息、门禁系统信息、图书馆借阅信息等各类静态或动态信息,通过聚类算法对此进行数据分析,运用雷达图、词云图等方法将结果可视化,从而实现高校管理个性化和学生服务科学化。
学习技术标准委员会把学生画像模型[1]定义为一种以学生为中心的教育分析模型。目前,高校研究主要集中在学生数据的收集、整合、分析和应用等方面,建立了较为完善的学生信息系统,包括一卡通消费数据、成绩数据、门禁数据、图书借阅数据等,通过创建数据仓库、数据湖等数据治理中台,实现数据的集中存储和管理,同时运用数据挖掘、机器学习等手段,对学生数据进行深度挖掘和分析,以揭示学生的消费情况、学习行为、心理健康、兴趣爱好等多维度信息,应用于个体行为分析、学生管理,个性化教学、咨询辅导等场景,取得了一定的应用效果。例如舒江波等人[2]搭建的学生大数据分析平台,通过对学生基本信息、消费信息和成绩信息的分析构建了一套偏向于研究学习成绩与饮食规律关系的学生画像模型,从而发现规律的饮食和稳定的消费与成绩成正比关系。Liu等人[3]运用K-means聚类算法基于学生上网数据构建针对学生上网行为的学生画像模型,根据聚类结果,产生四种上网特征子集,发现沉迷网络的部分学生,成绩和心理健康都存在一定的问题,提醒辅导员帮助此类学生减少上网时间。
目前学生画像研究呈现出了蓬勃发展的态势,随着技术的不断进步和应用场景的不断深化,学者们开始积极探索学生画像研究中的具体架构和运行机制等问题。如何在保护学生隐私的前提下进行有效的数据收集和分析,如何选择最佳的算法和模型来构建准确、可靠的学生画像,如何将学生画像与其他教育技术相结合,都是未来学生画像研究的重要方向。
2 研究准备
2.1 一站式服务平台学习
一站式服务平台是一个基于大数据治理条件下的综合服务平台,以数据为核心驱动力,通过对各类应用服务系统中海量数据的治理融合,实现业务系统的互联互通,创建统一信息门户,提供集中高效便捷的使用环境,提高信息门户对各类独立的应用服务的聚合和导航能力。
一站式服务平台设计的核心是数据,数据的治理是一站式服务平台建设的关键,学校目前建设的数据中台对包括一卡通系统、教务系统、学工系统、科研系统等在内的九个数据系统进行了集中治理,提升了学校数字档案的数据质量,保障了学校各项数据的准确性,也为全校学生提供更好、更加准确的个性化数字服务打下坚实的基础。数据安全和隐私保护是数据治理的重要部分,在一站式服务平台建设中加入区块链的设计,基于区块链的一站式服务平台[4]利用区块链带有时间戳的特性解决了底层数据源的随意篡改问题,为学生画像提供了真实有效的数据基础,在数据访问权限上利用多重签名技术,实现了学生画像系统的个人隐私保护功能。
通过构建一个能够满足学生个人数据集中存储、管理、查询等需求高速增长一站式服务平台,全面、快速、准确地收集相关数据,更加高效、便利地服务学生以及学生工作管理。真正实现让用户“少跑腿”,数据“多跑路”,提升学生的满意度和认可度,增强用户体验,使学生在信息化和数据治理发展中获得更切实有力的支持和体验感,积极推动智慧校园建设,提升校园治理能力。一站式服务平台以“大平台,小应用”模式,建设“更智慧,更人性”的智慧校园,形成开放互通的智慧生态。
2.2 相关分析算法学习
学生画像技术为高校教育工作者和研究人员更好了解学生的行为和需求,提供个性化的教育方案、优化教学资源分配和提高教学管理水平提供了依据。该技术通过多种算法对学生数据进行深入分析和挖掘,构建出能够全面反映学生特点、行为习惯和学习表现的综合画像。
目前对于机器学习的简单划分,可分为监督学习[5]和无监督学习[6],监督学习是指通过对海量拥有标签的数据学习制作一个模型,做到根据输入内容就能得到相应输出结果的过程,支持向量机(SVM)、决策树、逻辑回归等都属于监督学习算法。无监督学习不依赖于标记数据进行训练而是通过发现在没有任何标签的大量数据的隐藏规律进行学习和预测,常见的无监督学习算法有聚类算法、降维算法、关联规则学习等。目前学生画像研究中应用较为广泛的是聚类算法。
聚类算法的核心是使用合理的方法把数据集中未知类别的样本划分为若干个类族,目的是使样本集内部差别最小化,而族类之间差距最大化。在学生画像研究中将收集到的数据划分为很多个不同的子集,按照子集的分类划分学生群体。例如,基于学生的学习成绩、兴趣爱好、社交关系等特征,利用K-means、层次聚类等算法将学生分为不同的群体,从而揭示学生之间的共性和差异。下面简单介绍一下K-means算法的原理和流程。
K-means算法是一种广泛使用的划分式聚类方法,实质为Macqueen提出的一种迭代求解算法[7],通过迭代选择数据中的k个点作为中心,将数据分为k个簇,使得每个点属于与其最近的均值中心的簇,Means即被解释为每个聚类族数中的数据均值。具备计算高效、收敛速度快、可扩展性强等优点,被广泛应用于各种领域。K-means算法流程图如图1所示:
学生画像研究中还可以利用深度学习算法中的循环神经网络(RNN)或长短期记忆网络(LSTM)处理学生的时序数据,使用卷积神经网络(CNN)算法处理图像和文本数据。使用推荐算法基于学生的历史学习数据,通过协同过滤为学生提供精准的学习建议。除此之外还有一些其他技术也常用于学生画像研究,如自然语言处理(NLP)用于分析学生的文本数据,情感分析用于识别学生的情感状态等,因此在实际学生画像构建时,需要根据具体需求和数据特点选择合适的算法和技术进行组合和优化,以构建出更加准确、全面的学生画像。
3 学生画像模型创建
学生画像模型创建以“成长支持”为主旨,基于学校数据治理成果,把分散在各业务系统的学生数据进行采集、存储、加工、处理、计算,建立以学生个人数据为中心的数字档案并形成多维度的行为画像分析,最终将每一位学生的学习、消费、上网、图书借阅等信息进行可视化输出。同时提供给学生本人进行数据查询、数据质量反馈、数据纠错补录服务,做到及时跟踪、及时干涉,有效辅助学生成长。本文创建的学生画像模型的系统架构图如图2所示:
1)数据层:数据源来自一站式服务平台治理下的各类应用系统,包括学生的基本数据、一卡通系统消费数据、出入管理系统人脸信息、教务系统内的成绩信息、图书管理系统内的借阅数据等,通过对这些分散的信息系统中数据的提取和整合,建立数据分析使用的标准数据集,也就是目前学校已经建设完成的数据中台,为构建学生画像模型提供数据支持。
2)访问层:根据数据源数据形式不同,将收集到的原始数据转换成适合分析的格式,以便于不同来源和类型的数据能够被统一处理和分析。但是数据源内可能存在错误、重复或不完整的记录,为确保数据的质量和准确性需要进行数据清洗,一般通过求平均、求标准差、中位数补充、分词等方式来处理。从预处理过的数据中提取出对学生画像构建有意义的特征,然后再进行数据建模操作。
3)服务层:通过对访问层数据的挖掘提取学生属性的不同标签,这需要运用多种数据分析算法,对于结构性数据可以使用聚类分析,一些如上网行为、情感需求等非结构性数据可以采用神经网络与深度学习的算法,通过多种数据分析算法相结合的方式才能构建出真实准确的学生画像模型。针对不同属性的学生标签进行分类,构建出学生预警模块。
4)应用层:本层结构就是学生画像系统的可视化展示层,分为群像展示、个人画像展示以及预警信息推送,用雷达图、柱状图、饼形图等形式展示学生画像信息,并支持动态展示学生某段时间内的指标数据,同时推送预警信息给学生本人和辅导员。让数据直观的可视化展示,实现学生强化自我认知,驱动自我成长和改进。
4 学生画像的应用
学生画像的应用在教育领域具有广泛的实践价值,它基于对学生数据的深度分析和挖掘,为教育者提供了更全面、深入的了解学生的途径,提升教育质量,优化学生管理,提升信息化系统在教育育人中的作用,促进智慧校园发展,下面从三个主体简单阐述学生画像的应用。
1)学生:学生画像顾名思义就是收集到的学生的各项信息,通过大数据挖掘技术形成的学生行为分析图像,它揭示出每个学生的在校内的生活习性、学习状态、心理健康等多方面的状态,针对学生的特性,高校可以制定个性化教育方案,通过适合学生的课程内容和教学方法,激发学生的学习热情,提高教学质量,真正做到教学相长。学校还可以通过学生画像精准向学生推荐适合的学习资源,甚至学习伙伴,提高学生的学习效率,增强学习体验。同时学生画像还可以提供学业预警功能,提醒学生关注学习情况。对学生自身而言,学生画像是一面镜子,可以正衣冠明心智,更加全面地了解自己,监督自己,实现自己。
2)教育工作者:学生群体画像全面展示了高校学生概况,管理者通过学生消费情况一览表找出贫困学生,实现精准扶贫;通过预警消息及时发现学生出现的问题和遇到的困难,及时掌握学生动态,以防学校悲剧发生;实时呈现的学习状态和数据有助于优化教学流程,提高教学质量,为教育决策提供有力支持;同时学生画像的多维度展现也有助于教育工作者为学生提供准确的职业规划和就业指导。对于教育工作者来说,学生画像是服务学生的工具,是提高教学的手段,是教育发展的一种新尝试。
3)高校:构建一个精准、全面的学生画像是不断优化和完善数据治理机制的过程,是提高提升学校的数据治理能力的试金石。为了保证数据的准确性、完整性和安全性需要学校制定合理的数据采集、存储、处理和应用规范。学生画像模型创建完成后,需要持续追踪使用情况,根据实际应用场景进行反馈和优化,不断提升模型的准确性和有效性。探索数据治理在学生画像模型构建以及教育决策中的应用模式,是智慧校园发展的趋势,为教育领域的创新提供新的思路和方法,通过实践验证,不断优化和完善数据驱动的教育创新模式,推动教育领域的持续发展。
5 结束语
学生画像研究作为教育领域的一项创新尝试,通过深度挖掘学生数据,为教育者和学生提供了更加精准、个性化的教育方案。本文在探讨学生画像的构建方法、算法应用以及实际应用价值等方面,力求为读者呈现一个全面、深入的学生画像研究视角。
参考文献:
[1] KEGEL I,LANGE R,MANION J,et al.Draft standard for learning object metadata [J].IEEE Learning Technology Standards Committee,2002.
[2] 舒江波,葛雄,彭利园,等.基于学生个人大数据的行为特征分析[J].华中师范大学学报(自然科学版),2020,54(6):927-934.
[3] LIU K S,NI Y K,LI Z H,et al.Data mining and feature analysis of college students’ campus network behavior[C]//2020 5th IEEE International Conference on Big Data Analytics (ICBDA).Xiamen,China.IEEE,2020:231-237.
[4] 王晓敏.基于区块链的一站式服务平台研究[J].电脑知识与技术,2021,17(12):45-49.
[5] CARUANA R,NICULESCU-MIZIL A.An empirical comparison of supervised learning algorithms[C]//Proceedings of the 23rd international conference on Machine learning - ICML '06.June 25-29,2006.Pittsburgh,Pennsylvania.ACM,2006:161-168.
[6] CASOLLA G,CUOMO S,DI COLA V S,et al.Exploring unsupervised learning techniques for the Internet of Things[J].IEEE Transactions on Industrial Informatics,2020,16(4):2621-2628.
[7] SINAGA K P,YANG M S.Unsupervised K-means clustering algorithm[J].IEEE Access,2020,8:80716-80727.
【通联编辑:梁书】