APP下载

用户画像技术在我国教育领域研究现状分析

2021-10-11廊坊卫生职业学院

内江科技 2021年9期
关键词:教育领域画像算法

◇廊坊卫生职业学院 侯 婧

中国人民警察大学 贾 南

随着教育大数据和现代智能技术的不断发展,用户画像技术被逐渐应用于教育研究领域,通过准确刻画教学参与者的特征,助推精准教学,提升教学质量。本文对用户画像技术在我国教育领域的研究现状进行了梳理,首先介绍了教育领域用户画像技术的总体应用情况,然后从应用主题、所用算法和技术等方面进行了详细分析,最后指出了当前用户画像技术在教育领域研究情况的局限性和未来发展方向。

用户画像技术是由交互设计之父A.Cooper最早提出的,根据其研究成果,用户画像是指“基于用户真实数据的虚拟代表”[1]。通过统计分析、建立数学模型等方法对用户的个人信息、工作数据、生活习惯和社会活动等信息进行画像和分析,给画像对象打上“标签”,从而实现对用户信息的高度凝练和深度挖掘。在大数据和人工智能技术不断发展的背景下,上述用户画像技术正在被越来越多的学者用于教育领域相关问题的研究[2-3]。由于现今学生的知识基础、学习能力和兴趣爱好呈现多元化,统一的教学方法往往难以实现良好的教学效果,而用户画像技术的应用可以提供更加精确的学情诊断、个性化学习分析和智能决策,有助于教学效果的提升和学生个性化培养的实现。

1 教育领域用户画像研究基本情况

1.1 论文发表年度情况

通过在中国知网进行文献检索,检索方式为主题=“‘教育’and‘用户画像’”or“‘学生’and‘用户画像’” or“‘教师’and‘用户画像’”,检索时间不限,经过剔除非相关文献,检索出符合主题的文献仅为44篇,可见该领域是一个较新颖的研究领域。发文量随年度变化情况如图1所示,用户画像技术在教育领域的应用从2016年开始,呈逐年递增的趋势,仅2019年1月至8月就发表文献22篇,占检索总数的一半。

图1 文献发表数量年度走势图

1.2 发表论文来源情况

本文所检索的44篇文献中期刊论文共34篇,硕士论文9篇,报刊1篇。期刊论文中共10篇发表在中文核心期刊,占29.4%。另外,所发表的期刊中录用论文最多的为《中国教育信息化》,数量为4篇;硕士论文中来自北京邮电大学和华东师范大学的最多,均为2篇。

1.3 文献被引用情况

论文被引用情况可反映出论文的影响力,影响力较高的5位作者分别是陈海建、赵国亮、张华峰等人,他们的论文信息如表1所示,其中3位作者发表的期刊为中文核心期刊。

表1 高引用次数论文情况

2 教育领域用户画像的研究主题

当前国内研究人员运用用户画像技术在教育领域的相关研究主要集中在以下几个方向。

2.1 学生画像

在应用用户画像技术研究教育问题的44篇文献中,共有26篇着重于对学生的各种行为和特征进行画像,所占比例为59.09%,可见针对学生的画像技术应用是目前的主要研究方向。其中杨浩[4]基于学习、论坛评论、日常消费等数据设计了学生画像系统;刘柏岩[5]依托教育大数据,围绕mooc教学平台,构建了包含两个方面、三个维度的学生画像模型。唐佳诚等[6]通过分析作业、考勤、实验等数据构建出学生的用户画像,为老师掌握学生情况提供了重要依据。

2.2 教师画像

在检索出的文献中,教师画像的研究共有6篇,所占比例为13.63%。胡小勇等[7]基于精准教研视域,从数据预处理、构建模型、标签建立和模型评估四个环节对教师画像进行了深入研究。程小恩等[8]收集了教师的网络课程信息、教务系统信息等数据,运用用户画像技术对教师的教学行为进行了多维度刻画。

2.3 个性化学习路径推荐

研究个性化学习路径推荐策略是本领域研究的另一种视角。牟智佳等[9]为提升学习者学习针对性,从兴趣爱好、知识储备、综合实力三个方面对学生进行了精准画像,进而设计了个性化学习路径。师亚飞等[10]通过分析学习者的网络学习数据,以推荐学习元列表的方式实现了个性化学习路径的精准推荐。

2.4 特定教育领域的应用

为更好的服务特定教育领域,部分学者着力于用户画像技术在其所从事的专业教育领域开展落地研究。李保澄等[11]为提升公安院校的教学质量,依托公安教育大数据,采用用户画像技术对教师和学生的行为和特征进行刻画,为师生个性化发展提供了重要支撑。徐艳[12]以提升高校思政教育为目标,充分发挥了用户画像技术的优势,对教学过程中的大量教育数据进行深度挖掘和分析。

3 教育领域用户画像的算法与技术

3.1 机器学习算法之分类算法

分类算法是机器学习算法中的一个重要分支,其核心内容是依据数据集中各个样本的多维度特征,将其划分到给定的不同类别中。杨浩等[4]使用SVM(支持向量机)建立分类模型来预测学生的挂科情况,同时运用C4.5决策树算法对学生的生活和学习中的异常行为进行预警。唐佳诚等[6]通过收集公共必修课中学生的作业、考勤、实验等数据,运用GBDT(梯度提升决策树)算法建立了教学模式分类模型,经实际数据检验,达到了很好的分类效果。

3.2 机器学习算法之聚类算法

聚类算法为机器学习算法中的另一种重要类型。与分类算法不同,聚类算法不预设各样本的类别,即数据集不带标签,通过分析数据集中各样本的相似性和差异性将其分为不同类别。黄刚等[13]为分析学生的消费习惯、学习情况,采用K-means聚类算法建立模型,对学生的各个维度数据进行了挖掘。王晓芳等[14]选取学习过程中五类具有代表性的事件作为特征,运用K-means聚类算法建立模型,最终将学习者分为四类群体并详细分析了各类群体的特征。

3.3 机器学习算法之关联规则挖掘

关联规则挖掘也是机器学习算法中的一个重要研究方向,其目的是发现隐藏在数据项间潜在的关联关系。陈海建等[15]、王凯月等[16]分别从学习风格和课程联系两个研究角度出发,运用关联规则进行了深入挖掘。

4 存在的局限及未来研究方向

4.1 当前研究存在的局限性

广大学者运用用户画像技术在教育领域进行了积极探索,取得了一定的成果,但当前的研究还存在一些局限性,主要体现在以下几个方面。

(1)研究主题和所获取数据不够全面。当前运用用户画像技术解决教育问题的落脚点主要集中在对学生和教师的分别画像等主题,研究方向略显单一。用于画像的数据大多集中在学生的兴趣爱好、学习成绩、社交活动等画像个体本身层面,缺少对学生家庭情况、学校管理情况和教师教学情况等外部数据的画像,影响了画像结果的整体质量。

(2)画像主要体现在静态画像。目前相关研究多着眼于基于学生或教师的历史数据的静态画像,而人和环境都是在不断变化的,静态画像结果与现今画像对象的实际情况会存在偏差,需进一步解决。

(3)画像模型的精度有待提升。当前用户画像技术所依赖的算法大多为决策树、K近邻等机器学习算法,这些算法的画像精度受模型本身影响较大,需进一步探索模型的改进以提升画像质量和精度。

4.2 未来的研究方向

(1)研究教师、学生共同体的画像。在教学过程中,教师的教与学生的学相互影响、密不可分;单独对教师或学生画像忽视了二者的联系,与客观实际存在偏差。因此,未来应进行基于教师与学生共同体的各维度数据画像,以便更好地为精准化教学和学生的个性化培养服务。

(2)运用动态画像技术提升研究的时效性。教师和学生的情况是动态变化的,收集静态数据刻画出的教师或学生特征及对应的教学策略调整都具有一定的滞后性。因此,需要对各维度数据进行实时采集或不断更新,准确地反映出画像对象当前的状态和特征,从而提升教学方法调整的时效性。

(3)基于深度学习提升用户画像性能。当前用户画像技术大多依赖于机器学习算法,画像精度有待提高;未来随着教学大数据资源的不断增加,运用深度学习或其他融合模型或许能进一步提升画像的效果。

5 结语

本文梳理了用户画像技术在我国教育领域的研究现状:从总体情况来看,用户画像技术在教育领域的研究尚处于起步阶段,发展空间较大;从研究主题来看,用户画像的对象主要集中学生或教师,并进一步推荐个性化学习路径;从研究方法来看,当前研究者主要运用机器学习算法中的分类、聚类和关联规则挖掘等技术对学生的特征进行刻画挖掘。综上所述,笔者认为当前研究存在研究主题和所获取数据不够全面、画像主要局限于静态画像、画像模型的精度有待提升等问题,可以从研究教师和学生共同体的画像、运用动态画像技术提升研究的时效性、基于深度学习算法提升用户画像性能等方向进行进一步研究。

猜你喜欢

教育领域画像算法
威猛的画像
哪种算法简便
“00后”画像
画像
Travellng thg World Full—time for Rree
进位加法的两种算法
根据问题 确定算法
基于文献计量的数据素养及其教育领域研究态势分析
江江西率先突破高考、教师交流、民办教育深化综合改革
反差——阿伦德