学习者画像建构及应用研究

2021-07-13莫尉

湖南理工学院学报（自然科学版） 2021年3期

莫尉

(湖南理工学院,湖南岳阳 414006)

0 引言

中共中央、国务院印发的《中国教育现代化2035》中明确指出,加快信息化时代教育变革,实现规模化教育与个性化培养的有机结合[1].随着云计算、大数据和人工智能等新一代信息技术快速发展,无处不在的数据构成了“互联网+”的分子,数据采集技术的快速升级和数据的指数式增长也让教育迈入了“数据驱动”的时代[2].恰当地使用和挖掘目前教育信息系统中存储的大量不同格式和不同粒度级别的学习者数据,成为实现规模化教育与个性化培养有机结合的关键点.

为回应这一教育需求,研究者们将商业领域的用户画像概念引入教育情境中,在分析相关学习数据的基础上,通过建立多维度的画像标签展示体系,全面、细致、精准地识别学习者的学习状态和潜在需求.既能为个性化学习提供依据也有助于规模化教育的开展,大数据背景下借助用户画像开展人才培养模式的变革将是未来教育的研究方向.然而,当前在教育领域中用户画像研究还存在许多亟待解决的问题,如缺乏教育理论对整个画像流程的指导和调控;在构建用户画像维度时,忽视对学生能力或素养等深度学生画像的关注;无法满足不同利益相关者的多样化需求等.基于此,本研究将聚焦如何通过各类学习者数据构建学习者画像,研究其实现流程和标签体系架构,以及学习者画像驱动和服务精准教学的途径,以期为教育的智能化和个性化带来一些启发.

1 学习者画像内涵与特征

1.1 学习者画像的含义

学习者画像是用户画像在教育领域的应用.用户画像的概念在上世纪90年代末由交互设计师Alan Cooper 提出.他认为用户画像是基于大量真实数据构建出来的虚拟用户模型[3],其实质是在对用户数据挖掘提炼的基础上,通过生成数字化标签集的形式,尽可能全面细致地抽取用户的信息全貌,以便能够表征和预测用户行为,从而帮助企业解决如何将数据转化为价值的问题.目前,用户画像在商业、医疗、管理、情报等众多领域和行业中已有广泛的应用,用以提升用户体验,实现精准化服务,提供管理决策参考[4]等.

作为研究人的学习行为的学科,教育领域同样能够借助用户画像技术实现新时代的需求.教育是一个复杂的育人系统,不仅涵盖的主客体变量众多,而且对教育决策的容错性较小.因此数据驱动的教育革新不仅要求实时客观地表征学习者特征,还需要准确发现学习者的需求偏好,并且能够对教学行为变化进行动态预测.当前,研究者从不同角度对学习者画像的涵义和实现途径进行了阐释.例如,肖君等从学习者基本特征、在线学习行为和学习路径三个维度构建了学习者画像,并证明了画像对预测高风险学习者的有效性[5].余明华等聚焦参与研究性学习的学生,通过建构画像从能力属性、行为属性和兴趣属性三个角度来识别不同类型的学习者,提出了面向学生的个人画像和面向教师的群体画像[6].顾小清等提出结合线上线下数据建构学习者画像的理论和思路[7].在综合现有研究基础上,本文认为,学习者画像是指通过多途径多方法收集与学习者学习过程紧密相关的数据,利用分析挖掘技术构建的可通过词云图、仪表盘等形式进行可视化呈现的虚拟学习者模型.该模型是学习者个体标签体系的集合,能够描述学习者的特征、需求、偏好和行为,为更精准的学习支持服务和后续的学习分析提供数据支撑,提升学习者的学习体验.

1.2 学习者画像的特征

(1)数据来源的教育价值性

相较于一般用户画像的来源数据,学习者画像数据强调“教育情境性”和“价值密度”.为此,研究者们通过社会调查、网络数据采集和感知技术采集三种主要方法,来获取学习者全过程多模态的数据.社会调查以访谈、观察、问卷调查方法为代表,支持抓取学习者的心理特征、高阶能力与素养表征数据.如采用学习风格、学习动机量表收集学习者类型数据.网络数据采集支持抓取描摹学习者学习行为轨迹的网络数据.如利用网络爬虫工具获取学习者主动提供的个人基本信息、评论评分等显性数据.利用日志挖掘技术、平台数据库采集技术获取学习者的学习资源访问顺序、学习时长等学习行为日志记录.感知技术借助智能终端或可穿戴设备支持抓取学习过程中产生的图文声像、视觉触觉等交互式数据.如借助脑电实验对学习者的脑电波图形进行分析,获得学习者关注度与兴趣画像[8].

(2)建模过程的方法融合性

区别于以往的学习者分析方法,学习者画像的建模过程中融合了定量与定性两类方法.定量化的方法是对学习者数据进行精细的统计分析与计算,从而精准发掘学习需求.定性化的方法则能够对教育场景、学习者心智等进行分析,从而对用户的性质和特征做出抽象与概括,用于为生成的标签赋予语义化意义.同时,由于教育中学习者个体与社会性的现实关照,因此学习者画像的建模过程还应表现出融合个人画像和群体画像的层次性.首先,基于个人的画像是以识别单个学习者的特征为基础,深入全面地了解个体学习需求,在此基础上,结合相关技术实现个体评价、个性化资源推荐和用户行为预测等功能.其次,学习者群体画像是实现对学习者的分群操作,并依据实际教育情境挖掘出群体共同行为特征规律,向教师、教育管理部门等提供决策支持.

(3)画像模型的维度多元性

学习者画像本质上是一组特征标签集合,画像标签库的形成由学习者画像模型决定.为了达成学习者特征分析、学习者群体识别、学习者评价等方面的目标,可以结合多元化场景从学习者一般特征、知识能力结构、内隐心理、外显学习行为以及学习交互五大维度对学习者进行全面的刻画.具体而言,①学习者一般特征包括学习者的基本信息、教育经历、通讯信息等个人信息,能够唯一地表征某位学习者,初步描摹学习者个人轮廓;②学习者知识能力维度反映学习者的学科知识掌握程度、能力水平、技能熟练度等,通常基于学习者的测评数据进行建模;③内隐心理维度表示学习者的心理状态,包括学习风格、兴趣爱好、情感情绪及其变化趋势等;④学习行为维度是学习者在学习过程中产生的行为表征,如信息检索、信息加工、信息发布等;⑤学习交互维度涵盖学习者与同伴、教师以及资源进行交互的情况.

2 技术支持的学习者画像实现流程

目前,数据的多样性、异质性以及庞大的数据规模给学习用户画像构建带来了极大挑战[9].学习者画像流程架构是学习用户画像研究的重要基础内容,能对整个建构过程进行全局性规划,对画像分析、实践和应用全过程起指导作用.基于对相关理论和文献的分析,提出学习用户画像逻辑实现框架,包括画像目标确定、数据采集与清洗、学习者画像模型建构、学习者标签提取、画像输出与评价五个环节,如图1所示.

图1 学习用户画像实现流程框架

2.1 画像目标确定

目标确定在以往的学习用户画像研究中,很少被明确地提起.然而学习用户画像日渐丰富的应用场景、体量惊人的数据类型和眼花缭乱的分析技术,使得保证画像建构意义、明确画像构建目标变得十分必要.这将有助于划分画像构成要素和模型构建,从而确定画像的数据选择和结果呈现.目标确定环节以学习情境分析和利益相关者需求分析为基础,可从信息识别、特征挖掘、发展预测三大类别逐步细化,分别为学习者、教师、管理人员提供精准化支持服务.

2.2 数据采集与清洗

数据是学习分析和画像构建的基础.为了保证学习者画像构建的质量,开发人员可依据目标确定阶段的需求分析,指导学习数据的具体采集,包括对数据来源的可及性分析和数据采集方式的可行性选择.融合社会调查(访谈、观察、问卷调查)、网络数据采集(网络爬虫、平台数据库)、感知技术(可穿戴设备、智能终端采集)等多种方法,既注重线上数据与线下数据的结合,也兼顾外显行为和心理生理特征数据的结合.采集来的数据需要经过清洗才能用于分析与建模.数据清洗过程涉及到无关数据的删除、缺失值和偏差值的填补校正、数据格式的转换处理等.

2.3 学习者画像模型建构

学习者画像模型的建构是全流程中至关重要的一步.根据数据、信息、知识和智慧(DIKW)金字塔层次体系,学习者画像模型中保存的即为信息或知识,它们已经对学习者实现了量化表征.因此,学习者画像模型建构过程实质上是采用定量分析的方法对数据进行分析提炼,从而填充模型各维度内容.模型建构的分析方法决定了最终学习者画像的准确度,模型生成结果的颗粒大小决定了最终学习者画像的精细度.模型建构过程应充分分析数据特征,以建构目标为导向,精心融合统计分析、机器学习、基于理论的自定义规则等多种分析方法.

2.4 学习者标签提取

这一步骤的核心工作是将学习者模型转换为语义化的标签,即对学习者的某一特征进行评价分类,如根据学习时长判断某一学习者是“持之以恒者”还是“临时抱佛脚者”.其过程是在定量分析的基础上结合定性分析,可以应用人工分析提取、监督学习的方法实现.作为学习者画像区别于其他用户分析的重要特点,提取出的学习者画像标签需要具备语义化和短文本两项特征.语义化便于画像的各相关利益者理解其含义,短文本以供后续应用时作进一步加工处理.

2.5 画像输出与评价

将学习者画像直观明了地呈现给各相关利益者,即为学习用户画像的输出.该环节可以使用标签云/词云、各类图形图表等数据可视化技术实现.直至画像输出,单轮学习用户画像构建流程便结束了.而完整的学习用户画像是一个不断迭代完善的过程,还需要结合应用情境对画像进行评价和修正.评价指标需根据不同的建构目标,从准确率、区分度和时效性三方面进行制定.评价的方式可以采用问卷调查、回访画像对象、与使用画像前应用效果进行对比分析等.

3 基于社会学习理论与活动理论的学习者画像标签体系

学习者画像以构建出一组能表征学习者特征的语义化标签体系为目标.鉴于已有研究在构建学习者标签体系时,常以原始数据类别为依据,忽视数据类别间的动态关联,造成标签体系不系统、理论解释性不强的现状,为科学合理地表征学习者,本文基于社会学习理论“三元交互”模型的观点,从个人特征、行为表现、环境因素三个方面建构学习者画像三个一级维度.一级维度间通过动态交互作用,互相影响、互为依赖,为各类教育应用场景提供立体化服务.在此基础上,为了确保标签体系对学习活动分析解释的全面性与语义性,在活动理论的指导下,进一步细化了标签二级维度.最终建构了如图2所示的完整学习者画像标签体系.

图2 学习者画像标签体系

标签体系中,学习者个人特征维度主要指学习者认知和其他个人内部因素,包含个人基本信息、知识掌握情况、能力水平、心理动机指标等,特别地设置了个人认同的规则标签,表示个人具备的价值观、道德规范、文化惯例等.环境因素维度是指除学习者自身以外,学习客体、共同体及学习工具的有效整合,包括学习目标、学习任务、真实情境的人或物、学习平台、内容资源以及网络系统和服务等.学习者行为表现维度主要指学习者个体在与学习环境的交互过程中产生的外显学习行为,既与学习活动有关,又与学习者的社会化特征相关,可以分为学习者与资源进行的活动和学习者与学习共同体进行的交互.在各维度下,标签以自上而下逐渐细化的树状层级结构呈现,最下端的“叶节点”为具体描述的语义化标签实例.

依据标签的内容特征,最终生成的学习者标签划分为事实性标签、特征性标签和预测性标签.事实性标签用于描述既定事实,如“城市/农村生源”“本科学历”等.特征性标签是对用户数据进行了提炼抽取,用以揭示其潜在特征和规律,如“善于推理和决策的问题解决者”“移动学习偏好者”.预测性标签具有概率预测和价值预测功能,如“高风险学习者”.在现有学习用户画像研究中,上述各类型标签的提取,可以通过人工提取和技术抽取两类方法来完成.人工提取是在相关理论的支持下,结合研究者的知识经验,描绘或者抽象用户属性差异,从而抽取用户特征.这类方法适用于提取各种类别的用户标签,具有较强的语义表达能力和逻辑推理能力,标签体系的维度多样且条理清晰.但这类方法要求标签提取者具有专家级别的领域知识,并且由于人工参与不可避免地存在一定的主观倾向,同时对于不同领域需要分别建构相应提取规则,因此较为耗时耗力.技术抽取是利用信息技术手段自动地抽取出描述用户特征的各类标签.这类方法有助于大数据场景下新模式新特征的发掘,具备技术类工具的跨领域适应性,节省时间和人工成本,同时避免了人工参与的主观倾向性.

4 学习者画像应用情境分析

根据社会学习理论的观点,学习者、环境和学习行为交互作用以产生人的后继行为,即这三个成分中的任何一个都不能独立于其他两个而单独作为理解学习过程的决定因素.因此系统整合个人、行为、环境标签,分别生成事实类标签、特征类标签和预测类标签,可为如下多种教育应用场景提供服务.

4.1 学习者个体:基于个人标签,对照环境和行为标签,促进学习者自身认知与发展

学习者既是画像的核心对象,也是画像的首要服务用户.语义明确的数字化标签构成了学习者个人的专业发展报告,可视化呈现了学习者的绩效表现,能够促进其元认知能力和自我监控能力的发展.具体应用包括,首先,借助事实类标签进行学习结果自查和澄清优缺点所在;其次,应用特征类标签开展自我诊断,反思学习过程,分析原因;最后,依据预测类标签制定学习发展规划.

4.2 针对资源供应方:基于环境标签,关联个人和行为标签,实现自适应式精准推荐

智能推荐引擎是个性化教育培养领域的关注焦点,基于学习者画像构建智能推荐系统,能够自适应地为学习者提供个性化的资源推荐服务.学习者画像中的行为标签和个人标签可以精准客观地描述出学习者的既往资源选择偏好、知识储备状态、能力缺陷情况等个体特征,在此基础上与环境标签中的资源类标签进行对比,可为资源供应方的服务优化提供参考方向.具体应用包括两个方面,其一,支持已有教学资源的精准推荐;其二,辅助面向需求的学习资源精准设计.

4.3 针对学习共同体:基于行为标签,搭载个人和环境标签,支持共同体个性化配对

现代教学理论不断呼吁个体学习应向共同体学习进行转换,以获得更好的学习绩效.但在实际教育中,评价机制的不完善和固定班级制的限制,成为学习共同体形成和发展的壁垒.学习者用户画像将能够支持这一应用场景的有效转变.具体的实现思路为:画像中的行为标签突出描述了学习者的社会属性,进一步搭载个人标签中描述认同规则的标签与环境标签中描述学习客体的标签(如学习目标、学习任务等)进行匹配.最终,为学习者输出以共同愿景、价值和情感为基础,以真实任务为核心,师生、生生之间持续深层合作和互动,共同成长、共同进步的共同体组合[10].

4.4 针对教育管理者:整合三类标签,构造群体画像,驱动教育管理者循证决策

刻画学习者群体特征,是学习者画像应用中一类重要内容.对于决策者而言,由一定样本量的学习者画像整合而成的学习者群体发展报告,可以分别为教师、学校或区域教育管理者呈现教育教学活动实施的总体情况.一方面,在日益呼唤学生评价改革的背景下,学习者画像可以更加客观全面地对学习者进行基于过程的伴随式评价.另一方面,学习者画像支持对特殊学生群体的发现.对具有特殊才能的学生可以因材施教,实现教育资源再分配;对高风险学生可以抽取其发展轨迹,及时进行针对性干预.

5 结语

本文针对当前我国学习者画像研究中缺乏教育理论指导,忽视不同数据间动态关联价值等问题,从可行性和具体实施方法方面,探讨了学习者画像的建构流程,并提出基于社会学习理论和活动理论的学习者画像标签体系,阐释了相关应用场景,可为科学勾勒学习者画像提供参考.后续研究将对学习者画像在教育教学中的应用实践进行实证检验,并重点关注学习者高阶能力素养的描画,使学习用户画像更深刻立体.同时,还需要加强学习者画像实现技术中的数据标准统一、数据开放共享和数据隐私保护等内容的研究.