APP下载

大数据下个性化自适应学习系统支撑模型与实现分析

2022-03-11胡致杰

中阿科技论坛(中英文) 2022年2期
关键词:学习者个性化知识点

胡致杰

(广东理工学院信息技术学院,广东 肇庆 526100)

大数据可以说是在物联网与云计算之后,IT领域中的一项突出变革。该科技手段拥有数据量级大、涵盖信息类型多、处理效率高等特点。在教育领域中,通过大数据,对学生的学习行为及过程实施准确性的量化分析,同时还能优化学习行为绩效,全面制定学习方案与路径,对实现个性化及自适应的学习,予以有力的技术支撑。

1 大数据下个性化自适应的学习需要

以“教”的视角来讲,个性化自适应学习需根据学生个体特点,予以差异性学习服务。在多元智能理论下,智能包含语言、节奏、自我认知等,各项智能均反映出学生的潜力及天赋,体现其兴趣偏好与理解水平,但每种潜能并非均衡成长的,学生个体特点会在认知的各个时期,以差异化的形式表现出来。理论上,教师应利用全程监控,尽可能挖掘出学习者在某些方面的潜能,并辅助其增强对自己的认知与创新力。但在以往的教育模式中,教师不能随时了解学生的状态以及学习成果,使得其无法及时优化教育方案。进入大数据时代后,信息传递及取得的方法都随之出现变化,诸多线上学习方式能较为完整地记录学习者的知识基础、学习过程、知识需要等,这给进一步了解学生提供了可行的技术条件[1]。

以“学”的角度来看,个性化自适应学习是基于大数据技术,实现自我调整、自主学习的形式。以构建主义层面来说,学习应当是学生自主、积极获得未掌握的信息,继而依托于既有认知体系,内化新内容,实现优化认知结构。而站在元认知理论的视角,元认知的知识与监控能力,对学习有巨大影响,关系到学习行为的效率与学生创新力。通过教育大数据分析,能给各位学生提供与之高吻合度的资料、学习渠道,让其形成学习元认知以及自主学习的意识。

2 个性化自适应学习系统模型的要素演化

2.1 学生需要

首先,学习行为中的自主意识逐渐深化。常规自适应系统中,会为学习者提供固定统一的学习流程以及相应的数字化资料,但未能注意到学习者的主观想法,即自主性。而大数据环境下,立足于个性化特色的自适应系统得以全面开放,使学生产生对学习行为的把控感及成就感,享有在自主管控范畴中,流程、资料的选择权,达到个性化的学习效果。学生在比较轻松的状态下完成学习,并符合其在吸收知识方面的需要,同时还比较强调学生的各项能力成长。

其次,学习行为逐渐群体化。大数据环境下,无论是线下学习或者利用系统开展学习,学生均不是单独进行,而是在不同的人际网络下,比如校园、学习小组、网络兴趣群等。而群体的学习经历都是学习者可以借鉴与参考的对象,而且通过和他人交流,也能弱化学生使用系统进行学习时,内心的孤独感[2]。

最后,逐渐加强对学习情感的关注度。自适应系统在分析中,都会存在一个假设,即学生可以一直使用系统开展日常的学习活动,同时,系统本身可以对学习者的行为实施准确性分析。而实践现象表示,用于网络学习系统软件,结业率并不高,学生会因为某些因素考虑不再使用软件程序。曾有一个关于系统使用的实验,最终只有两名学生学习完所有课程。而格雷泽等学者,针对在线学习时的情感状态进行研究,并归纳出对学习行为有较大影响的情感状态,如厌烦、热情、困惑等。个性化的自适应系统,可利用数据分析的方式,感知学习者的情绪表现,支持情感交互,借助此种模式,能维系学习期间的注意力和参与感。

2.2 学习资源

一方面,学习资源应设置成情境化的形式。因为落实学习行为事件、地点、应用终端的多元化,使得学习场景也具有多样性的特征。因此,需要学习资源的处理设计方向,可以更加清晰,而且各项资源应当拥有相互独立、实效性高、小数据容量等特征。另外,鉴于通过不同终端设备使用,所以要求学习资源拥有良好的适应性。

另一方面,各学习资源之间应当在空间上形成关联性。现如今,学习资源的零散化愈发明显,但并不表示没有任何规律。资源内容需基于某知识点,将具体知识点整理成一个数据包,其中包括掌握此知识点应当了解的全部资源,比如练习题、实践活动、微课等。而且绝大部分学科的知识点都有内在联系,不仅是学科本身的知识结构联系,还存在某些组织关系。根据前面讨论,学习者在吸收某知识点中,具有不同程度的随意性,随时随地可能进行学习,同时不会根据整体的知识体系逐一学习。因此,自适应系统应当建立多层次的知识点关联体系,也就是基于知识结构联系或群体学习经历等各类关系,以提升学习资源推荐的适宜性[3]。

2.3 系统结构

一是学习系统需具有生态性。以往的自适应系统,一般还处于研究实验中,尚未形成深厚的用户基础,通常是本校或具体专业的用户,还不符合大数据分析对于数据量级的要求。而个性化的自适应系统,设计基础环节便是形成系统结构,确保可以承载海量数据与不同的信息源。比如,“作业帮”累计激活用户达到一亿多,而且在义务教育阶段的学习者,已经切实解决学习请求的数量,达到百亿次的级别。该种数据规模是常规实验类学习系统不能承载的。立足于大数据及云计算,支持系统间的交互性。根据现如今的网络应用状态,系统输出内容能成为其他系统输入,例如,在学生成绩系统中包含的学习者以往测试信息,能借助数据连接,成功导入学习系统,借此实现对当前用户学习水平的客观性评估。

二是数据收集更为精确。大数据中,云计算与物联网、移动网络均给学习者创造良好的技术支撑,而学习者终端设备不同,可能是台式电脑、笔记本、平板及手机等登录系统学习。在此过程中,网页日志、视频、GPS数据、点击记录等都可以被收集保留,而且数据形式也打破原本结构状态,也有半结构及非结构类的信息。数据资料以多样化形态呈现,并通过更为精确的路径被获取及储存。

三是系统可实现自我升级。“适应”是基于在个体和环境间形成关联的动态化过程;“适应性”则表示个体和环境之间,在追求互相适应期间展现出的适应水平。支持构建个性化的自适应系统,是根据“有限”规则,但实施活动行为的主体是人,存在极高的复杂性,而“有限”规则不能完全支撑“无限”复杂的活动运行。学习系统需拥有自我调节参数的性能,并且在数据计算与使用次数不断增多中,能利用机器学习,实现自行优化,逐步提高挖掘学习者特征与预测的准确性[4]。

3 个性化自适应学习系统的总体框架讨论

3.1 总体框架

首先是应用层。其负责的工作内容有:各用户操作的所有业务,如学习活动、评价、路径等。

其次是控制层。这是个性化自适应系统的重点,应借助自适应引擎,全面联系学习者的特征模型,给其推荐智能化及定制化的学习的服务。另外,为能使学生感受到个性化的学习,应当落实全方位学习评价。基于此,合理改进引擎规则,保证引擎可以进行智能优化。

再次是数据层。该层次结构在运行中会依托于感知层,对数据资料进行不间断、精准性的收集与汇总。还可产生完整的网络日志与信息点击流,网络日志中涉及图像、音频及动态数据等有关学习的内容。另外,系统数据层运行中,还会产生巨大的初始数据池,包括结构化与半结构类的数据池。

最后是感知层,也就是资源接收的一方。通常由笔记本、平板、传感装置等构成。借助系统感知层,能辅助学习者感知及取得不同形式的学习资源。信息来源通常是学生信息系统、作业系统等[5]。详见图1。

图1 个性化自适应系统总体框架

3.2 模型流程

结合图1的总体框架结构模型,简单分析系统运行过程。

在自适应系统下,学生能按照个人学习需要确定具体的学习单元。正式开始学习时,系统能大致分析学生当下的知识掌握状况,如相关定义、过程类知识、高级思维等,学生需参与学前测试。

基于学生的学前测试结果,获取学生每道题耗时、正确率等,并借助聚类方式完成学生的基础建档。个性化的自适应引擎,则按照建档情况与领域知识模型,给学生推荐“定制化”的学习资料。

学生在学习期间的所有操作行为,都会以数据的形式保存在系统数据库内,具体有:学习需要、学前测试、过程操作、单元测试等内容。另外,数据库中还会储存学生个人的完整资料信息。

在学习行为结束后,系统会根据学习的内容生成单元测试题目,并基于单元测试结果形成学习者的知识模型,系统能把此类信息全面反馈给学生,使其能对自己单元学习的成效形成一定的了解。

在自适应系统运行中,能够自动采集学生数据库内的学习操作行为、测试信息。而后自适应引擎会基于学生近期的学习行为信息,持续预测学习失败的概率,将预测结果转移到系统相应的管理单元中,让教师与管理者能有效对学习者予以必要指导及干预。

自适应系统会自动采集学生数据库内有关学习经验等方面的信息,同样借助关联规则,提炼出单元学习的次序和最终成绩的关联性。基于此,系统学习引擎按照当下的学习内容,给学生推送个性化的学习信息。除此之外,系统结合学生已有的学习经验,逐步完善优化领域知识模型。

把各项知识点通过“有向图”的形式构成“知识地图”,把知识点分成前驱与后继两个部分,用于显示知识点的联系。个性化自适应系统基于领域知识模型并结合学生的学习经验,加以优化调整。学习引擎按照知识模型,不仅能给学生提供最优的学习路径,还能基于学生目前的学习路径与相应阈值,衡量学生目前有无偏离设定的路径。

自适应系统在运行期间会不间断采集学生数据库内的互动交流信息,确定其社交网络。学习引擎借助协同过滤的手段,分析各位学生之间在学习喜好方面的相似度,实现准确性的偏好预测,以此筛选出学生容易被吸引的知识内容与活动,为其推送“定制化”的学习资源。

个性化自适应系统工作中,学生的学习信息会得到循环应用,而且支持不间断更新。根据图2所示,系统各个模块中的信息会在数据不间断地更新中持续调整。学生在参与学习中,形成的数据信息会保留在个人数据库内。系统会基于学生数据库内的信息,建立领域知识模型及学生模型等,自适应引擎则基于模型及学生当前的操作行为情况,实施预测及推送,确定最优的学习路径以及个性化的学习资料。学生在学习新知识期间,会形成新的行为信息,同时保存在数据库内,自适应系统基于产生新信息,持续调整各项支撑模型。联系学生目前学习行为信息,对其今后的学习需要加以预测,并改变资源推荐的方案,把动态化的信息反馈给学生。

图2 数据循环应用

4 个性化自适应系统支撑模型的实现讨论

4.1 领域知识模型

领域知识模型为自适应系统的核心关键,包含教学目标、学科结构、习题、学习资料等,如图3所示。在设计模型中,应先确定其中包含的每项要素之间内在联系,比如优先次序,同时还应明确基本属性与语义标准。此支撑模型的特征如下:

图3 领域知识模型的一般结构

其一,学习资源对象的实际风格状态。假设学习资源对象在各个学习风格层面上均有存在值,此时其风格能用下述公式表示:

其二,领域知识本身的难度级别,其同样要教师确定,分成“容易”“一般”与“困难”三种,具体用下述公式代表:

4.2 学习者的模型

学习者支撑模式是针对学生表现出的特征数据,进行抽象性的表述,实际反映在其进行学习行为期间的学科知识情况、目标与认知偏好、风格等。而形成学生特征的信息包括个体自主反馈(显性)和系统交互期间形成的历史操作信息(隐性)。其中,自主反馈内容是来自于用户注册系统操作中填写的信息资料。该类信息的不足主要是用户的自我认知准确性对特征分析有一定的影响;优势为能在用户使用系统前,大体上判断学生的风格。而隐性信息是根据学生自身开展的一系列学习操作,提炼出其兴趣偏好。该类信息的使用优势是不会被学生用户干扰,能随时掌握学生的兴趣调整,而不足便是显性数据的优势。为提升对学习者特征判断的准确性,需把二者结合运用,其中信息内容有:用户基本资料、认知能力、学习经历等。此支撑模型的基本特征为:

一是学生基本信息。此类内容在学习全过程都不会发生调整。二是学习风格。基于风格量表,能得到四元组表达式,其与领域知识模型的学习资源对象风格表述方式类似,此处不进行详细参数说明。三是学生认知能力。其能用表示,描述对于领域知识,学生的掌握情况。其中的Mi是指学生对知识单元“i”的掌握情况。在各知识单元中,学生认知情况,能用下述公式表示:

式中,kN是指知识点;A代表知识点能否适应学生;V是指知识点当前有无被访问;T代表知识点有无被测试;AL是指知识点的掌握情况。其中A、V和T均取“0”或“1”,系统默认值是“0”;AL的取值“1”“2”和“3”,分别表示不同的掌握情况,而对此的量化评价是通过学生用户的任务完成状态决定。

四是学习历史经历。包含学生用户近期访问资料的操作。五是学习偏好。这是通过学习者自主提供的信息,如留言、评价数据、输入关键词等,把各项偏好数据,实施分词处理,筛选出关键名词,由向量空间模型描述。鉴于学生用户提供数据的行为属于连续操作,所以在筛选关键名词中,会设定为“最近访问”[6]。

4.3 自适应引擎

个性化的自适应引擎,是基于学习者的支撑模型,评估学生用户的知识储备和认知能力,实时提供与学生高吻合度的知识内容资源及呈现形式,同时不间断对学习过程实施监测及管理,基于此,维护及更新学习者模型。其运行机理为:按照学习者模型及目标,确定服务策略。并会一直监控学习情况,保留学习过程的历史资料。在完成学习后,及时评价学生用户,以此判断服务策略的有效性。而上文提到对学习行为的外在干预具体为:教师影响,其基于实际的教育进度、课程安排、个人经验、对学习者情况的了解,对系统服务策略实施强制性干扰,变成引擎规则;群体类干预,学生用户所处群体环境,在学习进行中,对其学习策略的制定,产生指导性的价值,一般会运用协同过滤算法。而在自适应引擎中,情感诊断、路径与资源推荐,属于其中的核心内容。

首先,情感诊断。学习情感通常是借助表情及文字传达出来,系统对学生用户在学习实践中的表情、和他人交流中的文字内容,捕捉到学生的情感信号。其中的表情信号来自面部与身体姿态,通过识别计算,确定情感状态。具体是基于对面部的识别,提取表情特征,借助相应的分析字典,计算出当下的情绪倾向。在文字内容上的识别,需运用网络爬虫与文字截取,得到学生用户的交流文字,筛选出敏感内容,基于情感字典,确定当前的情绪倾向。

其次,内容呈现。个性化的学习内容,具体反映在两个呈现维度:首次学习内容,基于学前测试状况,完成聚类建档,给各个类别的学生予以基础的个性化内容;在对学生某个单元完成相应测试后,基于作答状况,优化学习者模型,倘若测试合格,可安排进入下一单元,若没有合格,会根据答题过程与结果等各项资料,改变学习内容。其中,聚类是将具有相似性的对象,分成多个“簇”。借助对学前测试结果的采集,实现聚类建档。该算法的关键在于在聚类的Y个对象里,挑选N个对象,视为聚类中心,而后计算其他对象与之的间距,由此配置给具有相似性的聚类。下一步则重新确定聚类中心,不断循环进行该过程,直至没有对象可以影响聚类结果。本系统对于学前测试,采取二次聚类。

再次,路径推荐。在个性化的自适应系统中,路径推荐涉及两个层面,即知识点的学习路径与资源的输出路径。基于系统知识模型,对各知识点学习的次序,并非完全根据完整的知识框架关系确定,或是根据学生所处群体中的普遍学习路径,或是学生用户个人倾向自主确定具体要学习的内容,该过程存在诸多形式及数量的资源作为支撑,同时,每位学习者对具体知识点对应资源的梳理过程也有差异。因此,应借助自适应引擎,基于学生用户特征模型,给其推送定制化的服务路径。蚁群算法是20世纪90年代初被提出的群体智能算法,是对蚁群觅食行为进行模拟,蚂蚁觅食期间,经过的地方会留下“信息素”,后来的蚂蚁能基于对信息素的辨别,走向信息素最多的道路,由此得出最佳的觅食方向。国内部分学者认为路径推荐的系统和蚁群觅食类似,把学生用户视为蚂蚁,相应的学习目标当成寻找的食物;而学生用户对获取知识点的评价,等同于信息素;推荐路径则为最佳觅食路径。本文所述系统,根据领域知识模型,确定一项多种群选择路径的算法。学生用户在各自群体范畴中,也就是现实中的学习小组、校园群体等,或是以某学习兴趣为基础,组成的线上群体。而站在学生用户的角度,在各群体成员,留给其的“信息素”及数量都会有差异,这会使各群体成员的评价结果携带的权值有区别,由此能得出最贴合学生个性化特征的路径。

最后,学习资源推荐。协同过滤算法属于目前使用效果较优的推荐算法,运行基本思路为:借助对各位使用者之间的类似偏好,进行资源推荐。该算法和其他算法相比较,能够支持推荐无法有效分析出内容的资源,比如资源质量等。同时,个性化水平偏高,可以管理常规机器系统不能自动判断分析出的信息,因为分享其他用户评价及经验,所以共享水平较高。但该算法也有不足,例如,用户信任、冷启动等。本文所述学习系统,根据协同过滤方式,确立加权的协同过滤算法。生成“项目-用户”的评分矩阵,利用权值启动法,以克服该类算法的稀疏矩阵及冷启动不足,联系学生用户的学习风格、知识框架、兴趣倾向等指标,同时也要注意教师干预,把各项条件转变成权值,完成矩阵的原始填充。在系统运行期间,根据学生用户的操作变化,实时更改评分矩阵,借此能处理用户信任的缺陷。另外,因为需要在大数据平台中运行,还应注重不同算法并行的情况。

5 结语

在如今的“教与学”过程中,融入大量信息化的元素,把动态化的行为过程以数字化的形式保存下来,由此形成的数据资源,能给教学安排与过程调整、效果优化提供客观性的决策依据。上文立足于大数据的总体背景,以及现代人才培养对个性化学习的要求,探讨建立新型自适应学习系统的根本方向,得到领域知识、学习者与自适应引擎三个系统支撑模型,根据学生用户的系统使用表现与其他干预因素,判断其个性化的学习需要,以此向其推荐适宜的学习路径及资源,实时提供正面激励,维系其学习兴致。

猜你喜欢

学习者个性化知识点
一种融合PageRank和PersonalRank的多层个性化推荐算法
一张图知识点
一张图知识点
第四页 知识点 歼轰-7A
你是哪种类型的学习者
坚持个性化的写作
十二星座是什么类型的学习者
青年干部要当好新思想的学习者、宣讲者、践行者
上汽大通:C2B个性化定制未来
关于G20 的知识点