网络学习资源个性化推荐研究现状与发展趋势*
2018-12-07陈明选
耿 楠,陈明选
(江南大学 教育信息化研究中心,江苏 无锡214122)
一、引言
随着教育信息化2.0时代的到来,教育大数据、学习分析、人工智能等技术的迅猛发展,教育形态将会发生深刻改变,促进学生个性化发展也成为核心诉求。实现学生个性化发展,离不开个性化学习的支持。然而,我国教育目前仍然以传统班级授课制为主,由于学生人数众多,教师很难凭借个人能力做到“因材施教”,结果是难以满足学习者个性化的学习需求,阻碍了学生的个性化发展。同时,网络学习资源的爆炸性增长,也给学习者带来了信息迷航与过载的问题,阻碍了学习者精准定位适合自己的学习资源。国内外相关研究认为,网络学习资源个性化推荐的智能服务不仅能够解决学生的个性化需求问题,并且能够有效避免信息迷航与过载的情况。因此,相关研究得到了国内外教育领域学者的广泛关注。
推荐系统最早普遍应用于电子商务、娱乐及其他领域,它是帮助用户确定符合用户需求的商品、服务或资源等内容的一种计算机技术。2000年,推荐系统开始出现在国际教育领域,截至2015年,国际上已有35个国家开发了82个支持学习的推荐系统 (Manouselis,N.et al,2012),然而这些系统多半为原型设计,实现系统开发并投入教学实践的案例较少。2007年,我国教育领域开始关注网络学习资源个性化推荐研究,早期关注推荐技术的实现,逐渐开始关注网络学习资源个性化推荐模型建构和系统设计方面的研究。2011年,王永固等人提出网络学习资源个性化推荐的定义,即推荐系统根据用户的个性化特征,如兴趣、爱好、职业或专业特点等,主动为用户推送适合其学习需要或可能感兴趣的信息资源的一种推荐技术(王永固,2011)。近些年来,科大讯飞、极课大数据等互联网教育公司也开始开发带有个性化推荐功能的教学辅助系统。
由此可见,无论从学术研究还是实践应用的角度来看,网络学习资源个性化推荐研究对我国教育发展都有十分重要的意义,是能够支持学习者个性化发展和解决信息迷航与过载问题的有效方法和关键途径。然而从微观上看,网络学习资源个性化推荐在我国的研究现状与发展趋势是怎样的?国内学者已经做了哪些重要工作?它是如何解决教育问题并推动教育发展的呢?目前学界对此分析的文献较少,相关研究者很难通过文献阅读迅速了解该领域的研究现状与发展趋势。因此,本研究旨在通过内容分析法对该领域核心期刊文献进行梳理、剖析和总结,以期揭示该主题的研究现状、发展趋势与未来研究关键点,为相关研究学者开展研究提供一定的借鉴。
二、研究设计
1.研究样本
笔者于2018年6月1日登录中国知网 (CNKI)期刊数据库,以“网络学习资源个性化推荐”、“学习资源个性化推荐”、“个性化推荐”、“个性化推送”为主题进行检索,选取核心期刊,通过阅读摘要和关键词剔除无关文献,最终得到相关文献36篇作为研究样本。
2.研究方法
主要采用内容分析法。
3.研究类目及分析单元设计
研究类目确定主要从两个角度考虑,首先是文献概况,包括文献总量、文献来源、研究结果三个维度;其次是研究内容,根据推荐系统包括的三个重要模块(用户建模模块、推荐对象建模模块、推荐算法模块)来确定,包括学习者模型、推荐对象模型、推荐算法三个维度。因此,本文主要从以上六个维度入手分析,在细节处全面阐释研究现状及发展趋势。
4.数据统计
各类数据统计和图标生成均采用Excel2016软件。
三、文献概况统计分析结果
1.文献总量
从图1文献发表量分布情况来看,网络学习资源个性化推荐研究在我国发展呈稳步增长态势。个性化学习推荐系统首次出现在核心期刊中是2007年陶剑文和姚奇富在《计算机应用》杂志上刊登的《基于Web使用挖掘的个性化学习推荐系统》,他们在推荐系统中引入多Agent系统,提出一种基于最少使用策略的系统推荐算法,有效帮助学习者找到所需的资源信息(陶剑文、姚奇富,2007)。截至2013年的15篇文献,研究关注内容依然以网络学习资源个性化推荐的技术优化与实现为主。2014年起,研究成果量明显增长,教育技术领域关注较多,且对网络学习资源个性化推荐的关注角度从技术实现角度转向系统设计模型构建角度,并逐渐引入情境感知技术和教育理论,真正开始考虑教育情境不同于其他商业领域的特殊性和复杂性。
2.文献期刊来源分析
图1 网络学习资源个性化推荐文献发表量分布图
分析文献的期刊来源可以知晓一个研究领域的核心关注群体所在。由图2可知,到目前为止网络学习资源个性化推荐相关论文共发表于10种核心期刊。载文期刊种类大致属于计算机技术和教育技术两个领域,计算机技术领域的期刊有2种,每种载文量均为1篇;教育技术领域的期刊有7种,所载论文量共33篇,占到了总体的90%以上,可以认为《电化教育研究》、《中国远程教育》、《中国电化教育》、《现代教育技术》、《远程教育杂志》等为网络学习资源个性化推荐研究的核心热门刊物,从以上刊物中可以发现网络学习资源个性化推荐研究的最新成果和动态。此外,这类论文亦出现在《高等工程教育研究》这种教育类期刊中,说明不少其他教育领域的研究者也都关注着网络学习资源个性化推荐研究给教育带来的契机与变革。
图2 网络学习资源个性化推荐文献期刊来源分布图
3.研究结果分析
分析文献的研究结果分布能够了解一个研究领域的研究热点所在。如图3所示,在本研究选取的36篇文献中,占比最高的是个性化学习资源模型构建和推荐技术改进研究,分别是35%和30%。其次就是个性化学习资源系统平台的设计研究,占比达到19%;学习者模型、领域知识模型相对较少,分别是8%和5%。实证研究奇缺,仅有1篇,是刁楠楠和熊才平等人发表的《基于智慧信息推送的个性化学习服务实证研究——以“文献选读与论文写作”课程为例》,虽为实证研究,但该研究的推送功能实现方式是人工采集数据、分析,人工将学习者分类,教师手动推荐对应资源;虽然是网络学习资源个性化推荐的实证研究,但其智能性与我们理想的智能推送差距较远。这说明我国网络学习资源个性化推荐研究的发展尚停留在模型建构与系统开发阶段,与真正投入到教学实践应用中的距离尚远。同时,笔者对这36篇文献研究所使用的平台和关注的资源类型进行分析发现,2007至2010年,研究与E-learning、网络教学、资源服务、虚拟学习社区等平台结合得较为紧密;2011至2014年,研究者则开始关注在线学习资源,细化到移动学习资源、泛在学习资源等概念;2015至2018年,相关研究开始关注教育大数据环境、云环境、情境感知技术对网络学习资源个性化推荐研究的支持。由此可见,网络学习资源个性化推荐研究从关注平台功能实现,到关注服务资源类型,再到关注在教育信息化的时代背景下,网络学习资源个性化推荐研究的服务环境和服务体验。
图3 网络学习资源个性化推荐研究结果类型分布图
四、文献研究内容分析结果
网络学习资源个性化推荐研究关键的三个模块包括学习者模型、领域知识模型、推荐算法,学习者模型是实现个性化的基础,领域知识模型是提供高质量资源的关键,推荐算法是智能技术实现的必要途径。因此,笔者从这三个维度对这36篇文献进行深入分析,以期能够得出我国目前网络学习资源个性化推荐研究的现状、趋势与问题瓶颈所在。
1.学习者模型构建概况
学习者模型用于描述学习者内部和外部的学习特征,已有研究将学习者模型分为学习者知识模型,即学习者知识状态的描述;学习者认知模型,即学习者对核心知识的认知水平;学习者情感模型;学习者行为模型,即学习者在学习过程中的所有学习行为,主要是在线学习行为,比如登录、浏览、收藏、下载、评价等(马志强、苏珊,2016)。我国的CELTS-11学习者模型规范是在PAPI学习者模型规范基础之上,经过分析我国教育实际情况而制定的,主要包括八个方面的信息:个人信息、学业信息、管理信息、关系信息、安全信息、偏好信息、绩效信息、作品信息(孙力、张婷,2017)。
经统计,在36个研究样本中,有33篇文献进行学习者模型构建,笔者对其学习者模型构建的数据来源及构建内容进行分析,结果如表1所示。研究者最为关注的学习者模型构建维度是学习风格,有29篇文献提及,学习风格数据的采集方法主要有:用户系统选择或填写;用户填写学习风格量表(常用的是Felder-Silverman量表)进行专业评估;由于学习风格的变化性,也有相关研究使用用户填写与学习者行为数据分析相结合的方式,静态获取,动态分析调整学习者的学习风格。其次是最基本的个人信息,有14篇提及。研究者对学习行为的关注度处于中等水平,主要是因为学习行为数据的获取和处理分析的难度较大,主要依赖于在线学习系统,线下教学的学习行为数据就非常难以采集。对知识状态的关注有6篇文献,主要是对学习者的知识掌握状态,学习成绩、认知水平和知识结构的分析,这是发现学习者需求的最关键来源。除了学习者自身状态以外,情境信息也是判断学习者需要哪种类型资源的重要判断依据,多采用无线射频技术来采集,用于移动学习和泛在学习中。服务质量属性是在网络学习资源个性化推荐发展到一定阶段以后应该关注的内容,不仅要为学习者提供功能性的支持,更要有系统的服务,数据来源主要是用户评价数据。
虽然学术界已有很多关于学习者模型构建的研究,但本研究是从网络学习资源个性化推荐系统中学习者模型构建的角度出发,对其进行深入剖析。由分析结果可见,我国网络学习资源个性化推荐研究中学习者模型的构建仍然以偏好信息为主,有推荐技术从其他领域移植过来的明显痕迹;对知识状态的构建和情境信息的采集较少,然而在教育教学中,学习者深处的学习情境以及学习者目前的知识状态才是精准定位学习者学习需求的重要参照依据。
2.推荐对象模型构建概况
推荐对象即系统为用户推荐的资源或信息,在支持学习的个性化推荐服务系统中,推荐对象模型构建即,为了对学习资源库建模,需要提取每一个学习资源的特征,构建学习资源库模型。经统计,36个研究样本中有26篇文献提及推荐模型构建(知识模型构建),笔者对推荐对象构建维度、数据来源方法及各维度出现频次进行分析,结果如表2所示。本研究将推荐对象构建维度分为三类,分别是基本信息、生成性信息及两者的结合。首先占比最大的是基本信息,26篇文献中有18篇提及,即学习资源的内部特征,主要包括学科类别、内容主题、资源类别、格式信息、交互方式等内容,它的数据来源方法主要有采用本体技术、深度学习技术、语言处理模型、人工标记、节点树等方法为资源添加标签;比如,荆永君等人开展的基础教育资源网中个性化资源推荐服务研究里构建学习资源模型时,采用向量空间模型将资源的适应对象、所属学科、内容特征等基本属性数据结构化(荆永君等,2009)。其次是用户生成性信息,只有4篇单独提及,指的是用户使用资源后生成的资源附加特征,比如资源使用记录、用户评分数据等,这类信息的来源多为用户标记资源、用户评价资源、用户使用资源的学习行为数据;比如,白雪等人在基于标签的教育资源管理与推荐模型构建研究中,对教育资源模型的构建就是采集用户标记、收藏、使用资源行为数据 (白雪等,2014)。第三类则是前两者的结合,有4篇文献,基本信息多为静态信息,即采用计算机技术或者人工标记的方法构建学习资源模型,而生成性信息则为动态信息,根据学习者的学习行为动态更新学习资源模型,两类信息的结合,可以避免最初没有用户生成信息的冷启动问题,同时通过用户评分等信息可以避免资源老化不符合学习者需求的问题。比如,王永固等人在基于协同过滤技术的学习资源个性化推荐研究中采用的就是将资源基本信息库和用户资源评分数据表两个维度结合在一起,使资源的推荐更加精准(王永固,2011)。
表1 我国网络学习资源个性化推荐研究:学习者模型构建情况
表2 我国网络学习资源个性化推荐研究:推荐对象模型构建情况
由此可见,从我国网络学习资源个性化推荐研究系统来看,其推荐对象(学习资源)模型构建维度较为单一,以基本信息维度为主、用户生成性信息为辅。且多数研究在基本信息维度对学习资源的特征描述非常简单,通常为单一维度下的单一特征,比如资源类别、媒体格式、学科属性、知识点等一两种特征的组合。然而,在个性化学习资源的推荐过程中,学习资源模型的构建是关键,是能够为学习者推荐符合其学习需求的高质量学习资源的核心依据。因此,笔者建议研究者在进行学习资源建模的过程中,以基本信息为本,分析用户生成性数据,动态更新学习者模型。
3.推荐算法使用情况
推荐算法是通过计算用户与用户、项目与项目的相似性,得出用户与项目的匹配度,最终实现推荐的计算机算法。常见的推荐算法有基于内容的推荐 (Contentbased),即为用户推荐与他曾经喜欢过的内容类似的项目;协同过滤推荐(Collaborative-based),为用户推荐与他品味相似的用户喜欢的项目;基于人口统计学的推荐(Demographic-based),根据用户的个人简历为用户提供推荐;基于有用性的推荐(Utility-based),即对每个项目对用户的有用性计算,为用户推荐最符合其需求的项目;基于知识的推荐(Knowledge-based),即根据用户偏好的逻辑推理为用户推荐项目;混合推荐算法(Hybrid recommendation technique),将以上几种推荐技术混合使用;还有基于关联规则的推荐等多种推荐算法。每种推荐算法都有优势和劣势,适用于不同的情境。在网络学习资源个性化推荐的研究中,推荐算法是系统实现的必要途径,笔者对本研究选取的36篇文献进行深入分析,了解到目前网络学习资源个性化推荐领域使用的推荐算法情况,如图4所示。使用最多的推荐算法是相似度匹配度的计算和协同过滤算法;其次是混合推荐算法和关联规则挖掘,其中混合推荐算法多为协同过滤算法与基于内容的推荐算法相结合;其他推荐算法较为少用,比如基于知识的推荐,2015年才有研究者开始关注。随着教育大数据技术的迅猛发展,传统推荐算法无法处理大数据量,部分研究已经开始引入新的算法以支持大数据的分析,比如丁继红和刘华中在大数据环境下基于多维关联分析的学习资源精准推荐研究中引入“多维关联分析”并采用“张量”的算法(丁继红、刘华中,2018)。
图4 我国网络学习资源个性化推荐研究:推荐算法分布情况
由此可见,在我国网络学习资源个性化推荐研究领域,推荐算法的使用与电子商务等最早使用推荐系统的领域所使用的推荐算法极其相似,这是因为当推荐系统从电子商务等领域迁移应用至教育领域时,多数研究者直接选取较为成熟的推荐算法,比如协同过滤算法和关联规则挖掘等。随着网络学习资源个性化推荐系统研究的深入,一些学者意识到教育领域的特殊复杂性,开始引入更加适用于教育领域的推荐算法,比如基于知识的推荐。随着教育大数据的发展,一些专家学者也引入了新的推荐技术。由此说明,教育领域推荐系统推荐算法的选择取决于教育信息化的进程和教育领域特殊性。
五、结论与展望
本研究通过对36篇网络学习资源个性化推荐研究相关文献各维度的数据统计和内容分析,对该领域的研究现状、发展趋势以及未来研究关键点得出以下认识。
1.研究现状
(1)我国网络学习资源个性化推荐研究领域研究发展多元化,目前处于稳步发展阶段
网络学习资源个性化推荐研究是支持个性化学习和解决信息迷航与超载问题的有效途径,是实现系统性自适应学习服务的关键功能部分。自2007年,我国计算机领域研究者开始关注推荐技术在E-learning平台的应用与优化,几年后,教育技术领域研究者开始关注和研究,并形成了主要的研究团队,比如东北师范大学以赵蔚、姜强为主的研究团队,浙江工业大学以王永固等人为主的研究团队都在该领域进行研究并产出了具有代表性的研究成果。目前,网络学习资源个性化推荐研究的关注度呈整体上升趋势,从文献研究结果的分析可见其发展多元化,处于稳步发展阶段。
(2)我国网络学习资源个性化推荐研究偏重模型构建、系统设计与技术实现,与一线教学实践距离较远
已有的文献研究结果表明,目前模型构建和系统设计以及技术实现的文献占比最高,且研究结果通常为一种网络学习资源个性化推荐模型、推荐技术的优化与引进等,真正将其投入到学习系统中使用的,还不能做到十分的个性化,比如2011年创建的极课大数据公司开发的教学辅助系统,它可以为学习者提供个性化学习资源,比如错题重做、弱项精练等,但是笔者对使用该系统的学习者进行访谈发现,用户认为该系统的学习资源并不符合其真正的学习需求,会过难、过易,甚至根本就不需要。这就需要研究者从教学本质出发,从发现学习者的真实需求出发,来进行网络学习资源个性化推荐的研究。
2.发展趋势
(1)推荐粒度由群体化走向个体化
推荐系统最初采用Top N、关键词检索、最新资源推荐、关联规则推荐等技术实现群体推荐;随着资源的爆炸式增长,推荐系统需要有更加智能和个性的服务才能满足学习者的需要,因此开始采用基于内容的推荐、协同过滤推荐、混合推荐技术等为学习者提供个性化的学习资源。从群体化走向个性化是实现网络学习资源个性化推荐的首要环节。
(2)推荐内容由单一的学习资源走向多元的学习服务
早期推荐系统的主要功能旨在为用户提供合适的学习资源,而现在更多的研究者开始认为网络学习资源个性化推荐是一种系统化的服务,尝试为学习者提供学习资源、学习路径、学习伙伴等。比如,李宝等人基于教育大数据,构建了个性化资源推送服务框架,旨在实现使个性化推荐走向支持学生学习全过程的一种个性化服务。
(3)推荐技术由计算机算法走向与教育原理相融合
网络学习资源个性化推荐研究初期关注推荐算法的优化与实现,多采用电子商务等领域应用成熟的推荐技术,直接迁移到教育推荐系统之中,比如基于内容的推荐、协同过滤推荐技术等。然而,却出现推荐精准性较差不能完全符合学习者需求的情况,这是因为教育教学系统是极其复杂的,需要考虑教育教学的本质。因此,一些研究者开始将强化理论、主动学习理论以及认知主义理论等融合到网络学习资源个性化推荐机制的设计与开发中去。回归教育本质,从教育视角为学习者提供个性化的学习服务。
(4)推荐系统由孤立存在走向与学科结合
网络学习资源个性化推荐系统在初期给用户推荐的学习资源内容是泛化的,没有明确的学科性,目前,专家学者在进行网络学习资源个性化推荐研究时,会开始关注利用本体技术构建知识结构,并将学习资源与知识本体相结合,大多数研究案例选取的是知识点关联紧密、逻辑性强的学科,比如程序语言、数学和物理等科目。结合学科特征才能提高网络学习资源个性化推荐的精准性。
(5)推荐环境由数字化学习平台走向智慧学习环境
推荐系统应用于教育领域初期,大多嵌套于数字化学习平台、自适应学习平台之中,作为该平台的一项功能存在。随着教育信息化的发展,有了教育大数据和学习分析技术的支持,推荐系统服务的环境由单一的网络平台的推荐功能实现走向关注移动学习环境、泛在学习环境、智慧学习环境以及云环境的网络学习资源个性化推荐服务。
(6)涉及领域由在线学习扩展到传统课堂
网络学习资源个性化推荐依赖于计算机技术实现,需要采集学习者的在线学习数据,因此早期多应用于在线领域,比如数字资源服务平台、网络教学平台等,以及近几年新兴的MOOC学习平台。随着基础教育信息化的发展,为基础教育传统课堂数据的采集提供了技术上的支持,因此一些研究者和商业平台开始关注传统教育的网络学习资源个性化推荐服务的实现,这部分的研究与应用处于起步阶段。
3.未来研究关键点
回顾历史才能更好地开创未来。通过对国际网络学习资源个性化推荐研究与应用发展脉络和最新进展的梳理,了解到该领域的发展历史与现状,知晓该领域的最新进展,从而预估其未来的发展趋势。个性化学习资源推送研究的进一步丰富和发展,需要注意以下关键点。
首先,网络学习资源个性化推荐研究从教育视角出发是根本,这是技术发展的必然,也是学习环境发展的必然。要从根本上解决学习者的学习需求,提高推荐效果,离不开教育理论的指导。其次,网络学习资源个性化推荐研究应与教育过程相结合,学习者的需求并不仅仅是对具体学习资源的需求,还在于他们在学习过程中有各色各样的个性化学习服务需求。最后,网络学习资源个性化推荐研究仍处于发展期,国外研究注重个性化学习资源推送系统的设计和开发,国内研究则注重个性化学习资源推送模型的构建,后期研究重心应放在这些系统模型在具体的教育教学实践中的应用,从根本上推动教学改革与创新。