基于个性化的微课视频教学推荐系统分析与设计
2019-09-25明巧英
明巧英
(西安翻译学院 工程技术学院, 西安 710105)
0 引言
信息化浪潮的推动,使得微课变的炙手可热,在这种形势下一批优秀的微课资源网站涌了出来。学习者在“规模巨大”的网络微课资源中学习的确方便了很多,然而这种“规模巨大”的信息所成就的学习者充实感的背后,却使其置身于“信息迷雾”。学习者很难快速地从众多的视频中找到自己想要的内容,甚至关于同一知识点的微视频就有多个,学习者无法确定哪个是最优的,这种境况给学习者带来了一定的麻烦。 虽然搜索引擎技术使这种境况有所好转,但用户自己组词表达需求时,往往会因各种原因很难找到满足需要的资源,再就是结果页面中的资源并不一定都与用户的需求相吻合,因为提供检索服务的搜索引擎并不关心用户。不论用户的兴趣爱好如何,使用习惯怎样, 只要输入的是相同的检索关键词,就会返回相同的资源列表。因此,用户不再满意这样的信息获取方式,用户希望系统能够知其所想所需,当用户在繁多的信息中举棋不定时,系统能够像知己一样提供所需,这样不但节约了学习者寻找所需资源的时间,而且对于学习者来说具有一定的针对性,能更好的提高其学习效率。这就用到了能够克服传统资源检索缺陷的个性化推荐技术。目前,电子商务领域已成功应用了个性化推荐技术。本研究在微课系统的微视频资源推荐中引入了个性化推荐技术,以使学习者能有更好的学习效率。
1 文献综述
1.1 微课程的概念
早在2008年,美国新墨西哥州圣胡安学院的戴维·彭罗斯(David Penrose)教授就提出了微课程的概念[1]。微课程是信息化环境下,教育资源的创新,它是为满足学习者的需求,由教育者针对某一主题或知识点,精心设计的以视频为主要载体,包含课件、习题、测评等多环节的网络教学共享资源的集合,其课程教学目标明确,教学方式形象,可使学习者在短时间内汲取知识。微课程因其短小精悍、开放性、网页化、情景化、动态生成课程资源、交互性强的应用环境等风靡全球。
微课系统是以针对性强的微视频为主题,主要给学习者提供学习资源的系统[2]。
1.2 个性化学习理论
所谓个性化学习是指以建构主义理论为基础,以学习者的兴趣和需求为中心,在整个学习过程中强调学习者的主体地位,并根据学习者的个体差异及发展潜能采取灵活多样的教学方式。
1.3 个性化推荐技术
系统依据用户的需求、个体特征等,主动向其推送需要的或可能感兴趣的信息,我们就可以说这个系统具有个性化推荐技术。个性化推荐还可以为目标用户推荐与其相似用户群的偏好信息资源[3],即共享用户间的经验。它的工作原理是:先收集用户信息,然后依据用户信息建立相应的兴趣模型,再在信息资源库中寻找与其匹配的资源进行推荐。按个性化推荐实现的算法和方式的不同,把个性化推荐分为:基于内容的推荐、基于关联规则的推荐和混合型推荐。本研究分析比较了各推荐算法及方式,最后采用协同过滤推荐。
协同过滤推荐技术在电子商务中的应用已经取得了很大的成功,正因为如此,越来越多的教育专家学者,希望把它引入学习系统,以达到因材施教,提高教学效果的目的。现实生活中与个性化协同过滤推荐技术有异曲同工的现象常常存在,比如人们在选择商品时,有时会因其种类繁多而很难做出选择,这时就会寻求指点,咨询日常与自己情况或喜好相似的人,进而做出决定。
2 微课系统的关键技术应用分析
如图1所示。
图1 基于用户的协同过滤算法的主要步骤
是基于用户的协同过滤算法的主要步骤,先根据用户的行为日志数据计算其相似度,相似度的计算结果是用来确定与目标用户具有相似兴趣或需求的其他用户的,就是邻居用户。然后以邻居用户对视频的兴趣来估算目标用户对没有看过的视频的兴趣度,最后找出兴趣度(邻居评价)最高的前几个视频将其推荐给目标用户[4]。
2.1 相似度算法应用分析
协同过滤推荐技术会涉及计算项目相似性及用户相似性,关于相似性的计算方法较多,常用的相似性衡量标准有:基于相关的相似性度量、基于欧几里德距离的相似性度量、基于标准的余弦相似性度量、基于修正的余弦相似性度量等。经分析比较,本研究选用基于修正的余弦相似性度量方法。
不同的用户对项目有不同的评分标准,所以在计算相似性时会有较大的误差。减去用户对项目的平均评分来改进算法是基于修正的余弦相似性的计算方法,计算公式如公式(1),其目的是减少用户不同的评分标准带来的问题。
公式(1)中,Rx,m表示用户x对项目m的评价评分,同理Ry,m表示用户y对项目m的评价评分;RX代表用户x对所有项目评分的平均值,同理RY代表用户y对所有项目评分的平均值。
2.2 协同过滤推荐技术应用分析
协同过滤推荐是这样进行假设推理的:若一些用户对一些项目的评分相似,可推出他们对其它项目的评分也应是相似的;如若大部分用户对一些项目的评分相似,可推出当前用户对这些项目的评分也相似。如式(1)。
(1)
协同过滤推荐系统用统计技术搜寻目标用户的最近邻,再依据最近邻对项目的评分来预测目标用户对项目的评分,进而产生相应的推荐列表。所以获取用户信息、表示用户信息、形成邻居、产生推荐是协同过滤推荐中必不可少的流程。
2.2.1 获取及表示用户信息
与用户有关的数据主要有:用户注册信息、用户的学习数据(学习内容、学习测试等)及用户的行为日志。该研究把用户对视频资源的评分作为主要的用户行为数据,用户对视频资源的评分被分为显式评分和隐式评分。显式评分是指用户直接给视频资源打的分。隐式评分指的是记录用户行为(观看时长、频率等)的数据[5],把其加权转化成用户对资源的评分。显式评分比较直观,能准确的反映出用户对视频资源的喜爱程度,但由于要专门进行评分操作,所以会带来一些不便给用户;隐式评分是经过分析用户的相关信息而间接得到的,不会给用户带来额外的操作,但在某些情况下,相关的数据是不能准确反映出用户的喜好的,这必会使评分的准确性降低。
获取的数据被协同过滤技术用用户-资源评分矩阵来表示[6]。如表1所示。
表1 用户—资源评分矩阵
第x行第m列的元素Rxm代表第x个用户对第m个资源的评分。
2.2.2 形成邻居
寻找目标用户的邻居是协同过滤技术最核心的步骤。与目标用户x具有相近或相同兴趣的用户群就是目标用户的邻居。目标用户x与其他用户y之间的相似性计算是:先筛选得到用户x与用户y都评分的资源的集合Resx,y=Resx∩Resy,然后利用相似性度量方法—修正的余弦相似性度量法计算俩用户之间的相似性。
3 微课系统个性化推荐模型/功能的设计
3.1 微课系统总体架构设计
微课系统的总体架构,如图2所示。
图2 微课系统总体架构图
微课系统中个性化视频的推荐是整个系统的核心。在系统的总体设计方面,把其分为两大部分:基础数据管理和推荐管理。其中用户的所有信息和微课的所有资源、信息为最终的推荐提供相关的数据支持,供推荐模块把预测的用户最满意的微课视频推荐给用户,所以它们是作为整个推荐系统的基础数据而存在的。
用户信息库主要是对用户的注册信息(显式信息)进行维护的,即用户类型、年级、与用户所在年级相关的科目等,这些信息形成了用户最初的兴趣需求模型;用户行为日志数据是指用户的搜索行为、观看行为、浏览行为、评分行为、下载行为等,即对用户学习时所产生的一系列行为进行分析处理;用户学习数据主要记录了用户的学习进度、测试结果、知识认知水平等。根据这些用户信息,得到用户的兴趣(特征)集合[7],再根据用户的兴趣寻找相似用户。
微课资源信息库不但存储着微课系统中的微视频,而且还管理微视频资源的增加、删除、改查等;用户评分库存储着用户对视频资源的打分,用户评分为后续的推荐提供相关的数据支撑。
微课系统中的推荐管理模块是整个系统的核心重地,向用户推荐的资源在此进行加工后才能形成,正是因为有了它,用户和视频资源才紧密的联系在一起。在推荐模块中,以协同过滤推荐技术为核心,进行相似用户寻找、视频过滤等工作。
3.2 微课系统数据存储设计
从微课系统的总体架构分析设计中不难得知:微课系统中需要存储大量的数据,如:用户信息数据、用户行为日志数据、用户学习数据、微视频数据等。所以本研究采用Hadoop分布式文件系统(HDFS)进行数据存储[8]。
HDFS对硬件要求较低,在一般的服务器集群上就能运行,其通过“一次写入、多次读取”机制,快速的处理海量的数据,并且能使用户的历史访问记录长久的存储,为用户行为分析提供坚实的数据支撑。如图3所示。
为微课系统数据存储的HDFS结构。命名节点、DataNode、客户端之间是用TCP/IP协议进行通信的。客户端执行写入操作命令时,先把这些数据缓存在本机上的临时文件夹中,临时文件夹中的数据块一达到设定的值,客户端便通知命名节点,命名节点就会响应客户端的数据请求,在文件系统层次中插入文件名,并在DataNode中找到存放该数据的块,同时将该DataNode及对应的数据块信息告诉客户端,客户端便在指定的数据节点写入本地临时文件夹中的数据块。
图3 微课系统的HDFS结构图
3.3 微课推荐系统的功能模块设计
是微课系统的功能模块关系图,如图4所示。
图4 微课推荐系统功能模块设计
本微课系统主要是为了满足用户的个性化需求,所以必需具备以下几个功能。
①用户注册功能:新用户可在系统上进行注册,注册后便于获取用户的属性特征。
②用户登录功能:方便注册的用户登录系统。
③数据收集功能:收集用户的基本属性信息、行为信息、偏好信息、微课视频信息等。
④数据处理功能:将收集来的数据进行处理,并滤除无用信息,形成数据模型。
⑤推荐功能:根据前期的数据处理分析,向用户推荐其感兴趣的视频资源。
⑥页面展示功能:系统内容和推荐结果的浏览、视频的观看等,都会用到此功能。
3.4 微课系统的推荐流程设计
展示的是微课视频个性化推荐的主要流程,如图5所示。
经分析,本系统把用户分成三类进行个性化推荐[9]。对于在系统中看过视频但没有登录的用户,系统向其推荐的视频是与其观看过的视频属性特征相似的;对于登录的新用户,系统会根据用户属性特征进行微课视频的推荐;对于登录的老用户,他不但提供了用户属性特征,而且观看了一些视频,并且对部分视频进行了评价等,这样就可以根据用户的显式信息及隐式信息分析计算形成用户的兴趣集(邻居),再结合视频资源的评价结果及新资源的情况给用户进行推荐。这样的推荐系统满足了推荐的多样性和准确度。
图5 微课推荐系统的流程设计
4 总结
在现代化教育环境下,如何把个性化学习更好的融进微课教学中,需要教育界的工作者努力地研究探索。基于此,本研究致力于用户个性需求的微课视频资源推荐研究。基于个性化视频推荐的微课教学系统分析与设计充分考虑了个性化学习及微课的特点,选择了合适的相似度算法和推荐技术,完成了个性化微课系统的分析设计,希望推荐技术能够解决教育教学中师生遇到的实际问题,并为他们的教、学带来真正的便利。时间在变,事情在变,但教育者努力研究探索的精神不变,所以我坚信在不久的将来,个性化推荐技术必为教育信息化建设贡献更大的力量。