网络学习资源个性化推荐系统的设计与开发
2017-06-03冯蓓蓓
冯蓓蓓
[摘要]在信息过载的网络学习环境中,个性化推荐能够帮助用户有效获取符合个人需求的网络学习资源。文章针对网络学习资源的特点,设计了基于协同过滤、深度神经网络推荐的个性化网络学习推荐系统,致力于提高学习资源系统的个性化程度与智能性,从一定程度上解决“信息过载”问题,满足用户对网络学习资源的个性化需求。
[关键词]网络学习资源;个性化推荐;推荐系统
伴随现代远程教育及MOOC的快速发展,网络学习资源日趋丰富。一方面,海量学习资源使学习者有了更多的选择余地,可以根据个人的兴趣爱好、知识结构的积累,选择更适合自己的学习资源。另一方面,网络学习资源是异质的,有文本、音频、视频等多种形式,学习者在纷繁复杂的学习资源中,并不总是能够完全及时准确地发现自己想要的资源,这也使得很多网络学习系统无法得到充分有效的应用。
网络学习资源个性化推荐系统是一个基于REST架构的分布式资源库系统。主要包括管理员、用户、学习资源。管理员可以创建、修改、删除学习资源;用户可以浏览、下载、评价和获得推荐学习资源。用户在利用传统的类目、搜索学习资源的同时,系统还能够根据用户的个性化信息向用户提供个性化的推荐。
1系统结构
网络学习资源个性化推荐系统的基本功能如下:
(1)用户智能化管理:收集用户的兴趣偏好,根据学习资源的特征对用户进行推荐。
(2)分类浏览:将网络学习资源以传统的类目和Tag方式加以组织,从而有利于信息的进一步挖掘。
(3)个性化检索:依照用户的检索内容和学习资源的匹配度,加入用户的个性化的兴趣偏好,向用户反馈个性化的检索结果。
(4)个性化推荐:构建个性化推荐模型,基于协同过滤、知识库等不同的推荐模型向用户推荐学习资源。
根据以上分析,从应用角度设计和实现了推荐系统的体系结构,如图1所示。前端开发工具采用ASPnet Web API,它是Microsoft的REST架构平台,基于REST的架构能使应用程序独立于操作系统和程序语言,方便地与移动设备、数据分析平台等无缝衔接,同时也可以调用其他应用程序的功能。数据分析及推荐算法采用Python语言实现的sklearn机器学习模块和TensorFlow实现的深度学习模块。整个系统分为四大部分:前端用户接口、推荐系统核心功能、学习资源管理系统和用户数据处理系统。
2个性化推荐引擎
目前主流的推荐技术包括以下几种:基于内容的推荐、基于用户统计信息的推荐、基于协同过滤的推荐、基于关联规则的推荐以及基于知识库的推荐。基于用户、物品的协同过滤算法是推荐系统中应用最广泛、最成功的算法。协同过滤算法,通过分析用户与物品间的关系,计算物品、用户间的相似度,根据用户过往的评价行为利用分类、聚类的手段向用户提供推荐列表。
21用户偏好分析
用户偏好分析是个性化推荐准确性的关键,建立以用户历史行为为标准的用户模型是做好用户偏好分析的关键。结合用户历史行为和物品信息,可以得到用户每种行为下的用户偏好数据,建立偏好的维度和偏好程度。
将各种行为的偏好数据合并,从而得到用户在物品、类别、标签等各个维度上的偏好程度。在对不同维度的数据合并计算时,应当考虑用户对于不同行为类型的用户偏好程度,从而赋予不同的权重。
利用机器学习中的Random Forest算法,在使用人工标记后的训练数据,经过模型的训练、测试,从而将用户划分到不同的群体。在处理用户的偏好数据时,应当考虑时间因素的影响,根据不同的时间间隔,划分成长期、中期、短期和实时四个时间维度,从而解决用户因为时间的推移、兴趣爱好发生变化产生的影响。
22协同过滤
协同过滤的推荐方法,主要利用用户过去的行为或意见预测当前用户对物品的可能喜好,可以推薦一些物品内容上差异较大但用户又感兴趣的物品,以近邻算法为主。基于近邻的方法,在数据预测中直接使用已有数据进行预测,将用户的所有数据加载到内存中进行运算。通常划分为基于用户的系统过滤和基于物品的协同过滤。基于用户的协同过滤是,获取和当前用户相似的用户列表,将这些用户喜欢的物品推荐给当前用户;基于物品的协同过滤,获取当前用户偏好的物品列表,将和这些物品相似的物品加入到推荐的候选列表中。
23深度神经网络
“深度学习”(Deep Learning)的概念源于人工神经网络的研究,于2006年由Hinton等人提出。含多隐层的多层感知机就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。比较常用的深度学习算法有,卷积神经网络、循环神经网络、递归神经网络及LSTM长短时记忆等算法。
Tensor Flow是谷歌于2015年11月9日正式开源的深度学习计算框架。Tensor Flow使用数据流式图来规划计算流程,可以将计算映射到不同的硬件和操作平台,大大简化了真实场景中应用机器学习的难度。
本系统利用Tensor Flow平台设计了两个深度神经网络:第一个深度神经网络用来生成候选学习资源列表;第二个深度神经网络用来对输入的候选学习资源列表打分排名,以便将排名靠前的学习资源推荐给用户。候选学习资源的列表并不完全依赖于第一个神经网络的结果,也可以使用其他来源产生的候选学习资源。
3结论
利用传统的类目式导航和简单的信息检索手段,用户很难在纷繁复杂的学习资源中准确地发现自己需要的学习资源,并且用户之间无法共享有价值的学习资源。采用本文设计的模型,在帮助用户快速获取大量的有价值的学习资源的同时,还能够根据其他用户已经获取的学习经验来提高用户的学习效率,这种个性化的推荐方式有助于提高用户学习效率和学习资源的使用效率。
参考文献:
[1]杨露基于协同过滤算法的鹤岗师专多媒体教学系统设计与实现[D].长春:吉林大学,2016
[2]裴艳基于学习分析的学习资源个性化推荐研究[D].西安:陕西师范大学,2015
[3]江周峰面向个性化学习资源共享的混合推荐系统的设计与实现[D].北京:北京邮电大学,2015
[4]应中运基于用户情境的论坛个性化推荐模型研究[D].重庆:西南大学,2014
[5]胡小丰面向科研用户的个性化推荐系统设计与实现[D].北京:中国农业科学院,2013
[6]刘敏基于协同过滤技术的E-learning个性化推荐系统研究[D].天津:天津师范大学,2010
[基金项目]本文系安徽工业经济职业技术学院2014年院级质量工程项目电子商务省级特色专业(项目编号:2014YTSZY01)和安徽省2015年省级质量工程项目电子商务省级特色专业(项目编号:2015tszy066)阶段性成果。