基于知识图谱的学习资源推荐算法研究
2023-07-20刘旭晖
刘旭晖
摘要:互联网的发展带动教育逐步走向信息化,如何将信息化高效融入教育是现代教育一项重要的研究内容。信息时代背景下,学习者在使用网络资源时,容易产生信息过载的问题,使学习者无法准确地获取想要的内容。文章提出了基于知识图谱的学习资源推荐算法,该算法利用信息技术对学习资源进行精准定位,找到学习者和资源之间的匹配关系,快速地筛选出最有价值的学习资源,避免学习者产生信息认知迷航。
关键词:知识图谱;学习资源;算法
中图分类号:TP391
文献标志码:A
0 引言
随着互联网技术及信息技术的发展,大数据时代来临,社会中的信息量呈爆发式增长。信息时代下,学习者在使用网络资源的过程中,面对大量的数据信息,易产生信息过载、认知迷航等问题,使学习者无法准确地获取想要的知识内容。针对这个问题,研究者们提出了个性化推荐系统,该系统通常是根据用户的历史交互信息等,获取潜在的兴趣偏好来推送相关内容。然而,基于协同过滤的推荐算法仅根据对用户项目交互信息的分析构建用户-项目评分矩阵,来完成后续算法进行兴趣推荐,这往往存在数据的稀疏性问题和冷启动问题[1]。面对海量的知识信息,学习者如何利用信息技术对学习资源进行精准定位,找到学习者和资源之间的匹配关系,快速地筛选出最有价值的学习资源,避免学习者产生信息认知迷航、冷启动等亟待解决的问题。
1 相关理论及技术
1.1 学习资源推荐
学习资源推荐主要分两个步骤完成:先是建立学习者模型和资源推荐模型,然后通过合适的推荐算法对两个模型进行匹配,以完成学习者获取学习资源[2]。目前的学习资源推荐策略主要包括基于内容的推荐、基于深度学习的推荐、协同过滤推荐、基于网络结构的推荐和基于关联规则的推荐等。这些推荐算法均存在数据的稀疏性问题或冷启动问题,造成问题的原因是算法忽视了知识的逻辑性。
1.2 知识图谱
近年来,越来越多的应用程序把数据结构设计为知识图谱(Knowledge Graph, KG)的形式,这种形式包含实体与实体之间的链接,建立项目与属性之间的联系,其目的是提高推荐系统传递给用户信息的准确率,缩小用户的选择范围,以便用户做出更快、更优的选择,从而提高用户的信任度[2]。在结构方面,知識图谱是由节点、边两大要素构成,每条知识有两种表示方式,可以表示成<实体, 实体关系, 实体>,也可以表示为<实体, 属性, 属性值>的三元组, 然后将所有数据组织成一张有向图的学习资源。推荐方法基本上分为两大类:基于本体的推荐生成和基于开放链接数据的推荐生成。知识图谱的技术研究主要分为知识抽取、知识融合、知识推理、知识图谱应用4个阶段[3]。现阶段,在基于知识图谱的学习资源推荐算法中,拥有比较丰富的知识关系和语义信息的图谱容易受到研究者的青睐[4]。
2 基于知识图谱的学习资源推荐算法分析
传统的学习资源推荐算法,对于知识逻辑的认知存在一定欠缺,也忽视了逻辑的重要性,而本文提出的推荐算法将知识图谱的相关信息融入算法,不仅能够实现对学习者所需学习资源进行关注,还能充分考虑到学习者所需的其他相关知识内容,使推荐算法具有更强的逻辑性。这种算法对推荐系统中的“冷启动”问题也做出了相应的改进。
2.1 用户兴趣和资源相似度的计算方式
用户兴趣和资源相似度包含的范围比较广泛,同时也涉及许多具体的算法。本文将不同用户的兴趣特点作为关键词,能够使各项数据更加集中,将用户特征更为明显地体现出来。
由于数据集的限制,因此使用词向量计算文本的相似度,即用户兴趣与资源的相似度。相似度定义如下:
U,u,N(u),|N(u)|分别表示用户集合、目标用户、当前用户使用过的历史资源集合用户历史学习资源集合的数。通过上述公式可以计算用户兴趣与资源的相似度,可以看出,当相似度的值越高,学习资源与用户的学习需求、学习兴趣等的匹配度越高,该资源就越值得向用户推荐。
2.2 知识连接度
在对用户进行学习资源推荐的过程中,应当尽量选择符合用户特点和用户需求的资源,这类学习资源既包括具体的知识点,又包括用户自身对知识点的认知情况,这些知识点之间的连接越紧密就越值得被推荐。
在知识图谱中,通常用k1和k2对任意知识点进行表示,k1和k2之间的最短距离则为ShortestPath(k2,k1),公式定义为:
知识点k2到k1的知识连接度的公式定义为:
从上述公式可以看出,当路径越小时,知识连接越紧密,同时知识点的连接度就比较大。
2.3 需求分析
(1)数据采集、处理与存储。想要为用户提供更加精确的学习资源推荐就应当提高数据采集、处理和储存的能力。系统需要对用户进行采集的信息有课程知识图谱、课程资源数据、交互数据等;通过系统对数据的处理分析可以使学习资源的推荐变得更加精确化。
(2)用户管理功能。用户管理主要针对的是用户个人信息部分的管理,因此系统需要为用户提供注册、登录、注销等功能,从而形成用户单独的学习资源库,并保障用户信息安全。
(3)资源展示功能。用户在学习的过程中,除了对当前所学知识进行关注外,还存在对其他相关学习资源与信息进行获取的需求,因此系统应当实现对学习资源的展示,为用户提供更多的选择,例如通过主页展示热门资源、通过推荐页展示个性化资源等。
2.4 初学者推荐算法的策略
上述算法主要针对系统的老用户,这类用户在系统内已经存在相关的历史数据信息,因此可以直接应用用户数据来完成学习资源的推荐。然而还有许多第一次使用系统的新用户,系统无法提供任何有效数据,这就涉及“冷启动”的问题。在“冷启动”的情况下,系统没有办法直接对用户的知识水平、知识需求、兴趣爱好等做出有效的分析与判断,因此需要进一步提出新用户的推荐策略[5]。
本研究对于“冷启动”问题的处理是通过用户自主提供和选择的信息来完成学习资源的合理推荐。当初学者输入关键词后,知识图谱就能够完成匹配度的计算,以关键词为中心向其他知识内容进行扩散。由于从关键词扩散的知识点内容比较广泛、资源比较繁多,系统可以从扩散的知识点中选择重点知识,建立该用户的知识库,再将与知识库资源相似度较高的知识点进行针对性推荐。初学者推荐模型流程如图1所示。
3 试验与分析
本研究的推荐算法选取机器学习方面的资源-用户数据,这是由于开始建立的算法基础是创建在机器学习知识的图谱上。在实施过程中会产生实体识别误差和实体误差,这对于推荐的准确度会产生一定的影响。因此,选取的数据应该是在构建知识图谱数据库集过程中就已构建好的资源知识库。
3.1 数据预处理
本实验的数据来源于某图书城,数据集包含标签为“建筑电气”的全部图书信息的用户数据,选取的有效数据集包含:198本图书,8 569个学习者,12 851条学习者-图书的行为数据。数据的稀疏度可以计算为:
1-1251/(8 569×198)=0.992 4
从上式计算结果来看,所产生的数据非常的稀疏。
3.2 试验过程
(1)在知识图谱的构建过程中,要建立资源知识库,每一个资源都维系着一个知识点的列表。
(2)形成学习者认知知识库,该库实际上是根据学习者的历史行为,由历史资源列表中每一个资源所包含的知识面实体和知识点实体形成的集合。
(3)采用合适的知识图谱推荐算法计算各种资源和学习者之间的连接度,选取连接度最高的多个资源,将其组成推荐列表推荐给学习者。
3.3 试验结果与分析
在推荐算法模型的建立过程中,使用参数s进行加权融合,1>s>0,参数s也表示了学习者兴趣相似度和知识连接度的重要程度。本研究通过多次试验确定了s的取值,如图2所示为推荐系统在不同的s值下的表现情况。
试验数据表明当K=5时,效果最好。当K=10,K=20,K=50时,推荐系统的性能会随着不同的s值先增加后下降,当s值在0.6~0.8时值最高。当0.2>s>0.1以及0.8>s>0.6,推荐系统性能都达到了最优。在数据集中包含所有标签为“建筑电气”的数据集,当下较为受欢迎的书籍有相关设计及电气工程施工类的,这类书籍的知识内容较多、知识面广,但是不是特别深入。高职学生在学习该领域的知识时会选择这类图书作为启蒙学习资源,因此这类资源推荐文本的相似度比重就非常高。这也正好验证了,当0.2>s>0.1时,推荐系统的推荐效果较好的原因。通过综合对比,最终确定了s值為0.7时达到最优,推荐的准确率最高。
当s值为0.7时,通过对推荐准确率、召回率和覆盖率试验数据结果进行分析,采用传统的基于用户的协同过滤和基于物品的协同过滤与本文提出的推荐算法的协同过滤结果进行对比,本文提出的基于知识图谱的协同过滤推荐算法在推荐效果上比另外两种推荐算法要好。而且相对于学习资源和学习者兴趣的相似度,各个知识之间的连接度对推荐学习资源都具有更好的效果,这也充分说明了学习资源的推荐中一项重要的内容是根据知识之间的关系,这也是研究者关注的重点内容。
4 结语
互联网的快速发展推动了教育逐步走向信息化,学习者在使用学习资源的过程中,容易产生信息过载的现象,学习资源推荐技术是解决这一问题的有效途径。基于知识图谱的学习资源推荐算法,本研究倾向于考虑知识点之间的关系,不但考虑学习者爱好学习什么,而且充分考虑学习者可能接触到什么知识,该算法不依赖学习资源的交互。随着推荐技术研究的不断深入,各类推荐算法争奇斗艳,推荐算法将更加优化,以提高推荐的精准性。
参考文献
[1]谭乐平,杨夏.基于知识图谱下的舰船电子信息协同推荐算法[J].舰船科学技术,2020(14):166-168.
[2]李其娜.基于知识图谱的《数据结构》个性化习题推荐系统研究与实现[D].桂林:广西师范大学,2020.
[3]张迪.基于知识图谱的教学资源推荐方法研究[D].武汉:华中师范大学,2019.
[4]王冬青,殷红岩.基于知识图谱的个性化习题推荐系统设计研究[J].中国教育信息化,2019(17):81-86.
[5]常亮,张伟涛,古天龙,等.知识图谱的推荐系统综述[J].智能系统学报,2019(2):207-216.
(编辑 沈 强)
Research on learning resource recommendation algorithm based on knowledge graph
Liu Xuhui
(Hunan Urban Construction College, Xiangtan 411101,China)
Abstract: With the development of the internet, education is gradually moving towards informationization. How to integrate informationization into education efficiently is an important research content of modern education. Under the background of the network era, learners are prone to problems such as information overload and massive content in the process of using network resources, which makes learners unable to accurately obtain the knowledge content they want. This paper proposes a learning resource recommendation algorithm based on knowledge graph, which uses information technology to accurately locate learning resources, find the matching relationship between learners and resources, and quickly screen out the most valuable learning resources to avoid the learners information cognitive trek.
Key words: knowledge map; learning resources; algorithm