APP下载

利用知识图谱实现精准课程推荐的算法与方法

2023-03-19肖佳

电脑迷 2023年22期
关键词:推荐算法知识图谱神经网络

肖佳

【摘  要】 为解决课程推荐领域存在的数据稀疏性高、启动慢问题,保证推荐结果的精确性和高效性,文章改进基于知识图谱的多任务特征推荐模型的基础上,提出一种带有知识感知图神经网络推荐算法,从而达到精确获取学生潜在兴趣的目的。文章以“慕课平台(MOOC)”为案例,结合所采集的艺术类、计算机类学生课程交互数据和课程属性,分别使用18235条交互数据和44700条课程属性,对带有知识感知图神经网络推荐算法性能进行验证。结果表明:带有知识感知图神经网络推荐算法的曲线下面积、准确率分别达到82.3%、78.2%,比奇异值分解模型提升了15%。所以,知识图谱在提升课程推荐性能方面发挥出重要作用,可以有效解决课程推荐数据稀疏性问题,完全符合实际应用需求。

【关键词】 知识图谱;精准课程;推荐算法;神经网络

在互联网时代背景下,网络课程资源变得越来越庞大化、多样化。在这样的情形下,学习者无法从海量的网络课程资源中精确获取所需要的学习资源,降低学习者的学习性和主动性。而基于知识图谱的课程推荐算法的运用,可以有效地解决以上问题,这是由于知识图谱凭借着自身独特存储结构,可以实现对个性化课程资源的精确化、实时化推荐。文章结合课程资源数据,构建相应的知识图谱,并提出一种新型、先进的带有知识感知图神经网络推荐算法,以期提高知识图谱推荐性能。

一、面向课程推荐的知识图谱构建

(一)课程领域知识图谱的构建

在精准构建课程知识图谱期间,需要对知识图谱数据模型进行自顶而下的设计,然后,利用所设计好的知识图谱模型,有效填充和完善相关知识数据,此时,课程领域知识图谱构建完成。该知識图谱具体构建步骤如下:1. 根据所确定好的课程数据源,完成对课程领域本体模型的构建;2. 通过对课程数据源进行精确化搜索,可以快速查找和提取相关实体信息;3. 借助图数据库,统一化存储所提取到的实体信息,从而达到丰富知识图谱的目的;4.对所构建好的课程领域知识图谱进行向量化表示,从而起到有效融合推荐模型和知识图谱的作用。

(二)课程领域本体建模

在构建知识图谱期间,技术人员要重视课程领域本体建模这一环节,通过进行课程领域本体建模,可以促使课程相关专业术语变得更加科学化、准确化,为后期构建知识图谱创造了良好的条件。在进行本体建模期间,需要采用图文并茂的方式,形象化、生动化表示课程信息,确保各种课程相关信息之间建立良好的连接关系。本体建模具体操作步骤如下:首先,确定本体建模目的。为保证课程领域本体建模的有效性和可靠性,需要对课程资源相关概念进行抽象化处理,并利用课程本体,对所提取的知识模块进行不断的优化和填充,保证课程知识图谱构建质量和效率。其次,收集课程数据信息。借助某在线IT技能网站,可以抓取所需要的课程资源数据。该网站为学习者提供多样化专业课程资源。其课程形式除了涉及传统视频课程形式外,还用到在线编码的实验课程形式。在爬虫技术的应用背景下,可以实时抓取课程简介、课程种类、课程方向、课程作者等关键字段进行实时抓取。最后,分类课程领域实体概念。结合学习者对课程信息的兴趣点,根据学习者与课程之间的匹配程度,进行精确推荐。课程领域实体概念可以划分为课程方向、课程种类、课程形式等多种类型,并对不同分类的课程概念进行属性定义。

(三)课程领域知识抽取

在抽取课程领域知识时,主要涉及以下两种抽取方式:1. 实体抽取。在进行实体抽取期间,需要结合课程标题,查询和抽取重要的知识关键词。在课程领域知识图谱中,所抽取的词汇主要包含深度学习、数据结构、图像处理等多种专业词汇。2. 关系抽取。结合课程本体属性,从大量的课程数据源中抽取类型、形式、属于、作者、包含等多重关系。

(四)知识图谱存储与可视化

应用所构建好的课程领域本体模型抽取所需要的实体信息,并对这些实体信息进行安全化存储。知识图谱具有功能强大、安全可靠、结构复杂等特点,如果运用MySQL关系型数据库,对知识图谱相关数据进行存储,会降低其存储性能,导致数据查询过慢,而Neo4j图形数据库的出现和应用可以有效解决以上问题。该数据库在存储数据期间主要用到属性图模型。在Neo4j图形数据库内含有节点和关系两种数据,借助关系,可以将多个节点进行有效连接,以三元组的方式,向Neo4j图形数据库中存储所获取到的知识实体和关系。

(五)知识图谱嵌入

当课程领域知识图谱构建完成后,仍然需要采用文本数据形式真实有效地呈现知识图谱中的实体和关系等相关信息,此时,利用知识嵌入网络,对知识图谱中的实体和关系相关信息进行向量化处理,确保各个概念实体之间形成一一对应的关系,使其统一映射到相应的低纬向量空间中。

二、基于知识图谱的多任务特征推荐模型建立

为突破传统课程推荐算法的局限性,文章建立基于知识图谱的多任务特征推荐模型,该模型将知识图谱作为推荐辅助性任务,各个任务之间紧密联系,这是由于单个课程与知识图谱的多个实体之间存在一定的关联度,因此,单个课程结构与其实体结构比较类似。在进行基于知识图谱的多任务特征推荐模型构建时,要添加交叉压缩单元,借助该单元,明确单个课程与多个实体特征之间的高阶交互关系,并对多个任务交叉知识转移能力进行有效调整和控制。在交叉压缩单元的应用背景下,可以相互补充单个课程与多个实体表征,防止多个任务出现噪声问题,使得不同任务之间表现出较高的泛化能力。该推荐模型主要是由以下三个模块组成:1. 推荐模块。该模块中的输入量是课程向量和学习者向量;输出量是学习者的课程选课率。在推荐模块中,所用到的低阶部分直接应用于多层感知器中,从而达到有效及时处理和筛选学习者的特征信息。另外,在交叉压缩单元的应用背景下,可以统一化处理课程部分内容,并自动返回相应的课程特征信息,最后,将学习者特征与课程特征进行拼接,利用函数,计算和输出相应的选课预测值。2. 知识图谱嵌入模块。知识图谱嵌入模块主要是指采用直接嵌入的方式,将实体和关系统一设置到某一向量空间中,并保留原有结构不变。3. 交叉压缩单元。借助该模块,可以实现对单个课程与多个实体之间特征交互关系的有效模拟。在课程推荐模块中,其课程和知识图谱嵌入模块中实体之间存在一对一的关系,借助交叉压缩单元,可以对中间层进行有效的连接。

三、基于知识图谱的多任务特征推荐模型算法优化

首先,要淘汰和摒弃推荐模块中的协同过滤算法,运用优化后的算法,保证维度变换效果,以达到高效化压缩数据的目的。其次,利用优化后的算法,对所需要的低阶特征进行获取,并借助深度网络,获取相应的高阶特征,然后,采用集成处理的方式,将设计好的图卷积神经网络框架直接引入知识图譜中,从而形成一种新型、先进的带有知识感知图神经网络,该神经网络可以精确化表示和学习知识图谱中的各个节点。最后,配合使用交叉压缩单元和深层网络,构建压缩矩阵模型,从而实现对高维特征的精确化提取。总之,文章所提出的带有知识感知图神经网络推荐算法,可以实现对学生课程资源的精确化推荐,在知识图谱中,借助该推荐算法,可以实时获取不同实体之间的高阶连接关系,并有效表示出各个课程实体,聚合处理课程实体邻域节点,从而达到实现一次迭代的目的。

四、实验对比与分析

在进行对比实验时,为有效地验证文章推荐算法的有效性和可靠性,文章选用了MOOC平台中的艺术类、计算机类学生课程交互数据和课程属性等数据集,其中,艺术类数据集含有110门课程信息以及15915位学生对110门课程的评分;计算机类数据集主要包含298门课程信息以及9023位学生对298门课程的评分,为解决交互矩阵的稀疏性问题,将计算机类数据集中学生交互次数设置在5以上。数据集基本统计信息如表1所示。

为验证文章提出的课程推荐算法的有效性,需要将其与奇异值分解推荐模型、基于特征的分解推荐模型、融合通道的深度推荐模型三种传统推荐模型进行比较和分析。文章将ROC曲线下面积、准确率设置为推荐算法性能评价指标,有效地评价和衡量各个算法性能。其中,推荐模型准确率(ACC)计算公式如下:

式中TP、TN、FP、FN分别代表课程样本被正确推荐给学生者的数量、不属于推荐课程的样本没有推荐给学生的课程数量、不属于正确推荐课程样本被错误推荐给学生者的数量、属于推荐课程的样本没有推荐给学生的课程数量。

在带有知识感知图神经网络推荐模型中,结合验证集,完成对学生课程评分矩阵的构建,该矩阵属于稀疏矩阵,测试集、验证集、训练集三者之间比例为1:1:3,单个实验重复操作四遍,然后,对各个推荐模型的评价性能进行计算。运用点击率预测法,对推荐性能进行评估,在整个测试集中各个交互实例中,运用训练后的推荐模型进行处理,并将预测点击概率输出和呈现在测试人员面前。最后,借助曲线下面积、准确率,对最终预测结果进行评估。课程点击预测概率如表2所示,从数据可以看出,文章所提出的带有知识感知图神经网络推荐算法所获得的曲线下面积、准确率相对较高,远远超过其他传统推荐模型,因此,文章推荐算法具有较高的有效性和可靠性,可以实现课程资源的精确化推荐。

五、结语

综上所述,在进行课程推荐时,运用知识图谱完成对知识抽取、表示和存储,并在构建和优化基于知识图谱的多任务特征推荐模型的基础上,提出一种带有知识感知图神经网络推荐算法。该推荐算法借助聚集邻域信息,有效地提取和获取用户潜在兴趣。结合艺术类、计算机类学生课程交互数据和课程属性实验结果,不难发现,文章所提出的推荐算法明显优于其他传统推荐算法,可以提高课程资源推荐结果的精确性和高效性,为教育领域的发展提供新的思路和方法,给学生提供个性化的课程推荐,避免学生盲目地选择不适宜于自身发展方向的课程,从而提高教学资源的利用率和选课管理系统的运行效率。总之,文章所提出的带有知识感知图神经网络推荐算法具有较高的有效性和可靠性,可满足学习者查询和调用个性化课程资源应用需求,有效地提高学习者的学习效率和效果。

猜你喜欢

推荐算法知识图谱神经网络
神经网络抑制无线通信干扰探究
基于相似传播和情景聚类的网络协同过滤推荐算法研究
社交网络推荐系统
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
混合推荐算法在电影推荐中的研究与评述
基于知识图谱的智慧教育研究热点与趋势分析
一种改进的基于位置的推荐算法
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
基于神经网络的拉矫机控制模型建立