APP下载

基于知识图谱的高校跨课程知识推送工具设计

2023-02-18卢淑怡李美子

软件导刊 2023年1期
关键词:图谱关联知识点

卢淑怡,李美子,许 多,张 波,2,3

(1.上海师范大学 信息与机电工程学院;2.上海师范大学 人工智能教育研究院;3.上海智能教育大数据工程技术研究中心,上海 200234)

0 引言

知识爆炸时代,高等教育已进入知识量大、学科交叉强、知识更新速度快的阶段,对学生专业知识交叉融合学习提出了更高要求。高校培养复合型人才过程中亟需为学生构建全面综合知识能力体系[1]。然而,传统教学模式跨课程知识的关联学习程度较低,无法为学生提供快速知识关联获取工具,主要表现为以下3 个方面:①传统高校学科专业设置的课程衔接紧密度低,跨课程综合课程少[2];②独立授课导致课程内容差异大,缺乏知识连贯性;③不同课程、教材间术语名称不同、知识点表达不同,学生受自身知识限制,难以发现知识点间隐性和长路径关联。这些原因共同导致知识点不连贯,造成学生所学知识点在跨课程的宏观角度上呈相对离散的状态。

因此,实现学科专业知识融合学习,应从智能辅助工具的角度探索创新途径[3-5]。当前,主要的知识融合技术利用数据融合方法,根据知识融合数据特征,将数据融合方法应用于知识融合[6]。然而,该技术需要处理海量的庞杂数据并达到复杂的知识融合目标,当计算量过大时将难以及时动态反馈调整,无法保证知识融合效率[7]。

目前,知识图谱技术被广泛应用于知识表示、知识问答和知识推理等任务,具有大范围、多样性和可解释性的优点,其中知识实体呈显性连接状态,能提供良好的关联检索与推理能力[8-11]。因此,从跨课程知识关联的角度将课程内知识点实体及其关联关系构建知识图谱,将不同课程知识图谱中的知识点实体建立连接,实现跨课程知识点实体融合,达到跨课程知识点实体连接的目标,进而完成跨课程知识推送,满足学生交叉融合学习的要求[12-14]。

基于上述考虑,本文提出一种基于知识图谱的高校跨课程知识推送工具设计方法及其应用案例。该工具首先构建了高校教育学科知识图谱(Educational Cause Knowledge Graph,ECKG)的基本框架,实现了学科层、课程层和知识点层的3 层知识图谱架构;其次,在ECKG 上设计跨课程知识推送算法,从“标准+个性”角度提供课程间连接的知识推送方法;最后,通过ECKG 应用案例为智能化知识融合学习提供支持。

1 高校教育学科知识图谱构建

高校教育学科知识图谱是一种对零散知识进行整合并描述知识间相互关联的方法。本文通过对ECKG 的形式化构建,关联整理高校教育资源的教育知识点的知识体系和逻辑结构。

随着教育革新和社会发展需求,学科交叉与课程融合趋势在高校教育中逐渐兴起。许多专业课程存在交集,但不同专业考察的侧重点不尽相同,相较于其他传统学科知识图谱,本文从节点类角度出发,将ECKG 层次结构分为学科、课程、知识点3层,如图1所示。

Fig.1 Hierarchy structure of ECKG for Science and Engineering subjects in universities图1 理工学科的高校教育学科知识图谱ECKG层次结构

由图1 可见,3 个层次间通过包含关系自上而下进行N-N映射。每个子类将继承父类的相应祖先类别,通过自上向下的分层构建保证ECKG 的知识覆盖范围。具体的实体与关系描述如下:①学科层实体包括依据学术性质而划分的科学门类和门类下的具体教学科目,学科门类和教学科目通过组成的关系进行1-N连接;②课程层的实体根据不同教学目标和教学形式,分为理论类课程、实践类课程和综合性课程,各类课程通过前驱关系连接或独立,以更好地挖掘课程和知识点之间的隐性关系;③知识点层的实体包括不同粒度知识点,在关系层面本文以近年来广受认可的牛顿平台(Knewton Platform)为基础,主要考虑知识点间的组成、评价、前驱、分类这4种逻辑关系。

图1 为理工学科为例的ECKG 层次结构示例。其中,学科层中包含理科、工科两大科学门类;科学门类又由各种不同的教学科目组成;教学科目包含多门课程,因此将学科层和课程层相联系;课程层与知识点层自上而下挖掘潜在关联知识,通过多维角度提高学科素养。ECKG 的意义在于打破学科、专业、课程间的界限,依据知识点间逻辑关系、组织结构等进行整理关联。

图2 展示了本文所提理论构建的部分ECKG。具体的,ECKG 通过挖掘教育资源,整合知识点间存在的关联,将不同学科专业知识点构建为一张有向的知识网络。

2 基于知识图谱的教育知识点推送算法

Fig.2 Partial ECKG图2 部分ECKG

如图3 所示,ECKG 应用流程由3 个部分组成。具体为:①层次化知识图谱模块。ECKG 抽取不同学科、专业学习资料数据,整理关联得到的知识点,整合出知识网络构建ECKG;②标准化知识查询模块。通过知识快速定位算法查询知识点或知识间的关联;③个性化知识推送模块。对历史数据进行挖掘分析,构建个性化的学习模型,智能化分析用户可能感兴趣的知识点,针对用户学习习惯进行推送。综上所述,该应用从“标准(基于关键词的知识快速定位查询方法)+个性(教育知识点智能推送算法)”的应用角度,从课前、课中、课后3 个时段全方位辅助学生进行针对性学习。

Fig.3 Application process of ECKG图3 ECKG应用流程

2.1 基于关键词的知识快速定位查询方法

由于海量的教育知识点及知识点间错综复杂的关系会使学生在学习时无法清晰地厘清知识间的关联,学生也无法在规模庞大、结构复杂的知识图谱中快速寻找知识点间的关系。因此,本文提出利用关键词定位目标节点的检索方法,相较于传统方法节省了遍历索引所耗费的时间。算法描述如下所示:

步骤1:对大规模RDF 数据图进行子图划分。将ECKG 划分为多棵知识树,分别构建知识点索引与关系索引进行分布式检索。其中,知识点索引包含顶点下标和标签,关系索引包含关系下标和标签及相关联的父节点下标。图4 为索引关系示例,假设图4(a)为一个划分后的知识树,图4(b)就是针对该树构建的索引关系。该方法在实现查询时既能提升大规模RDF 数据图的检索速率,又能降低索引的存储空间。

Fig.4 Index relationship图4 索引关系

步骤2:构建最小知识子树。遍历每棵知识树的节点,定位所有关键知识点,假设关键知识点≥2,寻找连通该知识点的最短距离,构建最小知识子树。并通过知识点索引与关系索引寻找最小知识子树的根节点。若关键知识点为1,则直接进入下一阶段。

步骤3:构建候选知识子树遍历最小知识子树的边,定位关系关键词。对于未被定位的关系关键词,通过索引查寻最小知识子树根节点和叶子节点连边是否包含关系关键词。若包含,将对最小知识子树进行拓展;若不包含,则记下不被包含的关系关键词个数。当关键知识点为1,将直接遍历相关联边查找关系关键词。

步骤4:评分规则。对构建的候选知识子树进行评分计算,返回前k个结果供用户选择。本文评分函数考虑了候选知识子树的紧密度及精准度,评分函数公式如式(1)所示:

其中,t为候选知识子树根节点,num(ε)代表ε个数,sp(a,b)代表a到b的最短距离,α、β在实际应用中调整紧密度和精准度对评分结果的影响程度。

假设已完成对ECKG 与RDF 数据图划分得到i棵知识树,并且识别问题关键词得到n个知识点关键词构成集合和m个关系关键词构成的集合集Rk=结合上文对答案快速定位方法的具体描述,给出快速定位答案的算法伪代码描述。

算法1基于关键词的答案快速定位算法

2.2 教育知识点智能推送算法

针对以人为本的智慧教育学习理念,本文提出一种对历史记录和特征挖掘进行智能化知识推送的算法。该算法结合用户检索记录,以每次定位答案中心知识点为基准,构建个性化模型计算中心知识点相关性,围绕中心知识点间的最短路径挖掘用户检索规律,并结合节点重要性增加可推荐知识间的区分度,从而构建个性化知识智能推荐模型。具体算法流程如下:

步骤1:确立中心知识点oi、知识点集C。通过寻找子图每个点到其他关键知识点的距离并求和,分别计算各知识点的中心度core(ex),选取core(ex)最大的知识点o为中心知识点。

其中,N(ex)为ex的邻居节点,l(ej,ek)=0 代表ej、ek不存在连边,l(ej,ek)=1 代表ej、ek直接相关联。同时,从平均路径长度dist、支持度wl两个因素分析一定时间内用户搜索历史的知识点集。

对不同关系的支持度表示如下:

其中,num(r)代表关系r在路径中出现的次数。

步骤2:计算中心知识点的相关性sim(oi,oi+1)。不同用户的个性化学习方式导致知识相关性不仅与知识图谱中知识的位置相关,本文提及的知识相关性即在个性化模型限制下从当前中心知识点游走到另一个中心知识点的概率。

步骤3:计算候选知识点的中心度core(ex)。中心知识相关性主要考虑历史中心知识点间的路径关系,从而预测可推荐中心知识点,但可能面临预测结果较为粗糙的情况,此时将难以区分部分节点可推荐度。为此,本文对知识点集合C中的节点进行中心度计算,提高推荐度的划分效果。

步骤4:利用T(oi+1)对答案进行打分并排名,将前top-k的知识点返回给用户。

结合上文对个性化教育知识点推送方法的具体描述,给出智能推送算法的伪代码描述。

算法2个性化的教育知识点智能推送算法

3 高校跨课程知识推送应用实例

以计算机学科的跨课程教学为例,包含算法、概率论、高等数学等课程,证明ECKG 知识推送工具应用及其教学模式改革的有效性。在传统课程学习的3 个阶段,学生通常会遇到以下问题:

(1)课前预习时,无法明确跨课程知识点间的关联关系。学生在预习时,无法将预习知识和已学知识融会贯通,给预习增加很大的困难。通常看似无关的知识点却内含强关联,使学生不得不翻阅不同课程教材寻找他们之间的联系。

(2)课中学习时,无法快速回顾某个确切的知识点内容。教师在授课时,经常通过拓展延伸、反问学生的方法推进课堂教育进程。例如,运用计算曲面积分方法可得出答案,学生则需要快速反应计算曲面积分的方法。

(3)课后复习时,无法对薄弱知识进行针对性巩固提高。学生在复习时,遇到多个薄弱知识点,无法寻找核心知识进行梳理复习,复习效果较差,知识结构体系散乱。

在应用ECKG 工具后,学生在教学活动中将化被动为主动,从课前—课中—课后3 个阶段完善自身知识体系,教师也可逐渐改变传统教学设计。具体的,学生前期通过ECKG 了解知识结构关系,教师通过翻转课堂等形式激发学生学习积极性,达到更好的教学效果。以下将从具体实例分析入手,展示ECKG 如何运用本文设计的算法帮助学生掌握知识点间的关联性,应用流程实例如图5所示。

Fig.5 Example of knowledge recommendation process based on knowledge graph图5 基于知识图谱的知识点推送流程实例

3.1 课前预习,厘清知识关联

高校教育知识繁多复杂、专业性强,不同课程间存在许多关联知识点,厘清知识点间的关联是学好该知识点的重要保障。通过ECKG,即使用户提出跳跃性问题,依然能寻找出知识间的关联。首先,用户提出问题,例如匹配分析法与朴素贝叶斯分类器间有何关联。ECKG 提取匹配分析法与朴素贝叶斯分类器的知识关键词,利用算法1 对关键词进行定位。根据算法1 评分方法计算3 颗知识树中的候选答案评分排名为a<b<c。假设系统返回用户两个答案,则用户将会收到评分最高的两个答案,即图5 所示的两个关联。通过该知识关联查询方法,可解决学生在预习时遇到的问题,将所学知识与预习知识有机连接。

3.2 课中学习,明确知识内容

知识点的查询过程本质上是关键词的快速定位问题。例如,用户希望了解混杂因素的评价方法,首先系统将提取混杂因素、评价的知识关键词定位知识树,然后以该知识点为中心检索直接相关的关系评价,得出知识点为匹配分析法和多元回归法,最后通过该方法解决学生在课上遇到的问题,辅助学生高效、快速地理解课堂知识。

3.3 课后复习,个性知识方案

除了根据ECKG 中直接关联的知识点进行推送外,智能化推送算法还可根据知识点间的隐性关联进行知识推送。假设用户先后依此检索了多元回归法、匹配分析法、朴素贝叶斯。首先,基于检索记录的知识智能推送算法2,寻找知识点间的最短路径。然后,根据数据分析知识点间最短路径长度均值为2,寻找所有距离朴素贝叶斯为2 的知识点。假设前驱与评价评分各为0.5,其他关系评分皆为0,去除已出现的知识点匹配分析法,对知识点间最短路径进行打分排序。最后,将最高分伯努利模型推送至用户。

如此,可使用户更明确自身学习路径和下一步的学习知识点。通过该方法在标准的基础上增加个性功能,使每个学生可针对性地发现自身所需巩固的知识点。

4 结语

本文提出利用知识图谱对高校教育知识点进行组织和整理构建ECKG,并结合ECKG 上的知识检索及智能化数据挖掘技术进行多角度知识应用。通过本文的论述与假设,可展望通过ECKG 及知识检索技术对高校教育知识进行挖掘,不仅能打破高校教育中课程、专业的限制,还能直接对知识间的关联进行宏观梳理,使其更适应人工智能化教育时代的技术融合,从而促进高校环境下智慧教育生态的形成。

但对高校教育学科知识图谱的落地还存在以下难题:①对于大体量数据,已有深度学习技术在教育资源抽取时仍需大量人工操作,亟需一种自动化程度更高的构建方法;②对于高校教育知识的隐性推理仍是一个值得深入探究的问题,如何最大幅度利用隐性关系挖掘出更多有利信息是当前知识图谱领域尚未解决的问题之一。

猜你喜欢

图谱关联知识点
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
一张图知识点
一张图知识点
第四页 知识点 歼轰-7A
绘一张成长图谱
“一带一路”递进,关联民生更紧
奇趣搭配
补肾强身片UPLC指纹图谱
智趣
关于G20 的知识点