适应性学习系统中知识点本体的研究与构建
2013-04-29肖建琼高江锦
肖建琼 高江锦
摘要:针对目前适应性学习系统中缺少可重用性、互操作性、共享性的学习资源现状,提出基于知识点本体表示适应性学习系统中的学习资源内容。采用KDD技术对领域学科知识点的内在联系及层次关系的分析和研究,获取领域知识树DKT(Domain Knowledge Tree),基于领域知识树构建了领域知识点本体。研究表明,基于知识点本体的适应性学习系统有利于实现学习资源的语义查询、重用和共享等。
关键词:知识点本体; 适应性学习; 领域知识树
中图分类号:TP183 [KG*2]文献标识码:A[KG*2][HT5”H]文章编号:2095-2163(2013)05-0014-04
0引言
现今,许多学习系统中的学习资源大多是以课程章节结构为顺序进行组织并安排学科知识的, 知识的组织方式比较粗糙,学习内容的呈现也相对固定,无法完整地表现知识点间的内在联系,不便于学习资源的再组织和重利用,不利于学习者把握课程系统的整体知识结构,更加不利于学习者辨别知识点间的逻辑关系、实现知识的拓展,因而难于适应个性化学习的需求。可见,设计和开发可重用、互操作、可共享的学习资源内容、结构和体系,有助于解决资源重用与跨平台共享的问题现状。而在计算机科学中,本体具有概念化、共享性的本质特征,可以用于学习资源内容的描述和表达,并实现学习资源内容的共享与重用。
人们学习多是以知识点(Knowledge Topic)为单位的[1]。知识点是领域课程知识体系中的核心单元,也是知识结构的最小单位。各个知识点相互关联,体现了领域课程知识的层次结构关系,是学习者构建知识体系的基础,因此将知识点纳入到学习资源内容的构建中,可以较好地组织和利用学习资源。本文依据知识点间的内在联系,利用知识本体来描述知识,建立知识本体库,对领域知识进行语义描述,可以将知识点独立、动态地组装成为学习模块或学习单元。因此,以知识点本体为核心设计的适应性学习系统能更大程度地满足学习资源的共享性、互操作性、重用性和个性化推荐。
1本体概念
本体是对知识的概念化、形式化、明确化的描述[2]。本体主要由概念、概念的属性、关系、函数、公理和实例等几种元素组成。本体的知识表示元素含义描述如下[3]:
(1)概念(Concepts):表示领域知识元数据,描述事物的属性的集合, 可以是一般意义上的概念,也可以是任务、功能、策略、行为和推理过程等, 本体中的这些概念构成知识点的分类层次关系。
(2)属性(Properties): 描述概念的性质, 是一个概念区别于其他概念的本质特征。
(3)关系(Relations): 表示概念间的关联, 在领域中概念之间的交互作用,形式上定义为 n 维笛卡儿积的子集。数学描述为:R:C1×C2×…×Cn,如子类关系(subclass-of)。在语义上,关系对应于对象元组的集合本体关系,而使概念形成层次结构。
(4)函数(Functions): 概念及其相互关系的映射函数,用于约束概念间的关系。
(5)公理(Axioms):在领域内任何条件下都成立的永真断言,是本体一致性检查和推理的基础。
(6)实例(Instances): 表示某个概念的具体实体。
这些元素的相互作用构成某一学科的知识表示, 无论何种形式、何种类别的学习资源都能够由计算机识别和理解,再通过加工处理后反馈给学习者。
本体的类型多种多样,根据本体的主题可以将本体分为:通用本体(Generic Ontology)、领域本体(Domain Ontology)、表示本体(Representational Ontology)、任务本体(Task Ontology)。其中,领域本体包含特定领域的相关知识,提供特定领域(专业或学科)的概念定义、概念之间的关系及对应领域中的主要理论和基本原理等。
领域知识树DKT(Domain Knowledge Tree)的构造
任何一门课程都是由若干个知识点组成的,知识点是对课程分解的最小学习单位,构建知识点本体必须从学习规律、学习导航的角度去分析和理解,研究某个知识点的属性特征和其他知识点之间的内在联系,再使用本体技术将这些知识点及其相互关系形式化地表示出来。依据教学和课程组织的规律,知识点之间的关系主要有以下5种[4,5]。
(1)父子关系:部分和整体的关系。父知识点a1是子知识点b1、b2、……、bn的综述,而子知识点bi则从不同的侧面、角度与范畴对其父知识点进行说明,记为a1→bi。
(2)依赖关系:前驱后继关系。学习某一知识点a2之前必须先学习知识点a1, a1是a2的前驱知识点,a2是a1的后继知识点,记为a1→a2。
(3)兄弟关系:如果知识点d1和d2具有共同的前驱知识点,且两者间具有相同或类似的主题关键词,记为a1―a2。
(4)平行关系:如果知识点t1和t2没有共同的直接前驱知识点,且两者之间无前驱后继关系,学习时可不分先后次序,则称知识点t1和t2具有平行关系,记为t1 t2。
(5)参考关系:在学习知识点x1时可以参考知识点x2,主要用于加深对某一个知识点的理解及扩展知识面,记为x1←--x2。
根据实际教学过程,可以知道,知识点间的关系是复杂的,要掌握某个知识点的内容可能需要先掌握若干个前驱知识点,而这个知识点又可能是另外若干个知识点的前驱,可见知识点间的联系不必一定是线性,还可能有网状结构。因此,构造领域知识树DKT时,必须首先考虑知识点层次关系以便于构造一个树状结构,同时考虑到知识点间网状关系,因而又不必完全局限于树状结构,如此方可满足实际学习的需要。基于前面描述,构造一颗领域知识树DKT结构如图1所示。
3适应性学习系统中知识点本体的构建[6,7]
对课程的领域知识完成深入地分析后,就可以进行知识点本体的设计了。按照实际教学规律、课程的知识特性,以及基于领域知识点的5种基本关系,知识点本体可表示和描述为如下5元组:
其中,O表示领域知识点本体,T表示本体的概念集合,P表示本体的属性集合,R表示本体的关系集合,B表示定义在知识点本体上的约束条件或公理集,L表示实例集。
构建领域知识点本体需要多步才能完成,因而是一个循序渐进的过程。首先利用概念提取、概念分层理论自动构建知识点本体概念框架,其次利用已有的 KDD 关联技术融合概念分层原理进行知识本体的扩充[8,9]。构建知识点本体模型的步骤如图2所示。
如图2所示,对各创建步骤的解析如下。
(1)确定课程领域知识点核心概念清单T,此时暂不考虑概念间属性和表达上的重复。
(2)定义知识点类及类层次结构。在核心概念的基础上首先采用自顶向下的方法进行扩展,将这些概念细化为各个子类知识点,再依照领域知识树DKT结构图中的设定,定义上层知识点为父类, 下层知识点为子类;然后自底向上由知识树中底层最小类的定义开始,将这些细化的类进行恰当地归纳和合并,并消除二义性,最终形成合理、完整的概念体系及其层次结构。
(3)定义知识点的相关类属性。用来描述知识点本身所具有的性质、作用以及相互关系等,根据领域内容本体概念的特性,领域知识点本体的属性可以用一个7元组来描述[7,8]:
P=
其中,ID是该知识点类在知识本体库中的唯一标识号; Keywords用来描述该知识点的关键字;Kind表示知识点种类,分为4类(1,2,3,4),分别对应于事实知识、规范知识、技能知识和理解知识等[7];Applicability是知识点的适用范围;Importance体现该知识点的重要程度,取值范围为[0,1],值越大表示该知识点越重要;Difficulty描述该知识点的难易程度,取值范围为[0,1],值越大表示难度越大;Master-Type表示知识点的认知能力,分为7类(a,b,c,d,e,f),分别对应于了解、熟悉、识记、理解、掌握、应用和综合。具体描述如图3所示。
(4)为知识点类创建实例。为每个知识点类创建一个实例,并添加类的属性值。
4知识点本体模型构建的实例
根据上述的领域知识点本体表示和建模思想,现以《数据结构》课程中“线性结构”这一大类知识点为例,来构造一个适应性学习系统中的知识本体表示模型,其概念实体如表1所示,概念关系则如图4所示。
5结束语
本文通过对学科知识点进行约定,将知识单元分解和组合,分析和研究知识点之间的关联关系和层次结构,再根据学习者的认知特点和认知过程来构建知识框架,形成知识重构的领域知识点本体模型。该模型在呈现知识结构的同时,能更深层次地揭示知识间的内在关联,并将其应用于适应性学习系统中,既可以改善现有学习系统语义缺失,机器难于理解和共享的不足,使知识的学习和获取更加合理化、人性化,从而提高学习效率和学习质量。