远程教育中学习资源本体建模
2010-06-08梁晓莲章正辉
梁晓莲 章正辉
(1.湖南农业大学资产处 湖南 长沙 410128;2.长沙市中等城乡建设职业技术学校 湖南 长沙 410134)
近年来,基于网络的教学与学习得到了广泛普及,各种网络课程、电子教案、学习课件等网络教学使用的学习资源越来越多.由于这些学习资源都是分布在网络各地的服务器上,用户在检索学习资源时存在很大的难度.为了解决分布式学习资源的共享和检索问题,学习对象元数据标准是其中的一个重要内容,它提供了一种统一的描述学习资源内容的方法.通过对学习资源的统一描述文件(学习对象元数据)进行检索,检索系统将用户输入的关键字与元数据描述文件(一般是XML文件)中的关键字进行精确匹配,找到用户需要的学习资源的XML描述文件.由于XML文件可以在分布式系统中很方便地进行数据交换,学习者可以很方便地重用和检索分布式的学习资源.本文对学习资源元数据以及学习资源元数据与本体结合的相关研究进行介绍,研究本体与学习资源元数据结合的方法.并结合具体的ACM计算机领域分类本体,构建结合学习资源元数据本体和学习内容领域本体的学习资源本体,同时时了学习资源本体的语义进行描述.
1 学习资源元数据
学习资源元数据为学习资源内容的描述提供了一系列标准、普遍的描述方法,是关于内容的描述信息.目前比较重要的元数据标准有IEEE LOM[1],ADL SCORM[2], IMS LRM[2],Dul in DC[4]以及我国的 CELTSC[5]等.
2 学习资源本体
2.1 学习资源元数据的语义描述
学习资源元数据的描述一般采用与XML(eXtensible Markup Language)绑定的形式.学习资源元数据的XML绑定将LOM元数据如General,Educational等用XML的元素表示,将元数据的层次用XML的数据模型结构表示.XML的数据模型可以用树状图形结构来表示数据的层次,因此学习资源元数据的XML绑定是一种词义描述.
针对XML在表示元数据时语义缺失的问题,Nilsson[6]提出了一种 IEEE Learning Object Metadata(LOM)或者都柏林核心元素据标准与RDF(Resource Description Framework)绑定的学习资源元数据语义描述方法.该方法采用面向对象的原理,将LOM元数据看成对象,而元素之间的关联可以看成是对象的属性.同时,元数据的数据模型可以用RDF的三元组来表示,将元数据表示成(主语、谓词、宾语)具有一定语义的解释模型结构.该方法的优点是在元数据数据模型的基础上,增加了语义的显性解释.这种“解释”可以在查询RDF绑定的元数据时,起到语义增值和语义推理的作用.目前,IEEE LTSC己经开始研究制定IEEE LOM与RDF绑定的信息模型.
为了解决学习资源语义描述中本体词汇的多样性问题,Dragan Gasevi等[7-10]提出利用简单知识组织系统(SKOS)来规范学习资源元数据的描述词汇.SKOS[11]是由万维网联盟(W3C)开发的一种描述概念模型(如术语词典、本体、分类系统、模式等)的基本内容和结构统一描述词汇.它利用RDF的图形或者描述语言,利用定义的通用词汇来统一描述本体的内容与结构,如SKOS核心词汇集(SKOS Core)中的skos:concept表示本体的概念或者元素,skos:subject表示RDF三元组的主语,skos:narrower表示本体中两个元素的关系是 “属于”关系,skos:broader表示本体中两个元素的关系是'包含“关系.除了SKOS核心词汇外,W3C还制定了SKOS映射集(SKOS Mapping)用来描述不同本体之间的映射,SKOS扩展集(SKOS Extension)用来补充SKOS核心集难以表达的词汇.这样,不同组织、不同结构的本体使用SKOS的词汇集可以实现异构本体的统一描述和映射.
2.2 学习资源本体模型构建
Stojanovic[12]提出了教育语义网络中学习资源本体建模的三个维度,即学习资源内容本体,学习资源上下文本体,学习资源结构本体.其中学习资源内容本体用来说明学习资源的具体内容,表现形式是某一具体学习资源(如计算机网络)的领域本体,可以解决具体学习资源内容的一词多义、异词同义和概念相关问题.它可以改变传统的关键字检索学习资源的方法,实现基于概念相关为基础的语义检索.学习资源上卜文本用来说明学习资源的表现方式,例如学习资源是表现为介绍性文字还是讨论性文字,学习资源是表现为图表形式还是文字形式,是表现为PPT还是Word,类似于这种学习资源表现方式的问题都可以用学习资源上下文本体来描述.学习资源结构本体用来说明学习资源的结构语法,以便将细粒度的学习单元组装成一个符合学习者需求的个性化学习资源(如一门课程或是一个课件).这种用户定制的学习资源利用体现学习者的意图、教师的教学设计理念的结构性描述,将细粒度的学习单元利用Prev,Next,isbased-on等学习单元的内在语义、因果关系来形成整体的个性化学习资源.目前国内外大部分的研究集中在学习资源内容本体上,如ACM计算机课程本体(ACM Computer Classification System,ACM CCS)是目前比较具有影响力的学习资源内容本体.
Dragan Gasevic[7-9]将学习资源看成由学习资源元数据和学习资源内容组成,其中学习资源元数据是关于学习资源内容的信息,例如标题、作者、主题等.学习资源内容是学习资源所涉及的领域,例如数学、计算机学科、物理学科等.本文在Dragan Gasevic学习资源本体模型的基础上,结合元数据本体和领域本体,形成学习资源本体.并对元数据本体和领域本体进行了实例化,分别以IEEE LOM元数据和ACM CSS计算机学科领域本体作为具体的元数据本体和领域本体,将二者有机的组合在一起形成计算机学科的学习资源本体.关于学习资源本体的形成过程模型如图1所示.
学习资源本体在IEEE LOM标准的基础上对元数据的类和属性进行了转换,在本体的表示层面上,使用本体描述语言和RDF图形来表示学习资源本体.由于在LOM中只有类和属性,所以学习资源本体的一个主要任务就是对类和属性的关系进行了定义,本文利用本体描述语言中的subclass,equivalence等几种语义关系.图2显示了在图1学习资源本体模型基础上构建的部分学习资源本体.
图1 学习资源本体模型
图2 部分学习资源本体
其中“LR”是学习资源本体的顶层元素,因为使用的是LOM元数据描述学习资源,所以LR的元数据属性的取值是LOM.根据IEEE LOM标准,LOM 元素包含“Educational”,“General”,“Technical”,and “Classification”等 9 个元素,LOM 元素和这9个元素之间的语义关系是“HasElement”.元素“Educational”和LOM元数据标准中“教育”特性的语义一样,表示学习对象的教学信息,如终端用户的学习层次(小学、初中、高中).它是学习资源本体不同于其它领域本体的主要特征.“General”给出了所有学习资源通用信息的集合,它土要描述学习资源的语言、标题、关键字、标识符等.“Techni-cal”表示学习资源的格式、大小以及软硬件架构需求,它与学习资源的运行时状况相关.“Classification”表示学习资源和具体专业领域的关系,主要表示学习资源的内容特性,它代表学习资源内容本体的特性.
2.3 学习资源本体的语义表示
对于学习资源本体的描述,本文采用RDF描述语言,并结合定义的学习资源本体中的词汇来进行描述,根据定义的学习资源本体,对学习资源(Learning Resources)的命名空间作如下定义:
xmlns:lr-base=“http://remoteedu.edu.cn/lr--base”(Base)
xmlns:lr-general=“http://remoteedu.edu.cn/lr--general”(General)
xmlns:lr-lifecycle=“http://remoteedu.edu.cn/lr--lifecycle”(Lifecycle)
xmlns:lr-metametadata=“http://remoteedu.edu.cn/lr-metametadata”(Meta-metadata)
xmlns:lr-technical=“http://remoteedu.edu.cn/lr-technical”(Technical)
xmlns:lr-educational=“http://remoteedu.edu.cn/lr-educational”(Educational)
xmlns:lr-rights=“http://remoteedu.edu.cn/lrrights”(Rights)
xmlns:lr-relation=“http://remoteedu.edu.cn/lrrelation”(Relation)
xmlns:lr-annotation=“http://remoteedu.edu.cn/lr-annotation”(Annotation)
xmlns:lr-classification=“http://remoteedu.edu.cn/lr-classification”(Classification)
其中对学习资源本体lr的每一个属性都作了定义.上图中显示了lr的根目录的清单.例如对于Description中标题的描述,用RDF表示为:
<rdf:Description rdf:about=“http://www.remoteedu.edu.cn/”>
<LR:tiitle xml:lang=“en”>A test</LR:title>
</rdf:Description>
笔者在Dragan Gasevic,Marek Hatala等人提出的学习资源元数据与学习内容领域本体层次模型的基础上进行扩展.结合元数据本体和领域本体,形成了学习资源本体,并对元数据本体和领域本体进行了实例化,分别以IEEE LOM元数据和ACM CSS计算机学科领域本体作为具体的元数据本体和领域本体,结合本体建模原则,将二者有机的组合在一起形成面向ACM CSS计算机学科领域分类系统的学习资源本体.与现有的学习资源本体相比,本文提出的本体模型更加全面和具体,而且主要是面向学习资源的语义检索.学习资源本体模型的提出为本体匹配算法的研究以及基于匹配算法的教育知识语义检索系统的实现提供理论基础.
[1]IEEE.Learning technology standards committee[EB/OL].//[2007-9-21]http://ltsc.ieee.Org1.Sharable Content Object Reference Model(SCORM)2004 3rd Edition Documentation Suite,Advance Distributed LearninSCORM[EB/OL].http://www.adlnet.org/storm,2007-09-21.
[2]IMS Global Learning Consortium[EB/OL].http://www.imsproject.Org,2007-09-21.
[3]Dublin Core Metadata Initiative (DCMI)[EB/OL].http://dublincore.org,2007.
[4]现代远程教育技术标准化委员会,教育部.现代远程教育技术规范[EB/OL].http://www.celtsc.edu.cn,2007.
[5]Nilsson,M,Palmer M,Brase J.The LOM RDF binding principles and implementation[C].In Proc.of the 3rd Annual ARIADNE Conf Leuven,Belgium,2003
[6]Gasevic D,Hatala M.Ontology mappings to improve learning resource search[J].BritishJournal of Educational Technology,Special issue:The Semantic Web forE-learning,2006,137(3):375-389.
[7]Gasevic D,Hatala M.Searching Web Resources Using Ontology Mappings[C]//Workshop on Integrating Ontologies at K-CAP 2005,Banff,Canada,2005:33-40.
[8]Gasevic D,Hatala M.Searching context relevant learning resource usingontology mappings[C].Workshop SWEL'05:Applications of Semantic Web Technologies for E-learning,Banff Canada,2005:45-52.
[9]D Gasevic,J Jovanovic,V Devedzic.Ontology-based Annotation of Learning Object Content[J].Interactive Learning Environments,2007,15(1):1-26.
[10]Alistair Miles,Dan Brickley.SKOS Core Vocabulary Specification[EB/OL].W3C Working Draft.[2007-9-21]http://www.w3.org/TR/swbp-skos-core-guide,2007.
[11]Stojanovic L,Staab S,Studer R.Learning based on the Semantic Web.In Proc of the World Conference on the WWW and the Internet,Orlando,USA,2001.