APP下载

基于语义网技术的 高校多媒体学习资源查询系统设计*

2014-11-27李又玲

中国教育信息化 2014年7期
关键词:关键字资源库本体

李又玲

(成都师范学院,四川 成都 611130)

一、引言

在我国高校加快教育信息化发展的过程中,建设数字化学习资源中心是十分重要的改革措施。教育部发布的《教育信息化十年发展规划(2011-2020年)》第十二章“优质数字教育资源建设与共享行动”中明确提出:“实施优质数字教育资源建设与共享是推进教育信息化的基础工程和关键环节。到2015年,基本建成以网络资源为核心的教育资源与公共服务体系,为学习者可享有优质数字教育资源提供方便快捷服务。”

对于高校数字化学习资源中心的建设,有研究者指出,首先要实现校园内部的教育教学资源的积累与共享,其次要为教师教学、科研和学生学习提供良好的资源支撑和环境支撑,最后要为实现校际、区域、全国甚至全球范围内的资源共享打下基础。[1]

二、语义网——解决高校共享学习资源的可行途径

分析我国高校数字化学习资源中心的建设现状发现,目前高校已建成了很多学习资源库,例如精品课程网站、课程学习网站等,可供用户浏览或下载。然而,从资源共享的角度分析,这些资源库却无法互联、交流,原因在于:①各高校的资源库整体架构能满足内部的学习需求,但未对外提供程序访问资源库的专有接口,造成“资源孤岛”现象严重;②资源库中现存的都是非结构化、半结构化的资源,并且元数据未标准化,这些资源难以实现机器自动化检索,重用性很差。

对此,有研究者尝试使用语义网技术解决上述问题,寻求建设优质共享的数字教育资源的可行途径。语义网的核心思想是通过使用元数据将Web资源以机器可理解的方式描述和组织,提供数据的语义关系表达方式,实现网络资源在语义层上的全方位互联,满足Web应用对数据互操作性的要求,从而实现网络资源在最大范围内的共享。[2]例如,位传海等人就提出了学习资源语义检索系统。[3]

然而,这些基于语义网技术的学习资源检索系统都不支持对高校已建成的“旧”资源库的检索,并且目前也无研究者提出较好的资源对外共享方案。针对这两点,本文提出一种新的高校多媒体学习资源查询系统,解决思路如下:

(1)构建学习资源本体,并对其使用元数据标准描述,提高学习资源的可重用性和互操作性,实现资源库的语义化,为用户提供语义检索途径;

(2)充分利用已有基础,即现存的多源、异构的资源库,例如精品课程网站系统等,学习者能方便快捷地通过统一的接口进行新、旧资源的查询;

(3)由于学习资源文件存在多种格式(如图片、视频、音频、FLASH动画、Word文档、PPT课件等),单纯地使用关键字进行多媒体资源检索效率很低,系统还应支持对多媒体资源基于内容的查询;

(4)学习资源在语义层面上对外开放,方便机器的检索,以实现资源在更大范围的共享和互操作。

这样的设计充分考虑利用高校遗留的资源库,以期达到各种类型学习资源“新旧并存”、在校内外都能便捷地共享,本文的第三部分重点阐述该系统的总体设计和核心技术。

三、高校多媒体学习资源查询系统设计

目前我国高校普遍已存在的学习资源库一般都以RDBMS管理和存储资源,用户查询资源时需要输入关键字,由系统根据关键字构造SQL语句在数据库中检索与之匹配的内容。与之相对照,语义检索则主要是基于概念匹配,将传统方法中从用户查询和文档抽取出来的关键词替换为含有语义的概念,其更强调基于知识的、语义上的匹配,因此有更好的查准率和查全率。[4]

本系统则针对资源“新旧并存”的情况,为了更好地整合新旧学习资源,采取“混合查询”的解决方案:一方面,为“新”的学习资源构建学习资源本体,在查询中结合语义推理机(如Jena等)实现概念级的语义检索;另一方面,通过关键字匹配对关系数据库进行SQL查询,即可获得“旧”的学习资源。

高校多媒体学习资源查询系统主要由学习资源语义化模块、混合查询模块、资源对外开放模块构成,以下三小节重点阐述这三个模块的具体设计。

1.学习资源语义化模块

构建学习资源本体、语义化学习资源是进行语义检索的基础。DraganGasevic认为,学习资源是由学习资源元数据和学习资源内容构成,[5]因此将学习资源元数据标准IEEELOM[6]与具体学科的领域本体结合,即可形成某一具体学科的学习资源本体。然而,如果仅利用LOM标准构建学习资源本体则面临一个问题——无法对多媒体学习资源进行基于内容的检索,例如学习者搜索主要颜色为“绿色”的图片素材,仅依靠IEEELOM就无法描述。

因此,本文采用两种元数据标准构建多媒体学习资源本体,即多媒体元数据标准MPEG-7[7]和学习对象元数据标准IEEELOM。利用MPEG-7标准中的TextAnnotation对多媒体学习资源进行内容的关键字标注,即可将图片颜色、关键视频、音调等多媒体特征以关键字的形式存储于本体中,从而实现基于内容的查询。

本模块(见图1)的具体设计分为下列几部分:

(1)构建本体

由于MPEG-7基于XML而非RDF,因此就需通过XSD2OWL将MPEG-7标准的XMLSchema转换成本体,这样就能与其它本体集成,以增强其互操作性。[8]本文中将MPEG-7本体与LOM本体融合构成一个“多媒体学习资源本体”。[9]

(2)元数据生成

对于多媒体学习资源,用户需要通过各种元数据提取工具、元数据编辑工具等分别生成符合LOM标准、MPEG-7标准的XML格式的元数据。用户可以使用LOMEditor[10]生成支持LOM标准的元数据,但由于LOMEditor生成的元数据不支持MPEG-7,因此必须通过一些支持MPEG-7的多媒体标注工具来实现元数据的生成。例如,使用Caliph[11]、Mpeg-7AudioDB[12]等工具就能将JPEG图片、音频中的元数据提取并转换成符合MPEG-7标准的RDF输出。

(3)元数据集成

将上一步骤生成的两种元数据通过“元数据集成器”集成,“元数据集成器”利用一系列自定义的映射规则将不同的XMLSchema集成。

(4)本体实例化

需要通过XML2RDF将XML格式的元数据实例转换为RDF格式,并以三元组的形式存储于关系数据库中,另外在数据库中设计资源引用表,用于存储学习资源与其对应元数据的链接。

(5)元数据存储

将元数据以三元组的形式存储于关系数据库中供混合查询引擎查询。为提高系统性能,将多媒体学习资源与其元数据分别存储,学习资源以链接的形式存于数据库中,查询时通过元数据表查询匹配的资源,然后在资源引用表中找到多媒体资源的引用并查询到真实的存储位置。

例如,下列代码就使用MPEG-7标准中的链接标记MediaUri表示了一张JPG图片的地址,该地址存放于数据库的资源引用表中。

图1 元数据集成与本体融合模块

2.混合查询模块

该模块是实现多源、异构学习资源查询的核心,通过在用户接口处将查询分解以支持几种不同方式的查询。主要流程如下:

(1)查询解析

查询在用户接口处被解析成不同的组件,包括关键字匹配查询、元数据查询、基于关键字扩展的语义查询以及基于内容关键字的查询。

(2)关键字匹配查询

利用映射把语义查询转换为SQL查询,将SQL语句分配到遗留关系数据库上查询。

(3)元数据查询

使用SPARQL语句,在存储于关系数据库中的元数据三元组上进行查询。

(4)基于关键字扩展的语义查询

将“新”的学习资源本体化后以三元组的形式存储于数据库中,使用SPARQL进行查询——对接口处获取的查询请求,查询转换器按照多媒体学习资源本体把查询请求转换成规定的格式,在本体的帮助下从元数据库中匹配出符合条件的数据集合,将检索结果按本体论概念表现形式呈现给用户,供用户选择并查看。

(5)基于内容关键字的查询

首先将多媒体学习资源进行“内容标注”,即人为地将能表示该资源内容的关键字以标注的形式嵌入资源文档中,查询时以查询关键字去匹配内容关键字而得到结果。

例如,下面的代码是采用MPEG-7标准描述的一幅图片,其中使用TextAnnotation标注了图片的内容,并将图片分成几个子结构fflt;Whoffgt;、fflt;WhatObjectffgt;等,便于对图片进行基于内容的检索。

(6)混合查询的结果合并、排序和显示

本系统为支持使用不同学习终端设备(例如平板电脑、智能手机等移动设备)的用户,采用XML文件保存查询结果,通过系统与用户终端交互获得终端的型号等特征信息,再经过XSLT转换成特定终端类型的标记语言并显示查询结果,界面具有良好的自适应性。

3.资源对外开放模块

根据学习资源的来源,系统提供两种不同的资源对外开放方式:

(1)移动Agent方式

对于“新”的学习资源,由于这部分资源已标准化、语义化,共享性和可重用性很高,因此采用传统的分布式搜索技术与移动Agent技术进行集成,通过移动Agent将用户提交的查询动态地送往参与互操作的数字资源库服务器端执行,外部Agent可以搜索到资源并根据其元数据“理解”学习资源,从而方便地引用学习资源。这种方式可以大大减轻网络负载,消除网络延迟。

(2)关联数据(Linked Data)方式

由Tim Berners Lee提出的关联数据,给网络信息资源集成提供了一种有效的解决方案。[13]关联数据采用RDF数据模型,利用URI命名数据实体,来发布和部署实例数据及其他各类数据,从而可以通过HTTP协议揭示并获取这些数据,同时强调数据的相互关联、相互联系以及有益于人机理解的语境信息。

本系统采用Bizer C等人提到的方法,利用D2R[14]工具将存储于关系型数据库中的“旧”资源发布为关联数据。D2R主要包括D2R Server,D2RQ Engine以及D2RQ Mapping语言。D2RQ Engine使用一个可定制的D2RQ Mapping文件将关系型数据库中的数据映射成虚拟的RDF格式。这样,外部Agent在访问关系型数据时将RDF数据的查询语言SPARQL转换为SQL,并将SQL查询结果转换为RDF三元组形式的查询结果。

四、结论

在本文中,将语义网技术应用于建设高校的学习资源中心,实现了学习资源在语义层面上的互联,为学习资源库提供了统一的查询接口,既方便了新旧资源的检索,也对外提供了便捷的共享方式。该方案能完善地解决目前面临的遗留资源问题,也为实现高校之间甚至更大范围内的优质数字教育资源的共建共享提供了一种可行途径。

[1]杨娟,韩锡斌,何良春.构建大学网络教学资源中心[J].中国远程教育,2005(12):52-53.

[2]Berners-Lee T,Hendler J,Lassila O.The semantic web[J].Scientific American,2001,284(5):28-37.

[3]位传海,范太华.基于本体的学习资源语义检索系统研究与设计[J].电化教育研究,2012(2):70-74.

[4]李勇,张志刚.基于本体语义检索技术研究[J].计算机工程与科学,2008(4):17-19.

[5]Gaševi c'D,Hatala M.Ontology mappings to improve learning resourcesearch[J].British JournalofEducational Technology,2006,37(3):375-389.

[6]IEEE LTSC,IEEE Standard for Learning Object M etadata.[EB/OL].http://ltsc.ieee.org/wg12/par1484-12-1.htm l.

[7]MPEG-7[EB/OL].http://mpeg.chiariglione.org/standards/mpeg-7/mpeg-7.htm,2012-12-31.

[8]GarcíaR,CelmaÒ.Semanticintegrationand retrieval ofmultimediametadata[C].5th InternationalW orkshop on Know ledgeMarkup and Semantic Annotation.2005:69-80.

[9]Choe H.Interoperability between MPEG-7 and LOM using Ontology[J].Asian JournalofComputer Science and Information Technology,2012,2(11).

[10]Sarasa A,Piquer J,Arriola R,et al.LOMEditor:Composition and Classification of Learning Objects[M].Computersand Education.SpringerLondon,2008:241-249.

[11]Lux M.Caliphffamp;Em ir:MPEG-7 photo annotation and retrieval[C].Proceedingsof the17th ACM international conference on Multimedia.ACM,2009:925-926.

[12]G.Tummarello,C.M orbidoni,F.Piazza,MPEG-7 Audio Db[DB/OL].http://www.sourceforge.net/projects/mpeg7audiodb.

[13]T.Berners-Lee,"Linked Data",In TED 2009 Conference,Long Beach,CA.USA,February 2009[DB/OL].http://www.w3.org/2009/Talks/0204-ted-tbl/#(1),2011-1-13.

[14]Bizer C,Cyganiak R.D2r server-publishing relational databaseson the semantic web[C].5th international Semantic W eb conference,2006:26.

猜你喜欢

关键字资源库本体
幼儿园课程资源库建设之浅见
履职尽责求实效 真抓实干勇作为——十个关键字,盘点江苏统战的2021
健身气功开放课程资源库建设研究
眼睛是“本体”
成功避开“关键字”
数控加工专业资源库建设中存在问题及对策
基于共享资源库的混合式教学考核模式研究
基于本体的机械产品工艺知识表示
专题
Care about the virtue moral education