浅析XML及元数据在资源共建共享中的应用
2012-09-18陈华予
陈华予
浅析XML及元数据在资源共建共享中的应用
陈华予
摘 要:随着我国远程教育的不断发展,构建一个与现代远程教育发展相适应的资源共建共享体系已经成为一个迫切需要解决的重要课题。要有效实现教学资源的共建共享,就要求教学资源和教学资源库的开发应满足一定的标准和规范。通过对系统构建教学资源共建共享体系的研究和实践,可以提出符合标准的资源库设计方案,并对如何实现资源的共享提出相应的看法及建议。
关键词:远程教育;资源库;XML;元数据;共建共享
陈华予/吉林广播电视大学实验师(吉林长春130022)。
教学资源是开放教育学员自主学习的重要媒体,也是远程教育赖以生存和发展的基石之一,如何有效开发和利用教学资源是需要广大远程教育工作者进行研究和探索的主要课题。由于教育水平发展的不均衡和每个人教育观念的不同,教学资源的开发和建设呈现出鲜明的复杂性和多样性,这给教学资源的管理和利用带来许多困难。教学资源利用率低、开放性较差、不利于二次开发和低水平重复建设的问题日渐突出,在一定程度上影响了远程教育的深入发展和与国际网上教育体系相沟通。
现代远程教育资源建设包括媒体素材库、题库、案例库、课件库、实体资源库和网络课程建设,以及适合多种教学模式的教学支撑系统和现代远程教育管理系统,这些内容及其它们之间的关系构成现代远程教育资源体系结构。
媒体素材库在整个资源中是最基础的,课件库中的课件、案例库中的案例、网络课程,甚至题库都可能要使用媒体素材库中的媒体数据,多个知识点课件或不同教学环节的课件、自测或考试题库综合而成网络课程。因此在本文中,对应用XML和元数据进行媒体素材库的设计与管理进行探讨。
一、XML和元数据简介
元数据也被称为是关于数据的数据,是专门用来描述数据的特征和属性的,它能用来支持电子资源的定位、发现、评估和选择等。元数据规范提供了一个定义元素的结构,它可以根据元素的使用和表现要求来对资源提供描述和分类,使得寻找和使用资源的过程更有效。
XML是一种可扩展的标记语言,它具有强大的文档描述功能,并且形式与内容分离。由于XML本身始终以纯文本形式存在,独立于编程语言,使它能创建不依赖于平台、语言或限制性约定的开放数据,成为了各个领域数据的首选载体。在远程教育领域,XML已经成为学习对象元数据标准、内容包装标准的最好载体语言。
二、媒体素材库的开发与设计
远程教育技术标准委员会参照IEEE的LOM模型制定了《现代远程教育资源建设技术规范》,提出了教育资源元数据的描述框架。这是一个较为宽泛的标准,进行如下几方面的规定:一是从资源的技术开发方面,提出一些最低的技术规范要求;二是从便于用户使用方面,需要对素材标注属性,并从可操作性的层面规范了属性的数据类型,这部分参考了IEEE的LOM模型,从制作素材的简便性、使用素材的方便性角度上选取了部分最为普通的元素;三是从易于管理方面,提出了管理系统以及教学支持平台所应具备的一些基本功能。[1]
基于上述标准,我们在开发媒体素材库时,采用核心元素、可选元素、扩展元素对素材库内的资源进行描述。
(一)规范编码规则
编码是资源素材库中用于标识和管理素材的标识,除应具有唯一性、可扩展性、稳定性和易识别性等特点外,还应满足教学资源共建共享的需要;因为资源库的建设和应用是一个长期的系统工程,在设计和开发时要充分考虑到将来升级、维护和与国内外合作单位进行资源交换和共享。因此,我们在设计素材资源库的编码方案时,采用分级分段编码的形式来定义素材资源的编码。
编码的第一级采用国家标准高等学校专业编码(98版),码长6位,从而保证素材资源顶层编码符合国家标准。
编码的第二级采用全国电大专业规则课程标准编码,码长6位,从而保证编码有良好的扩展性,并能够实现与教务系统和电大在线教学平台的衔接。
编码的第三级为素材自身的自定义编码,用以标识素材所属课程的章、节编码和素材的序码,码长10位,这样有利于依据课程和教材的差异来组织和管理素材。
这样实现的分级编码在进行素材管理和检索时,前两级编码由素材资源库的管理员根据高等学校专业编码和电大专业规则编码在资源库系统中建立好,操作员可根据素材所属专业和课程分极进行选择,而不需要了解上级编码的具体内容,极大地提高了系统的易操作性。
相应的数据表典型结构如下:
字段含义 字段数据类型 说明id Int 系统自动编号,主键本级编码 Char本级中文名称 Char上级编码 Char本级编码级别 Char 具体素材只能在三级编码层次上………
(二)规范素材描述与格式
《现代远程教育资源建设技术规范》按媒体素材所采用的媒体技术分为五大类:文本类素材、图形/图像类素材、音频类素材、视频类素材、动画类素材等五类[2]。对于要加入媒体素材资源库进行共享和管理的素材,要进行严格的审核,不符合规范要求的素材要按要求进行转换和加工,使其满足网络化传输的要求。如:视频类素材转换成As f、Rm、flv流媒体格式,音频类素材转换为wav、mp3格式,动画类素材使用s wf格式,图像类素材使用gif、jpg格式,文本类素材可使用doc、pdf等。
《现代远程教育资源建设技术规范》为上述五类素材中的每一类素材规定了需要标注的属性。其中既包含可与LOM中的元素相对应的属性,也包含LOM模型规定以外的关于各类素材特有的技术属性。
核心元素是教育资源元数据实现互操作的基础,是教学资源最基本的描述信息,通过这些基本信息可实现对资源的分类管理和检索。通过参考LOM规范和分析远程教育素材管理的实际应用,我们选取的核心元素和对应的素材属性如下表:
LOM的核心元素 资源素材属性通用/标题 资源素材ID通用/描述 资源素材描述通用/关键字 资源素材的关键字技术/格式 资源素材的格式类型分类/目的=“课程” 专业(课程)
可选元素和扩展元素是对核心元素的扩展,主要用来标识素材应标注的属性、技术属性和管理属性,通过参考LOM规范和结合远程教育素材库的应用,我们设置了其它属性,主要包括:入库日期、作者、存放位置、资源类型、资源类型对应的相关技术属性(可包含多个条目)、加工人、审核人等,有效增强了资源描述和管理的灵活性。
通过分析各类素材的属性集,找出素材的相同属性,从而设计出记录素材共性的数据表和记录各类素材个性特征的数据表,确保设计的媒体素材资源库的数据结构适应共建共享的要求。
(三)规范管理和交换接口
提高资源检索和数据交换的效率是实现教学资源共建共享的有效手段,研究教育资源共享,就是要充分利用现有的资源库,将不同结构的数据统一为基于XML的数据,并在此基础上表述、传输、转换和查询。这也是实现网络上众多的教育资源元数据标准化方案之一。
由于XML文档属于半结构化的数据,它在对结构化的数据(如SQL SERVER数据库)或半结构化的数据进行转换时,关键是要建立不同层次结构之间的映射关系[3]。我们在进行资源库管理平台和应用平台的开发和设计时,定义了相应的用于数据管理和交换的XML模板,通过在XML文档中嵌入可执行指令,系统在执行检索和转换过程中,通过自动识别和转换指令,用执行生成的结果替换指令所在位置的内容,从而生成检索结果或用于交换的XML文档,这样就规范了检索和交换的接口,从而有效提高了资源共享和交换。
三、结束语
教学资源建设是现代远程教育的基础,是需要长期建设与维护的系统工程,而教学资源的共建共享研究也是当前远程教育的热点问题之一。研究教学资源建设和管理的标准化设计,探索教学资源共建共享的交换方法,有利于提高资源共建共享水平。现代远程教育日新月异,但从发展和建设需求的角度来讲,标准化和规范性还有待进一步加强,与其它教育单位的数据交换手段还不够丰富和完善,这也是远程教育工作者今后研究和探索的一个主要方向。
:
[1][2]教育部现代远程教育技术标准化委员会[S].现代远程教育技术规范,2001
[3]李思莉,李娟.XML文档到关系数据库的映射策略[J].计算机工程,2010,36(5):40-45
中图分类号:G250
B
1671-6531(2012)11-0092-02
:郭一鹤