基于元数据的内容管理平台的研究
2015-03-16金成张义伟
金成 张义伟
摘要:文章介绍了基于元数据的内容管理平台在高校网站群的应用背景,讨论了内容管理包含的几个主要方面。其中重点研究了内容管理和元数据的关系,以及元数据的存储方法及表示格式。结合内容管理在高校网站群的应用背景,给出了元数据的属性表。内容展示在内容管理中占有很重要的地位,文章介绍了VTemplate模板引擎在内容展示中的应用,并以具体实例说明了内VTemplate模板的设计和使用。
关键词:内容管理;元数据;模板
中图分类号:TP3 文献标识码:A 文章编号:1009-3044(2015)04-0008-05
1 概述
教育信息化经过了几十年的发展,有了一定的发展,也出现了很多的问题,出现的问题主要有以下几方面。一、重复建设。每个部门每个学院都要建立自己的网站。赶上某些特殊时期,还要建立特殊的专题网站。二、浪费资源。每个部门每个学院的网站,都要有人设计,建成之后还要有专人负责维护管理,还要买专门的服务器或者电脑。每过一段时间网站的界面还要更改,还要重新进行版面设计,调整,所有这些工作都造成了极大的资源浪费,这里的资源浪费即包括硬件资源的浪费,也包括人力资源的浪费,还有财力资源的浪费。三、信息不能共享。由于每个网站都是独立的,网站与网站之间的数据存储格式,数据所用的数据库,以及网站的平台可能都不一样。这样网站和网站的数据就变成了一个一个的数据孤岛,彼此之间没有办法进行沟通和互相利用。信息的重用率非常低。四、安全隐患严重。各个网站的技术水平,代码质量都参差不齐,这就给整个学校的信息安全和数据安全造成了极大的安全隐患。
而解决这些问题的一个非常好的方法是采用内容管理平台。内容管理系统就是在这个背景下产生并迅速发展的。
2 内容管理
内容管理系统是对网站功能的抽象,是将网站内容和它最终呈现的页面显示相分离,模块通用性强,操作简单,功能多样,使得用户可以方便快捷地管理及改版网站内容。内容管理系统处理的对象是“内容”。内容比数据的范围更广。一般认为,传统关系数据库管理系统(RDBMS)以处理结构化数据为主,内容管理系统处理的数据以非结构化数据为主。或者说内容管理系统是处理任何你想发到Internet上的东西,包括文字、图片、图表、声音、影像、广告、javascript程序等等这些结构化数据和非结构化数据。 [1]内容管理所要解决的问题主要包括内容的采集、内容的管理、内容的存储、内容的发布、内容的展示等等。不仅如此为了和现有的结构化数据处理程序如ERP、CRM等进行结合,与这些系统进行数据交换,甚至为这些应用系统提供更加广泛的数据来源。这些都是内容管理系统所要解决的问题。
2.1 内容采集
内容采集是指内容的创建、制作并将其录入到内容管理系统的过程。[2]内容管理系统通常提供一个基于浏览器的内容在线编辑器,通过它可以录入文字、传入视频、插入图片,对内容的格式进行调整等等。内容采集完成之后可以预览,如果符合要求就可以进行内容的发布了。
2.2 内容存储
创建后,内容就被存储在内容库中,内容库可以是传统的关系型数据库像Oracle、DB2、SQL Server等等,也可以使XML文档,或者是XML数据库等等。 内容库是内容管理系统的核心组成部分,内容库的应用,可以使内容统一管理避免冗余,方便的进行内容的共享等。
2.3 内容管理
内容管理是指对内容的一系列重要的操作,包括内容的删除、更新、引用、审核、内容的版本控制等管理操作。[3] 除此之外,内容管理还包括工作流程的管理,为实现某个业务目标,在多个参与者之间,利用计算机,按某种预定规则对内容进行审核、修改、下架等工作流程操作,工作流管理允许多用户参与到工作流中,共同对内容进行管理。内容管理系统可以根据内容的创建者,创建者所属的部门,工作职责、工作分工等把内容管理人员分成不同权限的用户组,然后再给不同的用户纳入到不同的不同的用户组里。一个用户还可以在多个组里。这样每个用户就被赋予不同访问、操作、管理、使用内容的权限, 从而使得内容的管理更加方便,更加容易操作。
2.4 内容发布
内容发布是利用内容管理平台,将内容库中的内容以HTML或者XML、PDF、Aspx、jsp等形式发布到互联网或者局域网的过程。内容发布往往和内容采集集成在一起,很多情况是内容采集完就进行发布。因此内容发布一般也是通过在线编辑器来进行的。不过和内容采集相区别的是,在内容发布过程中经常需要一些常见功能,例如:搜索引擎、天气、日历、留言板、Email、投票等。这些功能通常会集成在内容管理系统中,通常以组件、用户控件或第三方插件的形式集成到内容管理系统中,方便内容的发布。 [4]
2.5 内容展示
内容展示是内容以什么显示方式、什么风格、什么界面等展现给用户。好的内容展示形式可以给用户非常好的用户体验,不仅如此还可以使用户更方便的获取内容,内容的价值更好的体现出来。内容展示通常使用模板技术,模板技术本质上是一种符号替代技术,也就是将一些特定的符号插入到模板文件中,内容展示的时候将这些特定的符号替换成一定格式的内容库中的内容。模板技术是MVC模式的具体应用。它的好处是可以将内容和展示分离,这样就将内容的采集、内容的管理和内容的展示分离了,有助于各种人员分工合作,独立工作互不影响。页面设计人员只关心内容的展示,他们将内容展示方式存储在模板里,而内容的存储则由后台人员通过设计存储模型、设计数据库、设计表等方式存储在在数据库或独立的XML文件中。 这种设计的好处是显而易见的,数据的存储方式不用影响到前台内容的展示,而内容展示的风格、样式也不用影响到内容的存储以及程序。
3 元数据与内容管理的关系
3.1 元数据
元数据 ( Metadata) 是关于数据的数据, 是信息整合中共同遵守的约定。元数据是对内容的一种描述方式,它的格式是可以由计算机系统使用处理的。元数据与内容相关, 用于描述内容的一系列要素, 包括内容的创建者、创建时间、语言、题目、类型、来源等。通过元数据的描述,内容的属性和结构信息可以清楚地表达出来。元数据虽然是描述内容的,可是也可以对元数据就行单独处理,这样就非常方便的对内容进行处理了。
3.2 元数据的作用
元数据对于数据文档的建立、数据发布、数据浏览、数据转换等,对于促进数据的管理、使用和共享有重要的作用。原始数据如果没有元数据,就不能有效地进行管理和使用。有一条规律就是元数据越复杂,内容潜在价值的提升就越大。[5]
元数据的主要作用包括:
1) 对数据进行有效的管理和维护。更好的理解数据。包括数据的分类、数据描述的内容、数据质量、作者、建立时间等信息。通过建立数据文档和挖掘信息资源可以避免数据因人员调动而造成数据无法理解和使用的情况,也可以更方便的响应用户的查询,更有效的提供对决策的支持。
2) 用来建立信息的数据目录和数据交换中心和数据交换标准。数据交换时,如果没有统一的标准,数据之间由于名称、格式、字符长度等等信息均有可能不同,数据之间就不可能互相共享。 [5]
3) 提供数据转换方面的信息。使用户在获取信息的同时便可以得到元数据信息。通过元数据,进行不同方面的科学分析和决策支持,有效的进行数据挖掘。
3.3 元数据的存储
元数据的存储和格式有很多,其中用的最多的也是最有影响的是基于XML格式的存储和表示。XML(Extensible Markup Language)是W3C标准,可扩展标记语言。XML是描述半结构化数据或者非结构化数据的一种理想的语言。在W3C标准中,还定义了XML Schema。XML Schema定义(XML Schema Definition,XSD)也是一套W3C标准,用于基于XML的称为XML Schema的类型系统。用于定义的语言是一种称为XML模式定义语言(XML Schema Definition Language)的XML语法。对于用XML来描述元数据,我们可以根据XML的标准设计一套符合本行业本系统的特定的标签,既利于计算机系统进行处理,也适合人们的理解。 一旦采用XML表示文档中的元数据,我们可以将元数据与其显示方式进行分离。方法是通过XSL(Extensible Stylesheet Language)文档。利用XSL定义可以为不同的元数据根据不同用户的不同需求、不同权限或者不同的显示能力定义不同的显示方式。 基于XML的内容管理系统利用XSL可以在文档层实现数据模型层与表示层之间的分离。[6] 元数据用XML进行存储也有一个优点,就是可以方便的进行数据的共享和交换。不同系统的数据格式和表示方法千差万别,这就给数据的共享和交换带来了麻烦,我们可以用XML格式作为数据转换的桥梁和标准来进行数据交换。
3.4 元数据包含的属性
元数据的设计在内容管理系统中占有举足轻重的作用。元数据应该包括哪些属性呢?对于不同的领域、行业和不同的应用环境,元数据的属性包含的内容各不相同。其中影响比较大的是都柏林核心元数据元素集。
都柏林核心元数据元素集是用于描述资源的十五个属性的一个词表。[7]它们分别是:其他责任者(contributor) 、覆盖范围(coverage) 、创建者(creator)、日期(date)、 描述(description)、格式(format)、标识符(identifier)、语种(language) 、 出版者(publisher)、关联(relation)、权限(rights) 、来源(source)、主题(subject)、题名(title)、类型(type)
由于都伯林核心元数据集的权威性和使用的广泛性,很多信息管理系统都以它为基础,本系统也是以它为基础,另外根据系统本身的特点,加入了适合自身系统的元数据元素。下面以文章元数据为例来说明。[8]如表1就是文章元数据属性表。图1是文章元数据的录入界面。
5 结束语
目前,基于元数据的内容管理平台在学校的网站群建设中发挥了重要的作用,整个网站进行了集中统一管理,节省了大量的人力和物力。信息进行了有效的管理,各网站的信息的共享信息的传递变得很简单,自从实现了基于元数据的内容管理平台的网站群系统以来,网络安全得到了很好的保证。尽管如此,我们对元数据在内容管理中的应用还处于进一步的研究之中,各网站之间数据共享,和信息的再利用也有待进一步完善。
参考文献:
[1] 伍波华.网站内容管理系统关键技术研究[D].长沙:中南大学,2010.
[2] 杜义华,张亚.中国科学院网站群建设的系统工程方法[J].计算机系统应用,2012,21(1):17-20.
[3] 顾炳中,叶兴茂,咸容禹,贾光宇,谢敏.国土资源部门户网站群内容管理体系的设计[J].国土资源信息化,2012(1):8-14.
[4] 崔宝娟,苏中滨,沈维政.基于ASP.NET的网站群动态建站技术研究[J].计算机应用与软件,2011,28(3):116-118.
[5] 吴晓红,高志新,王杨刚,等. 网站群信息共享探析与实现[J].国土资源信息化,2013(3):29-33.
[6] 程林刚.基于内容管理的元数据的存储研究[D].西安:西安电子科技大学,2010.
[7] Dublin Core Metadata Element Set, Version 1.1[EB/OL].http://dublincore.org/documents/dces/,2012-06-14.
[8] 廖旺胜,范冰冰. 基于CMS的属性自定义方案的设计和应用[J]. 计算机与现代化,2013(8):140-144.
[9] 南轶,李先国.模板技术在内容管理系统中的研究与应用[J]. 微电子学与计算机,2012(6) :180-184.
[10] 基于.NET的免费开源的模板引擎—Vtemplate [EB/OL]. http://www.cnblogs.com/kingthy/archive/2009/08/17/net-vtemplate.html.
[11] 蔡群英.校园网内容管理系统的设计和实现[D].成都:电子科技大学,2013.