APP下载

Web内容管理:概念、原则及核心

2009-07-13

现代情报 2009年4期
关键词:理论研究

杨 涛

〔摘 要〕在分析内容和内容管理概念的基础上,提出了Web内容管理的涵义,总结出内容重用、内容和表现分离、多渠道出版等Web内容管理的三项原则,最后对Web内容管理的核心——内容单元进行了剖析。

〔关键词〕内容管理;Web内容管理;理论研究

〔中图分类号〕TP393 〔文献标识码〕A 〔文章编号〕1008-0821(2009)04-0013-04

Web Content Management:Concept,Principles and CoreYang Tao

(Library,South China Normal University,Guangzhou 510631,China)

〔Abstract〕Web content management(WCM)is a broad term that encompasses a number of more specific tasks and organization goals,involves a variety of roles and responsibilities.WCM examines and seeks to improve the organizational tasks,goals and roles that produce,maintain and retain high quality content on Web.This paper analysed conception,principles and core of WCM.

〔Key words〕web content management;content management;theory research

随着网络从Web1.0时代单纯通过网络浏览器浏览html网页向内容更丰富、联系性更强、工具性更强的Web2.0时代的发展,很多网站往往不能迅速跟进业务模式变革的步伐,常常需要花费相当多的时间、人力和物力来处理信息更新和维护工作;遇到开发新的应用如wiki、blog、SNS等时,整个网站的整合工作就变得更加困难。Web内容管理应运而生,解决海量信息的组织和管理问题。

1 Web内容管理的概念

1.1 内 容

内容一词来源于出版传媒业。通常将图书、报纸、杂志、唱片、影片里的创作叫做内容。随着信息流通速度的加快,网络的普遍使用,内容的涵义也发生了变化。有的观点认为内容是结构化数据的统称,也有的观点认为内容是非结构化数据的统称[1]。笔者的观点是,内容既包括结构化数据,又包括非结构化数据,甚至是半结构数据。内容可以是文本、图形、图像、网页、文档、数据库甚至是网络上的交互操作。

内容具有格式和结构。为了能够通过计算机进行交换,首先必须对内容进行编码。编码也叫做格式。在计算机中,格式包括两个相关概念:二进制格式和表现格式。二进制格式又叫文件格式,它负责储存。计算机文件是储存内容的传统方式,因此二进制格式也叫文件格式。表现格式就是内容的显示方式。结构是将内容组合在一起的方式。它包括内容的部分和片断以及它们之间的相互关系。为了使内容能够在多个地方使用,内容管理者希望格式最好能够和内容分离;但是对于内容的消费者来说,这二者不可分,比如读者拿到一本杂志,杂志正文之外的页面布局和字体都会带给读者一些信息。

内容的结构和内容的格式是两个容易混淆的概念。以网页的结构和格式为例:网页的结构就像蜘蛛网,它包括网页内部的结构安排,如等级结构、顺序结构,还有网页之间通过链接建立起来的结构。网页的格式包括网页的字体、颜色等。

1.2 内容管理

与早期的内容概念一样,早期的内容管理偏向出版物的管理,以储存、工作流程、元数据为核心元素。储存以关系数据库方式为主,有时候也以一般数据文件方式储存,或者根据需要二者兼而有之。内容从制作、编辑到成品储存,都需经过或多或少的加工过程,各种工作流程相差很远。有的是简单的单线流程,有的是分叉多线的并行操作。元数据是对内容的描述,如作者、日期、关键词、媒体种类、版权等,目的是跨媒体出版和个性化出版。随着内容范围的扩大,内容管理的含义也在扩展。网络的发展给内容管理打上了深深的印记,现在内容管理几乎成了Web内容管理的同义词。

内容管理现在还没有统一的定义,不同的机构有不同的理解。多以其涵盖的范围、过程及功能等来定义内容管理。Byrne认为内容管理是组织混乱内容的一种方式。内容管理系统允许组织一次性创作和中央化存储内容,使得它能够被需要它的人获得。能够以对用户最有意义的方式去打包和分发内容[2]。ZiaContent将内容管理定义为:“内容管理是在一个协作的环境下支持创建、储存、获取和出版内容的基础结构。[3]”Boilo的观点是内容管理实际上是一个收集、管理和出版内容到多个渠道(网站、光盘等)的整体过程[4]。Wikipedia将内容管理定义为一套支持数字信息生命周期进化的流程和技术[5]。

以上定义大多数都以管理为重点。但实际上内容管理包括管理的过程和对象。内容管理不仅是创新的技术和管理过程,更是一种先进的理念。内容管理关注具体领域中包含着大量相互关联的任务、目标和责任。内容管理重点解决各种非结构化或半结构化的数字资源的采集、管理、利用、传递和增值,并能与组织的其它信息系统(如企业资源计划ERP、客户关系管理CRM等)有机集成。

根据内容所指的具体对象的不同,可以将内容管理分为Web内容管理、企业内容管理、学习内容管理和媒体内容管理等。

1.3 Web内容管理

明确内容管理的概念之后,Web内容管理的涵义就迎刃而解了。Web内容管理关注的领域是Web内容,具体可以分为:

①Web页面和页面中的文本、图形、图像、视频、音频等信息;

②可以下载或者在线阅读的各种类型的文件(如doc文件、pdf文件等);

③Web数据库信息(如用户信息、交易数据、日志等);

④来自其它网站的信息;

⑤Web中的各种交互操作。

Web内容管理的任务就是高效、便捷地创建和出版数字化内容。这些内容的受众包括通过外联网、因特网、内联网、无线设备、只读光盘、纸张等渠道获得Web内容的用户、合作伙伴、供应商和组织成员。

2Wed内容管理的原则

2.1 内容重用

2.1.1 内容重用的概念

内容重用是指使用已经存在的内容去创建新文档的过程[6]。其实,大多数人都已经在无意识中进行过内容重用的实践,如使用微软Word提供的复制和粘贴等功能。但是,复制和粘贴存在很多缺点,最主要的问题是复制和粘贴的内容不会在源文件变化的时候同步改变,而是必须手工进行修改。这个过程不仅花费时间,而且在操作过程中有时候会丢失信息,导致内容的不一致性和不准确性。随着时间的积累,不一致的地方可能会越来越多,最后就会发现复制和粘贴的内容与源内容完全不同。内容的重用超出了复制和粘贴的范畴,内容的重用使得重用的内容“链接”到可重用内容单元,这样在更新的时候,重用的部分就随着源内容的变化而自动更新。

重用的内容在重用的地方显示,但是只在系统的一个地方保存。任何内容都可以被重用,如图形、表格、多媒体等。基于文本的材料最容易重用,其中的某个词、某个句子、某段话甚至某个章节都可以被重用。

2.1.2 内容重用的优点

(1)提高内容的一致性

当内容是写一次而重用多次的时候,可以确保在它重用的地方一致。这样就保证了内容的高质量。能够重用的内容是结构化的内容,相似种类的内容结构也相似,这样就保证了重用内容之间的风格一致。

(2)降低内容的创建和维护费用

内容的重用使得所需创建内容的总体数量得以降低。内容的重用使得不需要浪费时间去寻找和复制要重用的内容,通过加入元数据可以使制作者迅速得到或者自动得到需要重用的内容,内容在此过程中得到更好的组织,整个过程更有效率,进一步降低内容创建的费用。

当内容更新的时候,不用寻找重用的内容在哪些地方存在,通过Web内容管理系统的追踪,可以使内容在所有重用的地方自动更新。这样就降低了内容的维护费用。

(3)加快内容的重新配置

重用的内容都是模块化、结构化的内容。重用的内容能够通过重新配置去满足用户不断变化的需求。改变模块的顺序、引入新模块、删除现存的模块等方式都可以用来构建全新的信息产品去满足用户的新需求。

2.1.3 内容重用的方式和类型

内容重用主要有2种方式:偶然性重用和系统性重用。偶然性重用是指制作者有意识的寻找内容单元然后重用。偶然性重用要求制作者意识到存在可重用的机会,寻找和发现可重用的内容。偶然性的重用是内容重用最通常的形式。它不依赖具体的技术,在没有Web内容管理系统的情况下也能进行。

与偶然性重用相对照的是系统性的重用。系统性的重用是有计划的重用。特定的内容被识别可以在特定的地方重用。系统性的重用必须在内容管理系统的帮助下才能够实现。内容管理系统自动地在文档的适当位置插入可重用的内容。制作者不用去寻找可重用的内容。系统性的重用将制作者从意识到可重用的内容存在、找到可重用的内容和插入到适当地方的负担中解放出来。系统性的重用需要事先做好计划,在Web内容管理系统的配置中决定好什么样的内容要重用,怎么样重用等问题。

在偶然性重用和系统性的重用中,存在3种类型的重用:锁定性重用、派生性重用和封装性重用。

锁定性重用是指重用的内容单元在重用的时候保持不变,只有拥有适当权限的人才能够改变锁定的内容。要保持重用的内容原封不动,就可以采用锁定性重用。当制作者对重用的内容进行编辑后就变成原来内容的派生内容,也就成为派生性重用。派生性重用很常见,在派生性的重用中可能是保留关键性内容,但是要对内容的形式进行一些调整,如语态的变化(从主动语态变成被动语态)、拼写的变化(由美式英语变成英式英语)、强调部分的变化等。当一系列重用的内容单元包含在一个大的内容单元的时候就成了封装性重用。所有的内容单元之和成为一个新的内容单元,内容单元内的子单元能够在不同的信息产品中使用。封装性重用使得内容的制作者可以为所有的输出同时创建内容,加速了内容的创建过程。如封装性的重用可以在网站同时需要某种产品的详细内容和简略内容的时候使用。

2.2 内容与表现分离

内容和表现分离就是将内容本身与其表现格式分离。用HTML语言编写的静态网页的内容本身与其表现格式就紧密结合在一起。内容本身与其表现格式结合在一起会带来诸多问题:

2.2.1 管理不便

同一内容通常会有多种表现格式,如果内容和表现紧密结合,就意味着有同一内容的多个不同版本重复出现在系统中。这就给内容的更新、内容的一致性维护等带来很多潜在麻烦的问题。

2.2.2 检索不便

不同表现格式的描述机制不同,这给内容的检索带来一定的困难。检索程序必须处理各种表现格式的描述语法,才能检索出正确的内容。

动态网站技术的出现使得可以将内容本身保存在关系数据库里面,当用户浏览时再从数据库中取出相应内容,使用程序生成HTML传递给用户。但是动态网页的技术要求较高,有时候会因为技术的限制而忽略内容的表现。

Web内容管理系统通过模板技术来解决这个矛盾。内容的存储使用关系数据库或者其它形式的数据库,使用模板来合成最终的页面。模板可以由设计师设计或者懂得相关技术的人设计。

内容本身与表现的分离使得普通的人员也能够参与到网站内容的制作之中。对于不懂网页制作技术的人员来说,他们只知道“内容”或者说是“文档”的概念。在他们看来,他们拥有的只是一篇一篇的文档,里面有表格、数据等,他们只需要提供这些原始的资料,至于如何在网站上呈现,他们并不需要明白,也不用理会。Web内容管理系统提供工具将这些原始的资料进行转换和加工,以适当的形式将内容展现出来,加快网站内容的制作和更新,更好的发挥网站的作用。

2.3 多渠道出版

Web内容管理强调内容重用,内容重用的表现形式之一就是内容多渠道出版。2004年2月,美国头号有线电视运营商康姆卡斯特提出准备以660亿美元收购迪斯尼公司,虽然最后遭到了迪斯尼公司的拒绝,但是此事还是造成了很大的震动。康姆卡斯特的优势在渠道,迪斯尼的优势在内容。优秀的内容也要以方便用户的渠道传播出去才能使内容的价值得以充分实现。“内容为王”应该改为“内容和渠道为王”,二者并重,Web内容管理系统设计时就要为多渠道出版做好准备,宁可备而不用,不能用而不备。

3 Web内容管理的核心

传统网站开发工具(如微软的FrontPage和Macromedia的Dreamweaver)一般用文件和文件夹来创建和管理网页。这种模式对于大型动态网站的开发和管理来说效果并不是很理想,并且对内容重用、内容和表现分离、多渠道出版的支持不够。为了解决这些问题,Web内容管理借鉴了面向对象程序设计和XML语言的相关思想,引入内容单元(content components)的概念。内容单元成为Web内容管理的核心,也是先进Web内容管理系统和普通网站开发工具的区别所在。

3.1 内容单元的含义

内容单元是内容管理对象中有实际意义的基本单位。内容单元将信息分解为便于管理和重用的组块。这些组块具有共同的格式和广度等特征。但是每一个内容单元都是与其它内容单元存在一定联系的独立个体。Web内容管理系统生成网页的时候,是将一个或者更多的内容单元聚集成页面框架或者模板中完成。

内容单元与文献单元、知识单元一脉相承,只是对象从文献、知识转移到内容。文献单元是指“专门记录和传递有知识的人工载体单元”[7]。文献单元往往还可以分解成若干具体的单元形式,如文献的知识内容单元、知识形式单元和载体形态单元。其中所谓的知识内容单元是针对文献中所包含的知识体系而言。文献单元知识内容涉及到多少主题,就可以视为有多少知识内容单元,而知识单元是客观知识系统中有实际意义的基本单位。

内容单元的概念和面向对象的程序设计方法中的对象的概念非常相似。在面向对象的程序设计方法中,程序员编写的就是对象,也就是完成一段任务然后就停下来的小程序。对象是小的可以重用的功能片断,程序员将对象连接起来获得复杂的功能。面向对象的程序设计将数据及对数据的操作放在一起,作为一个相互依赖、不可分割的整体来处理。例如,电子商务网站可能包含一个处理交易的对象。网站程序员将这个对象和其它对象连接起来去创造整个站点机制。对象的核心资源封装在一个程序员知道如何去应用的容器中,因此,通过知道怎么样使用标准容器(通常叫做应用程序接口,或者是API),程序员能够容易地使用对象。程序员可以调用交易对象去执行诸如计算订单的总价、计算要缴纳的税款或者处理信用卡。

内容单元或者叫做内容对象,是基于同样的原理。内容管理系统的用户使用内容单元的方式和程序员使用对象的方式一样。他们只用学会如何处理内容单元,而不是内容单元中的信息。在上面提到的电子商务网站中,每一种产品可能作为一个内容单元而存在。通过内容单元的组合和匹配生成网页中的信息,如产品的目录页、产品的详细信息、显示特定价格或者种类的产品。

3.2 内容单元的类、实例和元素

内容单元的类和实例都是借用面向对象系统中的相关概念。类是面向对象系统中非常重要的概念,面向对象程序设计中所有的操作都可以归结为对类的操作。类是一组客观对象的抽象,它集中概括了该组对象的共同特征,以说明该组对象的能力和性质。实例是组成类的对象。类与实例之间的关系可以看成是抽象和具体之间的关系。

类似的是,内容单元的类是有关怎么样创建一个特定内容单元的模型、模板和规则。内容单元的类包括了内容单元类的名称,内容单元包含的元素、以及创建该种内容单元的规则。

3.3 内容单元的存储

内容单元的存储方式有多种,最常见的有文本文件、结构化文件、关系数据库、对象数据库等。比较少见的是内容单元存储在对象数据库中。

3.4 内容单元与网页

在Web内容管理系统中,内容单元与网页是两个相互联系但不尽相同的概念。网页是内容单元的天然候选者。网站通常包括一系列独特内容的链接页面。市场上大多数Web内容管理系统现在还只是管理网页而不是管理内容单元。网页和内容单元的区别如下:

①对于网页来说,内容和外观不可分割。但是内容单元要求内容和表现分开。

②当网页之间存在内容的共享时,必须保存同样内容的两个备份。但是如果是内容单元的重用,就只需要保存一个。

③有时候网页的创建是动态的。也就是网页并不实际存在系统中,而是根据用户的请求而动态生成。但是内容单元存在于系统之中。

④当内容需要出版到多个媒体如网站、无线设备和印刷材料时,网页就无能为力。

参考文献

[1]石雪松.内容管理的真正内涵[J].中国计算机用户,2003,4:24.

[2]Byrne,T.Web content management,products and practices[EB].http:∥www.CMSwatch.com,2008-08-05.

[3]New White Paper:What is Content Management?[EB].http:∥www.ziacontent.com/downloads/What%20is%20Content%20Management.pdf,2008-08-05.

[4]Boilo,B.Content Management Bible[M].New York:John Wiley&Sons,2001.

[5]Wikipedia.Content management[EB].http:∥en.wikipedia.org/wiki/Contentzmanagement,2008-08-05.

[6]Rockley,A;Kostur,P;Manning,S.Fundamental Concepts of reuse[EB].www.rockley.com/articles/MECzChapterz2.pdf,2008-08-05.

[7]王子舟,王碧滢.知识的基本组分——文献单元和知识单元[J].中国图书馆学报,2003,(1):5-11.

猜你喜欢

理论研究
杉杉股份有限公司国际化战略研究
近年来群众路线理论研究述评
双钢琴演奏心理调控的理论及其实践研究
浅析我国竞技健美操研究现状与趋势
中学生数学学习方式创新研究
城市营销中体育赛事选择的理论研究