APP下载

我国公共数字文化资源整合中信息组织方式的调查分析与优化策略

2016-09-28田蓉肖希明

图书与情报 2016年2期

田蓉 肖希明

摘要:文章通过对我国大陆和台湾、香港地区“国家数字文化网”等的公共数字文化资源整合项目调查,发现这些数字文化资源整合项目主要采用了多维导航、关键词检索、可视化信息检索、专题信息门户等4种信息组织方式。这些信息组织方式的应用实现了对异构的公共数字文化资源的优化重组,但在建设过程中也存在一些不足。文章针对这些不足提出了一些信息组织方式的优化策略,

关键词:公共数字文化资源:数字资源整合;信息组织方式

中图分类号:G250.7;G252 文献标识码:A DOI:10.11968/tsyqb.1003-6938.2016022

公共数字文化资源整合是将公共图书馆、博物馆、档案馆、美术馆、文化馆等公共文化服务机构中相对分散的数字文化资源,通过一定的方式进行融合、类聚和重组,使其集成到一个统一的平台上,为公众提供“一站式”的信息服务。自20世纪90年代,欧美等发达国家就开始了公共数字文化资源的整合。近年来,我国的大陆与台湾、香港地区也相继启动了若干公共数字文化资源整合项目。

公共数字文化资源整合可以采用不同的信息组织方式,而不同的信息组织方式也有各自的优势和不足。对信息组织方式的研究实质上是为公共数字文化资源整合寻求更有效的资源优化重组方法,这也是资源整合项目建设的关键性问题。本文将对我国大陆和台湾、香港地区有代表性的公共数字文化资源整合项目的信息组织方式进行调查,分析各自的优势和不足,并为进一步提升信息组织质量提出优化建议。

1.调查对象

本次调查以我国大陆和港台地区具有代表性的公共数字文化资源整合项目为对象。其中,“全国文化信息资源共享工程”是我国公共数字文化资源整合项目的标志性工程。由于“共享工程”主站与地方分站在资源平台设计中具有相似性,因此本文只将“国家数字文化网”(“共享工程”主站)作为该项目的代表性成果列为本次调查对象。此外,大陆和港台一些文化记忆工程,如“广州记忆”“香港记忆”“台湾记忆”等也体现了资源整合思想,本调查对这些项目的信息组织方式也进行了调查(调查对象见表1)。调查数据主要从项目的官方网站和相关文献中获取。

2.公共数字文化资源整合中的资源组织方式

大陆和港台地区公共数字文化资源整合项目收集了图书馆、博物馆、档案馆、文化馆、美术馆等公共文化服务机构中能展现我国历史文化特色的数字文化资源,并通过信息的多维导航、关键词检索、可视化信息查找、专题信息门户等4种方式进行资源的融合重组,从而实现异构资源的“一站式”查找。

2.1多维信息导航

2.1.1多维信息导航的应用情况

多维信息导航系统是引导用户浏览、选择和搜寻数字文化资源的信息组织方式。它将我国各个历史时期、各地区、各民族的文化资源组织成一个多层次的信息集合体,从而满足用户多角度地进行文化资源的查找。从国内公共数字文化资源整合项目中多维导航方式应用现状的调查结果(见表2)可以看出,各公共数字文化资源整合项目普遍采用了多维导航的信息组织方式,在导航方式的选择中主要采用了分类导航、热门资源导航、缩略图导航三种方式,主题导航、标题字顺导航、时间导航、机构和资源类型导航则运用的较少。

(1)分类导航。分类导航在各公共数字文化资源整合项目中应用较为广泛。除了“中国记忆”项目是以缩略图浏览的方式进行信息组织外,其它项目都根据自身资源组织的需要设计了各自网站的分类体系。

“国家数字文化网”的分类导航系统是参考《文化共享工程分类体系》而设立的。《文化共享工程分类体系》设置了三级类目,一级类目由知识讲座、舞台艺术、农业专题片、电影、文化专题片、电视剧、动漫、其它8个大类组成。该分类体系适应了“全国文化信息资源共享工程”以地方特色资源、红色历史资源、多媒体资源、少数民族语言资源和“进村入户”专项资源为主的公共文化资源分类需求。

由香港赛马会慈善信托基金和康乐及文化事务署联合推动的“香港记忆”项目系统收集了香港的博物馆、档案处、新闻传媒公司的历史和文化资料。“香港记忆”项目所收藏的资源以公共数字文化领域中的香港历史和文化遗产资源为主,它将这些资源按照历史与社会、地理与环境、艺术与文化、传播与媒体4个大类进行划分。4个大类下的特藏资源和图片展览资源都以专题名称加以标识。

“广州记忆”由广州市档案局主持建设。它系统收集了能反映和代表岭南历史文化记忆的文本、地图、照片、影像等资料。“广州记忆”项目设计了适应本站资源组织的二级类目体系。一级类目包含城市变迁、重大事件、历史名人、广府文化、名胜古迹、历史典故、影像记忆等7个大类。在一级类目下又设置了二级类目,如名胜古迹大类下又进一步划分为学府书院、宗教建筑、历史文物、古代遗迹、著名景点等5个子类。清晰明了的类目结构和类名让用户能够快速找到感兴趣的广州历史文化资源。

“台湾记忆”项目系统收集了关于台湾历史文化的80余万条图书文献、史料、图像、新闻影音及历史人物数据。“台湾记忆”网站通过分类体系对台湾历史文化资源进行有序地梳理和呈现。如“台湾记忆”项目在“日治时期台湾图像写真”和“台北市老照片”两个栏目的资源组织中,为了能够将大量的图片资源进行有效组织,设立了两级分类体系。一级类目由通论、台湾历史、地理山川、人文地理和文化风土、经济产业、名胜古迹与旅游指南、人物文献、其它等8个大类组成。在每个类目下又根据资源划分需要设置了若干个二级类目。如地理山川大类下细分了河川湖泊、山与丘陵、平原和盆地、舆图、动植物、聚落等6个类目。

从以上公共数字文化资源整合项目的分类导航方式的调查发现,由于各公共数字文化资源整合项目资源建设规模较小,在资源分类目录体系的设计时主要根据本项目的资源收藏范围进行类目划分,并没有参考已有的文献分类法将资源按照学科分类体系进行归类。这些资源整合项目的分类体系虽然体现了较强的实用性,但是在标准化和分类的整体性方面存在一定的不足。

(2)缩略图导航。缩略图导航是选取能够代表数字对象内容的标志性图片,通过引导用户浏览图片来实现信息查找的资源导航方式。在公共数字文化资源整合项目平台中,缩略图导航通常以滚动条或静态图片列表的形式出现。

“中国记忆”项目试验网站记录了中国历史和文化中的重要事件和人物,它主要以动态缩略图变换和缩略图列表的形式向用户展示已建成的专题资源门户。用户从缩略图中可直观地了解每个专题的主题内容,从而根据个人信息需求进行深层次的信息利用。“香港记忆”项目首页主要以缩略图滚动条和缩略图表格的形式展示了关于香港历史的特藏资源和精选资源。“广州记忆”网站首页的“名胜古迹”、“影像记忆”和“广府文化”栏目也采用滚动条和缩略图列表的形式展示岭南文化历史资源。“台湾记忆”资源平台首页的“特展馆”栏目同样以缩略图变换滚动播出的形式展现其建成的14个专题知识门户,用户点击图片便可进入相应的资源门户了解更详细的信息。

对项目调查可以发现,大陆和港台地区公共数字文化资源整合平台普遍应用了缩略图导航方式。缩略图导航方式相较于传统的以文字形式表达的分类导航、主题导航等方式而言具有更加动态和直观的特征。当用户没有明确的资源查找目标时,往往会被缩略图中的内容所吸引,进而以图片为线索查找到相应的数字资源。因此,资源整合项目应对缩略图的质量进行严格把关,使缩略图导航方式在资源查找和发现中发挥更大作用。

(3)热门资源导航。热门资源导航是对一定时期内用户点击率较高或最新发布的资源进行汇总并推荐给其它用户使用的参考系统。国家数字文化网为了传播人民群众最喜闻乐见的文化资源以及全国各地图书馆、博物馆、美术馆、广电、教育、科技等部门最优秀的数字文化资源,专门设置了本周推荐、每月一荐、点击榜、新上资源榜、热门标签、精品资源库等热门资源导航栏,为用户在信息资源的选择和查找中提供参考。“广州记忆”项目的热门资源导航并没有在网站首页出现,而是安排在了检索结果页面。当用户完成了相关数字资源的阅读后,需要重新查找其它的数字对象目标,热门资源导航便可向用户推荐目前最受欢迎的数字资源。“广州记忆”项目设置了热点文章、热门视频、热门图片的资源导航,用户可根据不同的资源类型偏好来选择合适的导航方式。

热门资源导航是公共数字文化资源浏览方式中一种补充性的资源导航方式。当用户没有明确的资源查找偏好时,用户就可以根据热门资源导航来查看当前热门的公共数字文化资源,适应了普通社会公众以娱乐消遣为目的的文化需求。

2.1.2多维信息导航应用中的不足

在公共数字文化资源整合平台的信息组织中,多维信息导航不仅能够多维度展示历史文化资源建设成果,同时也能满足用户在没有明确的信息查找目标时进行信息的浏览和漫游,在大陆和港台地区资源整合项目中得到了普遍的应用。但是目前各公共数字文化资源整合项目的信息导航系统以分类导航、缩略图和热门资源导航三种导航方式为主,导航维度比较有限,难以满足用户根据资源的主题、时间、地点、语种、资源类型特征进行资源的多途径查找。在分类体系的设计中,“国家数字文化网”“香港记忆”“广州记忆”“台湾记忆”项目都主要根据本项目的资源收藏范围和用户使用习惯来设计分类体系,较少参考目前已有的标准化的分类工具。分类系统虽然具有较强的实用性,但在类目体系的完整性、类名的规范化等方面还存在一些不足,有待在将来得到进一步完善。

2.2关键词检索

2.2.1关键词检索系统的设计

关键词检索是与多维导航方式优势互补的一种信息组织方式,也是人们进行海量信息筛选的有效方法。各公共数字文化资源整合项目为了满足用户对来自公共文化服务机构的海量信息资源进行精确查找开发了信息检索系统。

从对公共数字文化资源整合项目信息检索系统的简单检索与高级检索功能的调查结果(见表3)看出,除了正处于试用阶段的“中国记忆”网站尚未开通关键词检索功能外,其它资源整合平台均提供了简单检索与高级检索两种检索方式。

“国家数字文化网”开发了关键词的简单检索和高级检索功能,其中高级检索功能提供了搜索字段和搜索资源的时间范围两种方式的限定检索。“香港记忆”项目为了提高用户的信息检索效率,将网站中特藏资源和口述历史两个栏目的类目体系与关键词检索系统相结合,实现了类目指引下的资源快速搜索。“广州记忆”项目的高级检索功能与“香港记忆”相类似,提供了题名、关键字、时间三个字段的限定检索,同时也借助“广州记忆”网站本身的资源分类体系设计了特定资源类别下的关键词检索功能。

与大陆的资源整合项目比较,“台湾记忆”的检索功能设计得更为细致,它提供了简单检索、进阶检索和延伸检索三种检索方式。为了提高检索结果的全面性,“台湾记忆”项目设计了同义词、同音词、近义词等相关检索功能。同义词检索是在同义词库的帮助下实现检索词和其对应的同义词的扩展检索。如输入“AIDS”进行检索,系统除了返回含有“AIDS”字符串的数据外,其它含有如“艾滋病”“爱死病”“后天免疫不全症后群”“Acquired Immunodeficiency Syndrome”等同义词的数字对象会一并被查询出来。同音查询功能实现了检索词的同音及多音字的合并检索,如在检索含有“蔡”的数字资源时可同时查出含“药”字的数字资源。模糊查询则是将检索词以近似词的方式进行扩展检索。系统将通过相邻与加权的计算,检索出所有可能相关的数据,如当用户检索“电子图书馆”时,相关字段中含有“电子化图书馆”或“计算机化图书馆”等近义词的资源会同时出现在检索结果列表中。“台湾记忆”项目的进阶检索功能则是在简单检索功能的基础上增加了布尔逻辑组配检索、资源类目限定检索、资源年代限定检索的功能。延伸检索是在实现对“台湾记忆”网站中资源检索的基础上实现资料库和网页资源的延伸查询。

在设计检索结果处理方式(见表4)上,只有“国家数字文化网”和“香港记忆”两个项目开发了检索结果排序功能。在检索结果精炼方面,只有“香港记忆”项目设置了分类、主题、时间、地点、资源类型的筛选功能。其它资源整合项目均不支持对检索结果的再处理。

2.2.2关键词检索系统开发中的不足

公共数字文化资源整合项目汇集了图书馆、博物馆、档案馆等多种机构的数字文化资源,资源数量庞大、资源类型复杂多样。实现对海量数字文化资源的快速选择与定位就要依靠关键词检索系统。从对我国公共数字文化资源整合平台中的信息检索系统的调查来看,目前多数检索系统都开发了简单检索与高级检索方式,但是高级检索方式的功能实现趋于简单。多数项目只实现了限定检索和结合类目体系的检索功能,逻辑检索、相关检索等常见的检索功能并未得到普遍的应用。在检索结果处理方式的应用中,只有“香港记忆”项目实现了检索结果排序和筛选功能。检索结果处理方式的缺失为用户检索结果的挑选和精确查找带来了不便。在公共数字文化资源整合项目检索系统的设计中应多参考国外项目的经验,逐步丰富检索系统的功能。使检索系统更加高效和人性化。

2.3可视化信息检索

2.3.1可视化信息检索系统的设计

可视化信息检索是指把信息资源、用户提问、信息检索模型、检索过程以及检索结果中各种语义关系转换成图形,通过二维或三维的可视化形式显示,并向用户提供信息检索的过程。随着可视化信息检索技术的发展和推广,大陆和港台的公共数字文化资源整合项目在信息组织中也应用了一些可视化元素。

“国家数字文化网”以我国行政区划地图的方式构建了我国地方特色资源展示平台。在地方特色精品资源库中,不同的省份(香港、澳门、台湾除外)图片与该省份的特色资源相链接,使用户能够方便地欣赏不同地域的民俗文化。在“中国记忆”网站中,时间轴和地图元素被应用于“中国年画”、“蚕丝织绣”两个专题信息门户中,引导用户进行专题资源的浏览。在“中国年画”专题中,为了展示年画的绘画技巧和印制方法随年代变化的特点,开发人员采用了年代更替时间轴的方式来展示汉代及以前、两晋至唐代、宋元、明代、清代、民国时期和现当代不同时期年代的画作。“蚕丝织绣”专题同样应用了时间轴和地图两大可视化元素。“丝绸的历史”栏目以史前至商周、秦汉、隋唐、宋元、明代、清代、民国至现代七个不同时期的时间轴工具引导用户了解不同年代的丝织文化。“非遗中的丝绸”选择了中国省级行政区戈0图配以泡沫图案的方式来引导人们浏览各地方的丝绸文化遗产项目。“台湾记忆”项目通过应用台湾行政区划地图,将“台湾碑碣拓片”和“光复后台湾地区官修地方志目录”栏目中不同地区的图片和文献资源进行了整合。台湾行政区划图中的不同地区用不同颜色的色块加以区分,方便用户浏览不同县市的特色文化资源。

2.3.2可视化技术应用中的特点与不足

在所调查的公共数字文化资源整合项目中,地图、时间轴两种可视化元素已经在“国家数字文化网”“中国记忆”“台湾记忆”三个项目中得到了初步应用。可视化信息检索系统利用直观的图形与图像界面,对来自不同公共文化服务机构的信息资源进行可视化表示和组织,增强了异构数字文化资源组织中的无缝整合效果,强化了信息表示的视觉感受,使用户的信息查找过程更生动。

可视化信息检索技术虽然在以上资源整合项目中得到了一些应用,但是可视化元素较为单一,可视化元素之间缺乏互动关联,可视化功能也不够新颖丰富,不利于充分发挥可视化信息组织方式在公共数字文化资源整合中的优势,还具有较大的提升与完善的空间。相比之下,国外资源整合项目已经开发了同心圆、热力地图、虚拟书架等一些新颖的可视化元素,并且实现了可视化信息检索与关键词检索系统的结合,拓展了可视化系统的功能。国内资源整合项目也可以参考相关经验并进行技术创新。

2.4专题信息门户

2.4.1专题信息门户的应用情况

专题信息门户是在对某一文化专题的数字资源进行系统地收集和鉴别的基础上,将各种类型的数字文化资源加工、整理和组织在同一信息门户中,从而方便用户对专题资源的集中查找。国内的公共数字文化资源整合项目也根据资源开发特色建成了一些历史文化专题的信息门户。

“国家数字文化网”在专题活动栏目中展示了“中国梦·文化情”“军营音画”“文化剪影”等多个专题文化信息门户。每个专题信息门户内汇集了关于该主题的视频资源、图片资源、资讯要闻,展示了我国社会主义文化建设的成果和人民群众的文化生活。

“中国记忆”项目通过整理中国现当代重要事件与人物的专题文献,建成了蚕丝织绣、中国当代音乐家、中国年画等专题门户。在每个专题门户内,相关主题的文献资料、虚拟展览、人物口述视频等丰富的数字文化资源被有机地加以整合。如在蚕丝织绣专题中,“丝绸的历史”和“非遗中的丝绸”栏目通过应用时间轴和地图工具介绍了丝绸的历史和文化传承情况:“文献目录”栏目整理了与丝绸文化有关的古籍文献、现当代图书:“在线展览”栏目从不同角度用图文信息展示了丝绸的魅力。

“香港记忆”项目中的“专题特藏”栏目汇集了香港特色历史文化专题信息资源。专题知识门户左侧的标题导航栏引导读者根据标题内容来浏览该专题的历史、人物、建筑、事件和参考文献资源。标题导航栏下方的分类浏览导航栏根据专题资源的组织需要设置了专题内容分类、资源类型分类、年代分类。如“战后工业”专题门户中的分类浏览导航设置了战后工业行业分类表、战后年代分类表、战后工业档案资料分类表等,使用户可以根据专题下的细分类目更有针对性地来查找专题信息资源。

“台湾记忆”项目现已建成了“台湾古书契”“19世纪台湾摄影图像展”“台北建城120周年图像展”等14个专题信息门户。专题信息门户以资源内容分类、资源时间分类、文献书目列表等方式展示了专题信息资源。如“台北市建筑老照片系列展”将台北建筑图像划分为学校、民俗产业、宗教、政治等4个类别,用户可根据图像内容分类浏览台北市的建筑图片资源。“台湾文学杂志展览”以台湾不同历史年代为线索展示了各时期的文学刊物和代表人物。“萧兹教授身影”专题以音乐作品目录的形式梳理了音乐家萧兹一生的音乐贡献。

2.4.2文化专题信息门户应用中的优势与不足

专题信息门户从本质上说是通过对一次公共数字文化资源的二次开发,将不同文化机构收藏的历史文化资源进行整合,使用户能够从历史文化“专题信息超市”中获得丰富的专题文化资源。用户在专题信息门户内进行资源查找时所获取的资源质量更好,相关度也更高。但是目前我国公共数字文化资源整合项目在建设中也存在一些不足。如文化专题的划分较为粗糙,在一些重要的历史文化专题下并未划分子专题,模糊了资源组织中的层级界限。这说明目前资源整合项目的专题信息门户的资源组织和挖掘的深度仍有待提高。

3.我国公共数字文化资源整合中的信息组织方式优化策略

针对目前我国公共数字文化资源整合平台的信息组织方式的应用情况,笔者提出了以下几点优化策略,以期为公共数字文化资源整合平台的信息组织工作提供参考。

3.1多维导航系统的完善

在目前以传统的信息组织方式为主的网络环境下,多维信息导航系统仍是重要的信息组织方式。在目前我国的公共数字文化资源整合项目中,多维导航系统也得到了广泛的应用,但也存在导航维度不够多样化,分类导航体系建设不够完善的问题。公共数字文化资源整合项目首先应该不断丰富公共数字文化资源内容,扩大可获取的数字资源的规模,为构建层级分明的多维导航系统奠定基础。此外,为了减少分类、主题、时空、语种等导航维度在类目划分中的随意性,应该在受控词表的帮助下建立更加系统性和标准化的数字文化资源导航系统,提高资源导航的质量和用户在资源层级浏览中的信息查找体验。

3.2信息检索功能的拓展

在公共数字文化资源整合平台中,信息检索能够满足用户对数字文化资源的全面和快速查找,是一种必不可少的资源组织方法。在目前已建成的公共数字文化资源整合项目中,高级检索和检索结果处理功能虽然得到了初步应用,但是检索功能还不够健全。未来资源整合项目除了要完善基本的检索功能外,还应该积极应用新的技术成果。如引入基于内容的图像检索(CBIR)技术来实现对多媒体资源的精确查找:通过跨语言检索技术实现多语种资源的快速查询:或是通过开发嵌入式的浏览器检索软件来提高用户对公共数字文化资源整合平台的使用频度,通过拓展检索系统的功能来提高检索系统资源查找效率和用户适应性。

3.3文化专题知识的深入挖掘

公共数字文化资源整合项目通过建设文化专题信息门户将专题资源进行了系统地组织。但是目前专题信息门户的建设还存在一些不足。从专题信息门户的资源组织层次上来说,历史文化专题的划分还较为粗糙,应该通过在一些大专题中下设子专题的形式来加深资源组织的层次。此外,专题资源的组织应努力实现从传统的信息组织向专题知识挖掘的方向转变。通过对数字文化信息进行深加工,更好地实现专题知识的抽取和揭示,从而给予用户“所得即所要”的信息资源。

3.4推动本体方法的应用

在公共数字文化资源整合项目的建设中,虽然传统的资源组织方式还占据主要地位,但采用以本体为基础的概念模型对文化遗产领域中的知识资源进行组织的实践与研究已经有了一定进展。国际上一些团体或相关组织已经制定了CIDOC CRM、ABCOntology、CDWA等文化遗产领域的本体模型。国内外研究者也在研究中介绍了通过构建领域本体实现关于某一主题的图书馆、博物馆、档案馆资源整合的实验方法。虽然目前本体方法在公共数字文化资源整合项目中尚未得到应用。但是随着用户对知识查找和知识共享需求的不断提升,本体在促进领域知识的共同理解和基于知识的语义检索中的优势必将推动本体方法成为未来公共数字文化资源整合的信息组织的重要方法。