APP下载

公共数字文化资源整合网站浏览检索功能研究*

2015-02-12完颜邓邓肖希明武汉大学信息管理学院湖北武汉430072

图书馆建设 2015年4期
关键词:资源整合检索数字

完颜邓邓 肖希明(武汉大学信息管理学院 湖北 武汉 430072)

公共数字文化资源整合网站浏览检索功能研究*

完颜邓邓肖希明(武汉大学信息管理学院 湖北 武汉 430072)

公共数字文化资源整合网站是公众获取文化信息的重要平台。整合后的公共数字文化资源具有复杂性、多样性及用户属性复杂等特点,这就要求公共数字文化资源整合网站具备多种浏览方式检索、多种字段限定检索功能、提供浏览检索相关服务与功能。借鉴国外网站在满足浏览检索功能方面所采用的方法,国内网站应当建立资源的多维组织体系,提供多维浏览方式;强化检索功能,增加字段限定检索;提供浏览检索相关服务与功能;重视新技术应用,提供互动分享功能。

公共数字文化资源整合 浏览检索

公共数字文化资源整合是指对各公共文化机构不同来源、分散无序、相对独立的数字对象进行类聚、融合和重组,形成一个服务效能更好、效率更高的新的数字资源体系的过程。近年来,图书馆、档案馆、博物馆等公共文化机构的数字资源增长迅速,并通过网络提供信息服务,然而却缺乏一种可以将单个机构的数字馆藏连接起来的“桥梁”,从用户的角度来看,有一个可以使他们不用挨个检索每个数据库的统一平台,将更为方便[1]。公共数字文化资源整合网站正是这样一种“桥梁”,为用户提供了统一的资源获取入口。公共数字文化资源整合网站是公共数字文化信息资源发布的平台,也是公众获取文化资源的途径。用户查询信息主要通过浏览和检索实现,提供浏览检索功能是公共数字文化整合网站实现服务的主要渠道。公共数字文化整合网站的浏览检索功能对用户查询与获取信息有着重要影响,决定着用户的查询方式及检索结果是否是其所需,提供强大的浏览检索功能应是公共数字文化整合网站建设的主要目标之一。本文将分析公共数字文化资源整合网站对浏览检索功能的要求,考察国外公共数字文化资源整合网站在满足浏览检索功能方面所采用的方法,提出对国内公共数字文化资源整合网站浏览检索功能的改进意见。

1 公共数字文化资源整合对其网站浏览检索功能的要求

1.1具备多途径的浏览方式

公共数字文化资源来源于公共图书馆、档案馆、博物馆、美术馆等多个公共文化机构,其主题、类型、格式、语种、时间跨度、地理区域等千差万别。其资源内容丰富,囊括主题繁多;资源类型多样,不仅包括文本,还有图像、音频、视频等多媒体资源,其资源格式有PDF、CAJ、PNG、MPG、DAT等;档案资源、文物资源时间跨度较长,来源地域可覆盖全国乃至全球,其语种也多种多样。因此,公共数字文化资源整合具有复杂性,这种复杂性要求公共数字文化资源整合网站的资源组织体系要考虑其来源、主题、类型、格式、语种、时间跨度、地理区域等,并据此进行资源组织,提供按照来源机构、主题、类型、格式、语种、时期、地域的方式进行浏览,这种多途径的浏览检索方式有利于用户根据其对某类资源的特定需求进行信息查询。

1.2具备限定检索功能

限定检索可缩小检索范围,从而减少不需要信息的输出,限定检索多属选项,限定条件多种多样,包括限定字段、限定专题、限定检索对象、限定网络资源类型、限定数据类型、限定日期、限定地区或域名等[2]。整合后的公共数字文化资源数量庞大、类型多样,用户在进行检索时,检索结果输出页面往往返回大量结果,有些并非用户所需资源,因此限定检索功能对于精炼检索结果具有重要作用。在检索字段的设置方面,除标题、作者、主题等字段外,其他能表现资源特征、具备检索意义的字段也应加入其中,以提供丰富的检索字段。此外,整合网站提供出版形式、资源格式、语言、日期等的限定检索,能将检索结果限制在所需范围之内。整合后的公共数字文化资源是由人工整理组织的,整理者往往会给资源加上编号以便于索引,在检索字段中加入编号,使检索者根据该编号进行查找,具备较强的检索意义。整合网站需要在检索结果输出页面设置对结果的限定检索或二次检索功能,允许用户在结果中再次进行检索,提供资源的类型、格式、时间等字段进行限定。整合网站的检索功能应当朝智能化的方向发展,提供检索关键词的自动匹配功能,根据主题相关度、格式、类型、时间等的排序功能、分类导航功能,以实现对结果的再次过滤,使用户获得的结果更具针对性。

1.3具备多种浏览检索相关功能与服务

公共数字文化资源整合网站通过网络提供服务,信息资源传递突破了时空的限制,使得用户的数量空前扩大,类型更加复杂,地理分布更加广泛。公共数字文化资源整合服务的用户也即网络用户,具备网络用户的一般特点,但也具有自身特征。公共数字文化资源整合用户的特征要求网站具备多种浏览检索相关功能与服务:(1)用户来源地域广泛,不可避免会包含多民族、多语种的用户群体,用户所掌握语言的差异给信息获取带来了障碍,这就要求整合网站从多语言角度进行信息组织,具备多语种浏览检索功能和翻译功能。(2)用户自身存在差异,用户的职业、教育背景、文化程度的不同,都会造成信息获取能力的差异。公共数字文化资源服务的对象是全体公民,毋庸讳言,在基层公众中,缺乏检索基本知识、信息检索技能不高的用户大量存在,特别是用户在面对高级检索时不能很好地编制检索策略,这就要求整合网站通过多种方式提供详细的浏览检索帮助服务。(3)用户知识产权保护意识普遍不高,而整合资源中存在大量受知识产权保护的作品,这就要求网站在提供资源的同时,也要提供该资源的知识产权信息,提醒用户在知识产权范围内合理使用,避免侵权。(4)用户希望获取便捷易用和个性化的服务,希望与他人互动与分享,这就要求整合网站应用新技术提高网站的交互性与友好性,具备互动分享与个性化服务功能。(5)用户一般希望网站能够提供全文信息,可对资源进行下载、打印、复制、电子邮件传递等,这就要求整合网站提供这些功能。

2 国外公共数字文化资源整合网站提供的借鉴

国外最先启动了公共数字文化资源整合项目建设,其整合网站的浏览检索功能也相对完善。笔者从资源的浏览方式、检索功能、浏览检索相关功能与服务几方面对世界记忆、世界数字图书馆、欧洲数字图书馆、美国记忆、加拿大国家图书档案馆等公共数字文化资源整合网站进行了调查分析,发现其在满足多途径的浏览方式、多种限定检索功能以及丰富的浏览检索相关服务与功能方面所采用的方法,值得我国借鉴。

2.1浏览方式

浏览已经成为一种与检索同等重要的信息查询行为[3]。公共数字文化资源的分类体系是对其网站资源进行分类组织的途径,也是用户浏览检索的依据。国外公共数字文化资源整合网站采用多维的资源组织体系,使用户能够多途径浏览资源。主题、资源类型、时期、地理位置、来源机构是国外公共数字文化资源整合网站最常见的资源组织方式,此外,A~Z的字顺浏览方式也很普遍,能够使用户在没有特定查询目标的情况下,通过字顺浏览找到感兴趣的资源。这种多样的分类组织体系,为用户提供了灵活的浏览方式,可使用户在不明确检索策略时,能够根据资源的某个特征,按照选定的分类体系层层递进找到所需资源。除上述常用浏览方式外,国外公共数字文化资源整合网站根据整合项目与收录资源的实际情况,采用方便用户查询的浏览方式。例如,世界数字图书馆提供时间线、互动式地图的浏览方式,以图形方式显示地理位置、时间与资源的关系,清晰直观;在主页提供特选条目、特选典藏单位、最新加入的条目的专栏浏览方式。欧洲数字图书馆提供“虚拟展览”,帮助用户发现和了解更多特定的主题。加拿大国家图书档案馆的检索类目按照搜索全部、搜索图书馆资源、搜索档案馆资源、搜索图片资源进行组织,方便用户针对所需资源存在的范围进行查找。

2.2检索功能

在检索功能方面,除一般检索和高级检索提供的布尔逻辑检索、字符串检索、通配符检索等功能外,其中的检索字段设置有助于拓宽检索途径,有助于提高查全率和查准率。国外整合网站除了提供标题、作者、主题等一般常用字段的限定功能外,还提供日期/时间、地点、语言、资源类型、资源格式、标识符等字段的限定检索。例如,加拿大国家图书档案馆“图书馆资源检索”页面的一般检索和高级检索均提供基于标题、创作者、主题、注释、ISBN、ISSN、AMICUS编号(AMICUS:加拿大所有图书馆的目录清单)7个字段的检索[4];“档案馆资源检索”页面的一般检索提供资源类型(建筑和技术图纸、电影和录像、地图和制图材料、邮票和邮政材料等)、等级层次(全宗、系列、卷宗)等字段的检索;高级检索提供标题、名称、档案文献编号、微缩胶卷卷号、卷/盒号、文件号等字段的检索,并提供三个字段的布尔逻辑检索[5]。这种围绕资源特点提供能够表现图书与档案资源突出特征且实用性强的检索字段,为用户获得更准确、更符合需求的检索结果提供了便利。

在对检索结果的限定方面,国外整合网站提供了通过对资源格式、类型、日期、来源、出版者、语言、排序方式等的限定,缩小了检索结果。例如,欧洲数字图书馆检索结果页面可以通过对媒体类型(图像、文本、视频、声音或3D)、语言、日期、国家、版权、提供者的限制过滤搜索结果。加拿大国家图书档案馆支持对结果的标题、日期、名称的再排序,通过选择资源格式、出版形式、来源、语言等限制检索结果,使检索结果更加符合需求。世界数字图书馆检索结果页面有清单、图库、地图选项,用户可点击按钮选择想要显示的结果类型;提供“缩小结果”按钮,用户点击展开可按照地点、时期、专题、条目类型、语言、典藏单位、其他关键词缩小结果。丰富多样的检索结果限定功能,能够使用户在检索结果返回太多或者与自己所需信息的相关性不高时,通过点击检索结果页面的相关选项按钮或添加再次检索的关键词,即可实现对检索结果的过滤。

在检索结果输出方面,国外整合网站输出资源的格式详细,或提供有关信息的链接,以便用户发现更多资源。例如,欧洲数字图书馆的检索结果输出页面包括与资源相关的其他信息,如资源的类型、标识符、关联、提供者、来源国家,并提供这些信息的链接。迈克尔项目的检索结果显示数据格式、时间、地理范围、文化归属地、关联、URI等信息。美国记忆提供出版者、介质、书号、数字标识等信息。世界数字图书馆的检索结果页面输出图片、标题、资源介绍和贡献者,提供关键词链接,可连接至与该关键词有标记的其他条目,输出结果条目还配有馆长视频,视频是由专家讲解的,内容是介绍某一条目或条目集[6]。

2.3浏览检索相关服务与功能

浏览检索相关功能与服务是衡量一个网站浏览检索功能的重要方面。下载、复制、打印、电子邮件传递、共享、知识产权相关信息提供、浏览检索帮助、多语言浏览检索、翻译等是国外整合网站浏览检索相关功能与服务的主要内容。美国记忆和欧洲数字图书馆是提供浏览检索相关功能与服务最为丰富的两个网站。

美国记忆在浏览检索的相关功能与服务方面,提供资源复制品的服务,包含复制品单位的联系电话和网址、接受复制请求的方式及完成复制的时间等信息;每条显示结果的页面都提供有关该资源的知识产权的说明,包括著作权限制和复制权限的信息[7]。

欧洲数字图书馆在检索结果页面提供了多种辅助功能:每一个预览图像的下面有权利声明条款,说明用户可再次使用的数字对象,目前有12种权利声明用于不同的资源再利用许可,点击权利声明条款,可连接到许可证本身;提供“引用维基百科”功能,此功能帮助用户将欧洲数字图书馆的资源条目与其在维基百科的文章中引用情况相连接;提供翻译功能,便于用户选择语言进行机器翻译;允许用户分享,提供社会媒体共享选项列表;检索结果页面包括打印和邮件选项,可以供读者选择打印或通过电子邮件传递资源[8];提供注册功能,为注册用户提供更多功能与服务:可以保存特定主题的检索、可以为喜欢的资源添加标签、可以保存资源条目[9]。欧洲数字图书馆支持30种语言进行浏览检索。

此外,国外公共数字文化资源整合网站特别重视新技术应用,通过新技术应用为用户提供更多服务途径,提供互动交流平台。经笔者调查,Blog、Podcast、Facebook、Twitter等基于Web2.0技术的社会媒体工具得到了广泛的应用。欧洲数字图书馆建立了Blog、Facebook、Twitter 、Pinterest 、Google +页面,为用户提供更多服务平台。世界数字图书馆提供最新Twitter信息;加拿大国家图书档案馆提供Flickr、Podcast、Facebook 、Twitter、Blog、RSS、YouTube等工具,供用户进行新闻、Podcast等的RSS订阅,并通过播客给用户提供更多资源利用与服务方面的指导[10];提供社会书签功能,支持通过Delicious、Digg、Diigo等进行分享。以上内容说明国外公共数字文化资源整合网站具备丰富的浏览检索相关服务与功能,使得网站的浏览检索及其服务更加便利与人性化。

3 对国内公共数字文化资源整合网站浏览检索功能的改进建议

笔者调查了全国文化信息资源共享工程(国家数字文化网)主站、数字图书馆推广工程网站及全国文化信息资源共享工程下的北京、湖北、湖南、广东分中心站点,通过对比发现,国内公共数字文化资源整合网站在浏览方式、检索与输出功能等方面与国外都有很大的不同,国内整合项目网站的浏览检索功能亟待提高。国内整合网站可从以下几个方面,满足公共数字文化资源整合网站对浏览检索功能的要求。

3.1建立资源多维组织体系,提供多维浏览方式。

我国公共数字文化资源整合各网站主要通过浏览方式提供信息查询功能,资源的组织分类多依据资源类型、主题或格式,缺乏其他组织方式,不便于多途径浏览。全国文化信息资源共享工程主站的一级类目按照“经典剧场”、“放映大厅”、“阳光少年”、“农贸行情”、“快乐生活”、“群文资源”、“农业天地”等方式组织[11],可以看出“经典剧场”、“农贸行情”、“快乐生活”、“农业天地”按照资源主题组织,“放映大厅”按照资源格式组织,“群文资源”、“阳光少年”按照服务对象组织,资源的组织分类标准不一,类目之间交叉重叠,不便于用户根据类目划分选择浏览方式。数字图书馆推广工程的资源按照“电子书刊”、“在线展览”、“视听空间”、“馆藏精粹”、“古迹寻踪”、“经典分享”的方式组织一级类目,每个一级类目下有二级类目,如“经典分享”里的下级类目是“图书收藏”和“书画鉴赏”,只有“图书收藏”的时期分为“古代”和“近现代”,“书画鉴赏”则没有时期之分[12]。这种资源组织方式表现出我国公共数字文化资源整合网站的资源组织方式单一,资源划分标准不明确,不便于用户判断所需资源的类别。我国公共数字文化资源整合网站应采用多维的资源分类组织体系,统一资源分类标准,充分考虑到资源的复杂性,按照主题、类型、时期、地理位置、来源机构、字顺等组织资源,每类资源的下级类目要尽量细致、明确,为用户提供多途径的浏览方式。

3.2强化检索功能,增加限定检索。

我国的公共数字文化资源整合网站的检索功能与国外相比有非常大的差距,只有极少数整合网站具备高级检索功能,其他整合网站只提供一般检索,没有检索字段限定功能。数字图书馆推广工程的“文津搜索”具备较全面的检索功能,提供按资源类型限定检索,提供高级检索、联邦检索、搜索热词榜,检索结果输出页面提供查看指定资源类型的限定功能,提供按照是否提供全文、年份、著者、语种、来源数据库缩小检索范围,这方面是值得学习借鉴的。数字图书馆推广工程中的“老照片”、“馆藏特色资源”、“地方志”、“民国文献”、“家谱”、“视频资料”等一级类目资源也提供高级检索功能,但是其检索字段的限定总体较少;每类资源的检索字段类似,大体包括题名、馆藏信息、主讲人/责任者、出版者、年代、地点,没有提供体现每类资源特色的检索字段;只提供字段的“与”、“或”两种布尔逻辑组配检索;检索结果输出页面,只输出题名、责任者、馆藏信息等简单格式,不提供相关信息的链接;提供“重新检索”和“在结果中检索”的功能;提供图文结合和列表形式查看资源,但没有提供范围限定功能,排序方式只能选择按默认顺序排列。总体来看,我国的公共数字文化资源整合网站应加强检索与输出功能,除一般检索外,重视提供高级检索功能,支持多字段限定检索,一般检索要提供资源的主题、类型、格式、时期、地域等字段限定,高级检索功能不仅包括字段限定,而且要提供多个字段的组配检索功能;字段设置方面要能够充分体现资源特征;提供图书资源、档案资源、博物资源等分别的检索页面,在每类资源的检索页面设置有针对性的检索字段;支持自然语言检索与相关查询功能,目前的整合网站往往要求用户对关键词或短语进行合适的布尔逻辑组配或与其他检索符组配,检索结果取决于用户制定的检索条件,缺乏语境信息,不便于扩展检索,因此支持自然语言检索,提供相关查询功能,允许用户扩展检索,对新手或无检索经验的用户非常有帮助[13];提供检索结果输出页面的二次检索与限定检索功能,实现检索结果的分类导航;输出资源的详细信息,提供相关资源的链接。

3.3提供浏览检索相关功能与服务

我国的公共数字文化资源整合网站均不提供浏览检索帮助服务;不具备多语言浏览检索的功能,只有全国文化信息资源共享工程网站主站提供汉语、藏语、蒙古语3种语言的导航服务;不具备下载、保存、复制、打印、电子邮件等功能;不提供获取资源的复制品信息和知识产权的相关信息。浏览检索相关功能与服务的欠缺不仅给用户查询利用资源造成不便,而且影响到网站的整体检索功能。因此,我国公共数字文化资源整合项目网站应首先完善浏览检索帮助功能,根据用户的特点和需求采用多种灵活方式,通过FAQ、电话、传真、电子邮箱以及QQ、MSN等即时通讯工具,帮助用户解答在浏览检索中遇到的问题。其次,可参照国外网站,提供更丰富的相关功能与服务:提供知识产权相关信息,尽到注意义务,避免侵权;提供获取全文、下载、打印、复制、共享、传递等功能与服务。另外,要提供多语言浏览检索功能,公共数字文化资源整合服务要覆盖到少数民族地区,因此要提供少数民族能够理解的语言文字,可以提供藏、蒙、回、壮等几种主要的少数民族语言。

3.4重视新技术应用,提供互动分享功能。

我国的公共数字文化资源整合网站对新技术的重视程度不够,应用的数量少,类型较为单一。国家数字文化网主站建立了微博并提供资源分享列表、数字图书馆推广工程提供资源的分享列表、北京市文化信息资源共享服务平台提供对资源的发表评论功能,其他站点并没有提供相似功能。随着Web2.0技术和新媒体的发展,其在网站中的应用越来越广泛,为用户提供了交流共享平台,增强了网站的互动性。RSS、Blog、Wiki、Twitter、YouTube、Facebook、Flickr、Podcast、Tag、Social Bookmark等都可以用来发布与交流信息,成为为用户服务的新方式。国外公共数字资源整合项目网站对这些新技术、新工具的应用已经非常普遍,我国公共数字文化资源整合项目网站要善于将新技术应用其中。具体其可以与新浪微博、腾讯微博、QQ空间、豆瓣等社交网站合作,支持用户对资源进行分享,以社交网站为平台,拓展自身服务;建立Blog、Podcast,发布信息,提供资源与服务指导;提供RSS服务,向用户推送资源;提供Wiki、Tag、Social Bookmark功能,为用户参与资源组织与共享提供平台。我国公共数字文化资源整合网站利用这些新技术与新媒体构建互动平台,加强用户与工作人员之间、用户与用户之间的交流互动与资源分享,增强网站的友好性与网站性能。

[1]Kirchhoff T, Schweibenz W, Sieglerschmidt J. Archives, Libraries,Museums and the Spell of Ubiquitous Knowledge[J]. Archival Science, 2008, 8(4):251-266.

[2]张琪玉. 网络信息检索工具增强关键词检索功能的措施[J]. 图书馆杂志, 2001(1):7-10.

[3]王庆稳, 邓小昭. 网络用户信息浏览行为研究[J]. 图书馆理论与实践, 2009(2):55-58.

[4]Library Search—Advanced[EB/OL].[2014-11-09]. http://www. collectionscanada.gc.ca/lac-bac/search/lib_adv.

[5]Archives Search—Advanced[EB/OL].[2014-11-09].http://www. collectionscanada.gc.ca/lac-bac/search/arch_adv.

[6]Help[EB/OL].[2014-11-10]. http://www.wdl.org/zh/help/.

[7]Rights and Reproductions[EB/OL].[2014-11-09]. http://memory. loc.gov/cgi-bin/ammemrr.pl?.

[8]Results in Europeana[EB/OL].[2014-11-08].http://www. europeana.eu/portal/usingeuropeana_results.html.

[9]Using My Europeana[2014-11-10]. http://www.europeana.eu/ portal/usingeuropeana_myeuropeana.html.

[10]RSS[EB/OL].[2014-11-09]. http://www.bac-lac.gc.ca/eng/stayconnected/Pages/rss-feeds.aspx.

[11]国家数字文化网[EB/OL].[2014-11-12]. http://www.ndcnc. gov.cn/.

[12]数字图书馆推广工程[EB/OL].[2014-11-12]. http://www. ndlib.cn/.

[13]Liew C L. Online Cultural Heritage Exhibitions:A Survey of Information Retrieval Features[J]. Program: Electronic Library and Information Systems, 2005,39(1):4-24.

完颜邓邓 女,武汉大学信息管理学院2014级图书馆学博士研究生。

肖希明 男,武汉大学信息管理学院教授,博士生导师。

Study on the Browse and Retrieval Function of the Integration Website of Public Digital Cultural Resources

The integration website of public digital cultural resources is an important platform to access the cultural information for the public. After the integration, public digital cultural resources have the complexity and the diversity, and their users have complex properties, this requires the integration website of public digital cultural resources have the retrieval of a variety browse ways, various field limit function, some services and functions are related to browse and retrieval in the website. Learning from methods be used to meet requirements of browse and retrieval functions in foreign websites,our country should establish the multidimensional organization system of resources, provide multidimensional browse modes; strengthen the retrieval function, increase the field retrieval; provide relevant services and functions of the browse and retrieval; pay attention to the application of new technologies, provide interactive and share functions.

Public digital culture; Resource integration; Browse; Retrieval

G250.72

B

*本文系国家社会科学基金重点项目“公共数字文化服务中的资源整合研究”的成果之一,项目编号:13ATQ001。

2014-12-11 ]

猜你喜欢

资源整合检索数字
少先队活动与校外资源整合的实践与探索
“五育并举”下家校社资源整合的价值意义
海外并购中的人力资源整合之道
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
智慧高速资源整合方式实践
答数字
数字看G20
专利检索中“语义”的表现
成双成对