APP下载

中外档案网站信息检索功能比较研究

2016-05-25胡心悦

科技视界 2016年12期
关键词:信息检索

胡心悦

【摘 要】从数据库类型、检索途径、检索服务等3个方面对美国国家档案网站和浙江档案网站分别进行了实证调查,并对双方的分类目录、检索入口、网页设计、易用性、服务等方面进行了对比分析。

【关键词】档案网站;信息检索;功能比较

【Abstract】This article researches both NARA website and Zhejiang Archives Website from the perspective of database type, retrieval approach and retrieval service. In addition, it analysis their differences from the aspects of classified catalogue, retrieval interface, web design, usability and services.

【Key words】Archives website; Information retrieval; Comparative Study

0 前言

档案网站是信息时代一种新型的档案管理模式。自1992年世界上第一个档案网站“Jefferson Digital Archives”在美国创立以来,各国的档案机构均陆续建立了自己的档案网站,成为档案机构面向公众服务的新窗口。①其中为用户提供给检索服务是档案网站的重要职能之一。本文主要通过对美国国家档案馆网站和浙江档案网的使用,对其信息检索功能体检进行对比调查。

1 研究背景

由于信息技术和网站建设更新较快,本文以万方数据为来源数据库,对近5年对有关“档案信息检索”的文献进行了调研。其中,张莹认为档案网站检索功能的完善是顺应政务信息公开的必然趋势。②近年来,我国各档案机构分别建立了档案信息网站,但整体效果并不理想。谢明生在2009年对我国档案网站检索查询功能的调查中指出目前我国档案网站存在检索查询内容少、途径单一、档案形式单一、分类检索与导航系统不完善等问题。③与谢明生的调查结论相同,杨光羲也提出目前只有少数档案网站可以提供检索服务,大多数档案网站都是以静态的HTML页面为主,不能提供动态信息检索,并主要用以发布政策消息。④在该文中,作者特别提到了浙江当那网的“视频档案”是档案网站形式多样化的积极示范之一。丁立新等人从信息构建的角度提出档案网站检索系统的构建需要从检索内容的组织、检索界面的设计、检索词的设计、检索结果的优化、以及用户帮助和个性化服务等方面进行全方位的考虑。⑤锅艳玲等人针对国内外档案网站的检索功能进行了调查研究。⑥其调查结果显示,部分国外档案网站流量的综合排名远高于我国档案网站。而“每百万人中访问该网站的人数”显示国内排名最前的为北京档案信息网和浙江档案网,其结果分别为0.6和0.4,而加拿大国家档案馆网站为1810。

由此可见,浙江档案网尽管在国内档案网站中排名靠前,但与国际水平仍有极大的差距。因此,本文选取浙江档案网与美国国家档案馆网站进行对比,试图从使用体验的角度来探索国内外两种档案网站的异同,以求为国内档案网站的建设提供参考意见。

2 研究方法

本文主要使用实证研究的方法,以美国国家档案馆网站和浙江档案网为例,对比国内外不同风格的档案网站检索体验。美国国家档案馆(简称NARA)是美国国家级综合性档案馆。NARA在20世纪80年代创立了档案网站(http://www.archives.gov/),保存有美国外交及军事档案,白宫档案,及联邦政府机构档案等。⑦浙江档案网(http://www.zjda.gov.cn)是国内在档案信息公开和检索服务领悟比较先进的网站。其在线数据库涵盖了自清代以来地方方志、报纸、期刊、报刊,并在线提供图像、声像、特色专题等数据库。

因此,本文的实证调研主要从两个网站提供检索的数据库类型、检索途径、检索服务三个方面来展开。

3 美国国家档案馆

3.1 数据库的类型

以数据库所含信息内容为档案数据库的基本分类标准,将档案数据库分为目录数据库、事实数据库和全文数据库。

NARA网站上的目录数据库有三个,分别是:Archival Research Catalog(ARC)、Access to Archival Databases(AAD)、Online Public Access Catalog-Library(OPA)。这三个数据库的搜索结果均为档案的元数据或链接,没有直接提供原文,因此为目录数据库。

事实数据库是一种存放某种具体事实、知识数据的信息集合。在对现实世界进行定性和定量描述或研究时,往往需要事实情报,如化合物的结构式或分子式,物质和材料的特性,指数,设备型号,地名等。⑧根据这个定义,NARA的事实数据库包括“Guide to Federal Records”和“Archival Research Catalog(ARC)”中的“People”和“Organizations”检索。

NARA也提供全文数据库的检索。利用NARA首页的搜素框检索“declaration of independence”的结果之一,可以发现该数据库既提供了数字化的档案全文,又提供了原件的扫描件。

3.2 检索途径

NARA支持的检索技术主要包括:分类检索、全文检索。多媒体检索技术没有直接体现,但仍可以通过分类检索和全文检索的方式实现对多媒体资源的检索。

检索途径的选择,是根据用户的检索提问选择合适的检索途径,决定检索入口。选择合适的检索途径和运用恰当的检索技术是密切相关的,二者统一于整个检索实践过程中。因此,笔者将二者同时进行,在分类检索、全文检索、多媒体检索的实验过程中选择合适的检索途径。

3.2.1 分类检索

进入NARA的首页,可以看到醒目的五大板块:(1)Research Our Records(研究本站档案):通过本站提供的文件、照片和档案来探索美国历史。(2)Veterans Service Records(退伍军人服役记录):索取军事档案,了解本站为你和你的家庭成员提供的其他相关服务。(3)Teachers Resources(教学资源):为学生提供课程计划和其他的课堂材料。该板块主要提供的资源主要包括:教学中需要用到的原始文件的副本(reproducible copies of primary documents)、国家档案馆提供的在线教学工具(online teaching tool)、为教师和图档工作者提供的研讨(workshop)会等。(4)Our Locations (我们的地址):实地访问最近的机构,查询地址和服务。该板块分别提供了2D和3D版本的地图。并且,该板块按照不同的档案机构的特点或馆藏内容对其进行了分类,方便用户按照自己的需求进行选择。(5)Shop Online:在线订购书籍、礼品、影音副本、文件副本等。

在首页底部,提供了类似网站地图的检索分类,其内容主要包括:(1)information for …(分类信息);(2)Publications(出版物);(3)Orgs & Offices(机构和办公室);(4)About Us(关于我们);(5)I Want To…(面向用户个人的服务);(6)Participate(参加相关活动);(7)Resources(资源分类检索);(8)Connect With Us(联系我们)。

上述的两种检索分类在细节上有重合的地方,而其区别也是很明显的:第一种按照网站的功能板块进行分类,概括性强;而第二种更偏重于从用户信息需求的角度出发进行分类,目标性强。

此外,NARA的首页十分简洁,除了这两个分类目录部分,还包括网站LOGO、简单检索条、滚动新闻条、该年度的项目主题链接。而这两个“分类”的板块占据了首页近80%的版面。运用科学的分类和基于用户体验的设置,使得NARA与国内首页内容繁多的档案网站相比,既保留了信息的丰富性,又易于使用。

在首页五个板块中的Research Our Records下的子版块中,又根据主题、载体类型、政府机构等进行了目录细分。其中每一个分类同样也是一个链接,点进链接后,可以看到更细致的子目录。可以看到,NARA的分类检索结构十分细致,且逻辑清晰,层层递进。

以AAD(Access to Archival Databases)数据库为例,在检索页面的“Search AAD”一栏下方,紧接着是“Browse by Category”(按照分类浏览)。该目录给出了两种分类:一是,按时间段(Time spans)分类;二是,按主题分类。如果点击“Browse by Subjects”,可以看到所有的分类按照首字母排列,几乎涵盖了所有内容。

3.2.2 全文检索

NARA提供了多种不同的数据库系统的全文检索。包括OPA、ARC、AAD等。NARA的全文检索又分为简单检索和高级检索。

(1)简单检索(Basic Search)

笔者以“declaration of independence”(独立宣言)为检索词,在NARA提供的几个检索系统进行了检索,主要目的为对比检索记录的数量。在不加任何其他限定的情况下,其检索结果统计表格如表1:

按照常理,各个系统之间的数据可以重合,但全站检索或OPA一站式联机检索的记录应该最多。但结果显示,AAD的检索记录(2095)大于首页的检索记录(1406),远大于OPA(125)。这说明首页的检索框并非全站检索,且一些系统数据库包含站外信息。

事实上,在随机选取浏览了以上几种不同检索方式的检索结构后,笔者发现利用首页检索框检索出的结果,大部分是档案原件的扫描件或电子版,均可提供档案的原文进行阅读、甚至下载;而在ARC和ADD中,只有档案文件的著录信息,虽然有提供档案拷贝(Archived Copies)和数字拷贝(Digital Copies)的栏目,但需要联系档案馆,才能获取。此外,OPA的检索提供的是针对检索式的一个集成的索引,也就是在OPA的每一个检索结果下,包含与检索式内容相关的多个链接。

(2)高级检索(Advanced Search)

ARC对内容进行了四项分类,分别为:“Archival Descriptions”、“Digital Copies”、“People”、“Organizations”。高级检索提供了多种筛选结果的方法,包括对检索词的限定、仅搜索标题等。对于专业档案工作者来说,还可以在“by description identifier”一栏填写档案标示符,进行更精准的查找。例如限制结果数量、档案材料的种类(图纸、手工制品、数据文件、地图或图表、动影像、照片和图像材料、声音档案、文本档案、网页)、档案的馆藏地点、档案的描述等级(全宗群、全宗、案卷、卷、件)、档案的数据范围(时间范围、描述时间更新范围)等。目前ARC支持布尔逻辑检索、运用引号进行词组的精确检索和截词检索。

综上所述,NARA的ARC检索方法与之前学过的网络学术期刊数据库类似,对于有过信息检索基础的人来说,比较简单。即使没有任何检索知识和经验,可以在短时间内掌握。并且,从ARC的检索实验结果来看,其检索的效果是比较有效的。

3.2.3 多媒体检索

多媒体存储与检索技术是指将文本、数值、图形、图像、声音等多种类型的档案信息进行综合处理的技术。由于没有找到直接提交图像、声音、视频进行查找的功能,笔者按照目录和全文的思路对NARA的多媒体资源进行了探索。

(1)目录检索中的媒体资源分类

NARA在目录的一些分类里有各种媒体资源,例如,在首页下方的目录索引的“I want to”目录下,有“View online exhibits”这一项,其中NARA提供了大量的精选展品,有丰富的照片、原件复印件、flash等资源。

(2)通过简单检索直接查找媒体资源

在首页的搜索栏中输入“video”,检索结果有2067条,随机选择其中几条进行观察,发现站内的视频文件是通过外连到Youtube进行提供的。

(3)对媒体资源进行精确查找

通过对General Type限定,检索特定媒体类型的档案,如影像、声像、图像等。

3.3 检索服务

(1)NARA的检索指南包括基本使用方法和常见问题,基本可以解决初次使用NARA的用户的问题。

(2)RSS定制服务。RSS定制服务是针对NARA的新闻、更新资源、和活动信息的定制服务。虽然跟检索不直接相关,但对于用户随时了解NARA动向十分方便。

(3)Shop Online 在线商店。用户可以通过在线商店订购NARA的出版物。

(4)标记与分享。在首页右上角,用户可以通过Bookmark & Share,选择不同的社交网络、邮件、博客等方式将感兴趣的内容与别人分享。

可以看出,NARA的十分重视用户体验,也可以感受到NARA是为了服务用户来进行网站设计的。各种功能与当下流行的网络工具联系紧密,让用户感觉十分亲切、实用、想用。总体上来说,使用NARA的体验是非常良好的。

4 浙江档案网

4.1 数据库的类型

(1)目录数据库

浙江省档案网提供的革命历史档案、民国档案、建国后档案、馆藏资料均为目录数据库,检索出的档案只有目录,没有提供原文。在馆藏资料中有些档案可以付费下载。

(2)事实数据库

专题数据库应属于事实数据库,其内容是对人名的检索。

(3)全文数据库

现行文件数据库是全文数据库,可以进行全文检索。

4.2 检索途径

浙江档案馆也支持分类检索和全文检索,同样也提供了多种检索途径。

4.2.1 分类检索

浙江省档案馆提供了四种分类:档案检索、视频点播、图片资料、网上资源。其中“档案检索”是一个全站检索,除了包含视频点播、图片资料、网上资源、专题数据库外,主要包括革命历史档案目录、民国档案目录、建国后档案目录、馆藏资料目录等。“视频点播”是浙江新闻的视频数据库,可以进行关键词检索,可以在线观看。“图片资料”是英士大学和之江大学这两所建国前的浙江省著名大学的图片资料,内容丰富,可以进行检索,浏览免费,下载需要付费。“网上资源”则是外部数据库的链接。

4.2.2 全文检索与多媒体检索

(1)简单检索

在首页的简单检索框中,可以按照分类栏目进行检索,其分类包括:站内检索、政务公开、动态信息、公告、馆藏资源、现行文件、视频资料、招聘资料、珍品波兰、档案查阅、查档服务、热点宣传、档案公布、网上展厅等。在“建国后档案文件级”全文检索项中输入“城市规划”进行检索,但由于网络问题,经多次试验无法显示检索结果。

(2)高级检索

在“全文”下拉菜单中选择“高级”,弹出对话框,可以对文件的“题名”、“责任者”、“文件时间”、“开放控制符”进行限定来进行高级检索,以精确检索结果。

4.3 检索服务。

浙江档案网为用户提供会员服务。在注册成为浙江省档案网的会员后,可以在“用户面板”进行个用户操作管理。用户可以再“我要提问”栏目下对专家进行在线提问。在“个人账户管理中”,用户可以通过支付宝对账户进行充值,并可以直接对需要付费查阅的档案进行订购。

5 美国国家档案网与浙江省档案网的对比

本文主要从分类目录、检索入口、网页设计、易用性、检索服务等5个方面对美国国家档案网和浙江省档案网进行了对比。

(1)分类目录

NARA和浙江档案网均提供分类检索和全文检索。除了运用分类检索和全文检索中的基本途径外,NARA还提供的各种专用索引来检索。例如NARA提供了种类丰富的Subject Index,以个人兴趣为出发点的各种活动索引,以及站外链接。通过此类途径也可以达到一定的检索目的。此外,NARA没有提供多媒体检索,即不能直接提交声频、图像或视频进行检索。不过目录检索和全文检索在一定程度上可以实现多媒体资源检索的功能。

两个档案馆的馆藏具有各自的特点导致两者在分类目录上有所不同。笔者认为,NARA将简单、易用的分类放在网站比较醒目的地方,将将尽的分类放在链接中;浙江省档案网的分类也采用了这种形式,但总体上来说逻辑层次没有NARA清晰,对于专门的档案人员比较实用,对于普通用户来说,使用可能需要探索很久。

(2)检索入口

两个网站都有各自特色的数据库,都有简单检索和高级检索。NARA的高级检索非常专业,与学术期刊数据库类似;相比之下,浙江省档案网的高级检索显得过简单了。从检索效果上看,NARA也要好于浙江省档案网。

(3)网页设计

NARA以白、深蓝、绿为主要色调,整体的风格显得专业、清新;浙江省档案馆以棕色、浅牛皮色为主色调,整体风格显得古朴、严肃,我国大部分档案网站均是此风格。

从网页设计的风格也可以看出美国和我国对待档案工作的态度。美国更为开放,我国稍显保守。笔者认为,档案的最终目的是服务社会、服务公民,在现在这个信息社会,网络给档案提供了一个很好的平台。因此档案网站从设计上进行转变,变得更“亲民”、更有趣,或许是我们档案工作者现在应该认真思考的。

(4)易用性

基本上,NARA的所有检索都是以最简洁的“简单检索”为入口,点击“简单检索”上的链接,可以进入专业检索。在高级检索的页面,可以很方便的找到Help和Search Tips等帮助指南。特别注意到的是,NARA根据访问用户的IP地址自动做的调整。在检索结果的页面,部分重要的提示自动翻译成了中文。

浙江档案网同样设置了简单检索到专业检索以满足不同检索水平用户的需求。但是注册会员制度给使用制造了一定的门槛,并且部分资源仅有目录,没有内容。

(5)检索服务

NARA对用户体验的重视、对服务的重视,是值得我们学习的地方。只要转变了思维方式,在建设档案网站时,不仅关注馆藏的编排,更要关注如何以简单、专业、有趣的方式向公众提供检索利用,这样才能将档案的价值发挥到最大。

【参考文献】

[1]王岑曦,吴建华.基于用户体验的档案网站检索平台评价指标体系研究[J].浙江档案,2014(7):8-11.

[2]锅艳玲,段爱峰.完善我国档案网站检索功能之研究[J].浙江档案,2012(4):14-16.

[3]张莹.面向公众的国内档案网站检索服务体系构建研究[D].山东大学,2012:9.

[4]杨光羲.档案网站检索服务研究[J].黑龙江档案,2011(2):54.

[5]丁立新,祝鑫一.信息构建对档案网站检索系统建设的启示[J].兰台世界,2011(24):47.

[6]谢明生.关于我国档案网站检索查询功能的调查分析[J].法制与社会,2009,1(中):273.

注释:

①张莹.面向公众的国内档案网站检索服务体系构建研究[D].山东大学,2012:9.

②张莹.面向公众的国内档案网站检索服务体系构建研究[D].山东大学,2012:9.

③谢明生.关于我国档案网站检索查询功能的调查分析[J].法制与社会,2009,1(中):273.

④杨光羲.档案网站检索服务研究[J].黑龙江档案,2011(2):54.

⑤丁立新,祝鑫一.信息构建对档案网站检索系统建设的启示[J].兰台世界,2011(24):47.

⑥锅艳玲,段爱峰.完善我国档案网站检索功能之研究[J].浙江档案,2012(4):14-16.

⑦边莹.美国国家档案馆网站的特色[J].中国档案,2007(4):57-58.

⑧肖秋会.档案信息检索[M].武汉:武汉大学出版社,2011:178.

[责任编辑:杨玉洁]

猜你喜欢

信息检索
基于信息检索课的大学生信息检索行为调查研究
基于MOOC理念的“翻转课堂”教学改革探索——以海南大学《文献信息检索与利用》课程为例
网络环境下数字图书馆信息检索发展
医学期刊编辑中文献信息检索的应用
在网络环境下高职院校开设信息检索课的必要性研究
基于神经网络的个性化信息检索模型研究
地理信息检索中空间相似性度量的一种模糊方法
高校图书馆信息检索课程教学改革
教学型大学《信息检索》公选课的设计与实施
论本体论在智能信息检索中的作用