国外图书馆的政府公开信息整合工作综述
2010-03-22刘璇
刘 璇
(北京大学信息管理系 北京 100871)
在国外, 公共图书馆是提供政府公开信息的重要场所。而开展政府公开信息服务需要以资源的整合为基础——通过将分散的政府信息集中起来,进行有效的组织和管理,以方便用户进行查询。目前,国外图书馆对政府信息的整合方式也是多种多样的,比如有的直接提供政府网址链接、有的按政府信息主题或政府部门整合网址提供导航、有的将政府信息整合成一个统一的检索平台并将信息存档到本地数据库中,等等。笔者以是否将政府信息存档到本地数据库中为标准,将国外政府公开信息的整合分为两种类型:形式整合和内容整合。
1 形式整合
形式整合主要是指对网上政府网站链接进行的整合,如提供网址导航,并且提供检索功能指引用户找到信息源,但是并不能将政府信息内容存档到本地数据库中。
在国外图书馆这种形式整合主要有3种类型:①对政府网址信息进行整合,比如美国国会图书馆的整合;②对寄存图书馆的政府信息进行的整合,比如加拿大联邦政府信息定位项目;③对政府出版物书目进行的整合,比如图书馆澳大利亚项目。
1.1 美国国会图书馆(Library of Congress)
在美国国会图书馆中有专门的“连续出版物和政府出版物部”(Series and Government Publications Division),这一分支部门从政府印刷局免费获得政府出版物并向公众提供服务(图书馆对寄存的政府出版物的保存不得少于10年)[1]。他们主要负责政府信息的选存、保管、编目、上架和提供公众链接。他们对政府信息的整合主要是对政府网址进行的分类、导航并提供链接,但是并没有提供统一的检索入口,而是借助于“政府印刷局接入”(GPO Access)进行网上政府信息的检索。对于印刷、光盘和缩微形式的政府出版物,国会图书馆没有进行整合,只是负责保存、分类和提供借阅。
比如,在连续出版物和政府出版物部网页上的馆藏信息中有政府出版物(Government Publications)链接,通过该链接可以进入美国国会图书馆整合的政府公开信息导航页面。导航页面将整合的政府出版物信息分为3类[2],①美国国会图书馆馆藏政府信息(LC Holdings)。通过美国国会图书馆的“First Search”检索,可以检索到国会图书馆馆藏的政府出版物。而对于网络形式(包括网络出版物和网页)的政府出版物,美国国会图书馆并没有进行整合,而是直接链接到美国“政府印刷局接入(GPO Access)”进行检索。②政府出版物目录和指南(Bibliographies and Guides)。通过这些目录和指南类网址,用户可以链接到一些重要的政府机构和一些帮助用户了解政府信息的网址。③政府出版物网络资源(Internet Resources)。是美国国会图书馆对一些重要的政府网址进行的整合和导航。比如,对美国州政府信息的整合,通过整合页面上各个州名称可以进入美国各州政府部门的网页[2]。
综上,美国国会图书馆对政府公开信息的整合,实际上是对政府网址进行的分类导航,为用户提供所需信息的线索,而并没有对信息进行抓取、深入挖掘、存档等。这是由于在美国有专门的政府印刷局,它主要负责政府出版物的出版、发布,并将其内容整合成统一平台提供一站式的检索(GPO Access)。联邦层面政府所作的GPO Access整合平台整合的政府出版物量大且全,提供的检索方式有多种途径,并且直接能够在数据库找到原文,从而使国会图书馆在政府公开信息的整合方面不需要做过多的重复劳动。
1.2 加拿大联邦政府出版物定位项目(Federal Publication Location)
加拿大联邦出版物定位项目是由寄存服务项目(Depository Services Program)、通讯加拿大(Communication Canada)和加拿大国家图书馆(National Library of Canada)共同合作的项目。通过该定位服务,用户可以获取加拿大国家图书馆目录中的加拿大联邦政府出版物书目记录、加拿大国家图书馆中收藏的政府出版物信息、寄存图书馆中链接的加拿大联邦政府电子出版物[3]。该定位服务对加拿大所有寄存图书馆中政府出版物信息进行了整合,并且提供一站式的检索(支持英语和法语检索)。该项目之所以叫“定位”,顾名思义就是进行的整合并没有直接将政府信息存档到本地,而只是定位到政府信息寄存的图书馆,这也是此项目最为突出的特点。用户通过检索可以知道哪些寄存图书馆收藏了所需的政府出版物,并且在寄存图书馆的政府出版物馆藏信息中,用户不仅可以看到哪些寄存图书馆收藏了印刷版政府出版物,而且可以通过相对应的网络版政府出版物链接地址直接获取信息。这实际上也提示我们,对于具有印刷版和网络版的政府出版物可以采取这样一种方法——在馆藏信息中同时提供政府出版物印刷版的分类号和网络版的链接地址,以满足不同用户的需求。
1.3 图书馆澳大利亚项目(Libraries Australia)
1981年,澳大利亚国家图书馆与澳大利亚800多个图书馆和书店合作启动了图书馆澳大利亚项目。该项目用于参考咨询、馆藏发展、编目和馆际互借。项目的核心是加拿大国家书目数据库,库中记录了4 200万条书目数据(其中包括政府出版物书目数据),允许参与的图书馆和书店能够共享这些书目数据信息。用户可以通过图书馆澳大利亚的检索平台检索收藏所需的政府出版物的图书馆地址,并且在收藏的图书馆列表中,不仅可以看到政府出版物书目信息,而且可以获得图书馆联系方式[4]。另外,通过检索平台还可以找到出售所需政府出版物书店的信息。因此,图书馆澳大利亚项目实际上整合了政府出版物书目的信息,使用户可以通过统一的检索平台找到所需政府出版物的信息,但该项目并没有存档政府信息的文本。
综上,以上国外图书馆3种政府信息的整合实际上都是对网址的整合,有的整合了政府网站地址、有的整合了图书馆中政府出版物的目录地址,但都不涉及政府信息的存档。用户通过这种形式的整合可以发现所需政府信息的线索,但不能在整合平台上直接获取政府信息的文本,而是要到原网站上获取。因此,笔者认为这其实是一种不存档政府信息内容的整合,只是对外在的链接进行的形式整合。
2 内容整合
内容整合是指不仅对政府信息的网站地址进行整合,而且对信息内容也进行整合,并提供一站式检索,将信息内容及其网页形式存档到本地数据库中,它是一种比较完全的整合。对于内容整合,以澳大利亚PANDORA项目和日本国立国会图书馆的整合为代表。
2.1 澳大利亚PANDORA项目
澳大利亚保存和获取网络文献资源项目 (Preserving and Accessing Networked Documentary Resources of Australia,简称PANDORA)是1996年澳大利亚国家图书馆(National Library of Australia,简称NLA)牵头与9个图书馆和文化机构合作启动的项目。它其实是一个数字资源长期保存项目,以收集、保存与澳大利亚相关的网站和出版物为目标,旨在通过保存活动为未来的用户提供这些资源的存取与利用。收集的相关网站主要包括非常有代表性的学术、商业、组织机构网站,政府网站也包括在内。NLA开展的工作主要有:颁布政策性文件,比如《保存在线出版物的选择方针》、《澳大利亚电子出版物的国家战略》等;对网上信息资源进行选择、获取、收集、 抓取、 管理、存档;项目使用网址收集和管理软件(PANDORA Digital Archiving System,简称PANDAS)采集信息,并建立PANDORA存档(PANDORA Archive); 对政府信息资源整合、提供一站式检索并存储到本地数据库。在PANDORA存档主页,可按照不同的主题对存档信息进行浏览,点击其中的“Government & Law”(政府和法律),可以进入“地方政府”(Local Government )等子栏目。通过在此类信息中的一站式检索可以显示所需的政府信息结果列表[5],并且从列表中可以看到存档该信息的网址、存档的日期。选取一条记录可以看到显示的政府信息保持了网页原貌,因此,PANDORA存档的不仅是政府信息的内容,而且也存档了政府信息网页的形式,是一种比较完全的深入的内容整合。
2.2 日本国立国会图书馆的整合
日本国立国会图书馆是隶属于日本国会的国家图书馆,对众议院的会议录进行整合是国立国会图书馆开展政府信息整合的代表性项目之一。其实,众议院对于会议记录形式的政府信息也进行了简单的整合,但是缺乏检索功能,用户只能进行浏览[6]。日本国立国会图书馆主页[7]提供有众议院会议录的链接,但这并不是简单链接到议会网站,而是将会议录整合成为“国会会议录检索系统”。该系统平台提供简单检索、复杂检索和浏览,用户可以直接通过该平台在数据库中找到所需会议录的内容[8]。整合而成的数据库系统不仅便于公众检索利用,而且成为图书馆开展政府信息服务的基础。
一般图书馆对于政府信息的整合都是图书馆链接政府网站,但是由于日本国立国会图书馆对政府会议录信息进行了更加深入的整合。并提供统一的检索平台,从而弥补了政府自己整合的不足。因此日本议会网站链接了图书馆网站,这说明图书馆的资源整合只要做得好,对政府网站是可以产生影响的。一个链接看似简单,实际上表明了政府对图书馆组织与整合资源能力的社会性承认,同时也是图书馆扩大社会影响、彰显自身价值的有效途径。
3 国际经验的借鉴
对照国外图书馆政府信息整合现状、立足于中国现实,笔者认为我国公共图书馆今后开展政府信息整合主要发展思路应为以下方面:
3.1 从形式整合到内容整合
形式整合其实就是对政府网址进行的整合链接。但是,由于信息的易逝性及政府机构变动等诸多原因,造成许多政府网站的信息消失而变成“死链”,因此,将政府信息进行抓取、存档到本地数据库中并进行的内容整合恰好弥补了这一不足。而且,数据库中的政府信息可以被直接推送给用户,这也节约了用户通过形式整合的链接进行二次查找信息的时间和成本,因此,这是未来的发展方向。
3.2 印刷出版物的整合
目前,《中华人民共和国政府信息公开条例》[9](以下简称《条例》)刚刚颁布,政府信息从政府部门传递到图书馆这一过程没有制度的保障,因此目前被呈送到图书馆中印刷形式的政府出版物数量还较少。但是,随着今后制度的完善,图书馆中政府出版物的数量也会逐渐增多,对国内公共图书馆中馆藏印刷型政府出版物的整合也会被列上议事日程。图书馆要通过印刷型政府出版物的整合使有需求的用户能够在就近图书馆及时获取。另一方面,随着电子政务的推进,政府信息越来越多地以网络形式进行发布,那么是否需要将网络型政府出版物的整合和印刷型政府出版物整合兼容为一个统一的平台也将成为今后研究的问题。
3.3 合作、宣传与指导
任何一个单独的部门都无法很好地解决用户最终获取政府信息的问题,因此与各个部门的通力合作就显得尤为重要。首先,政府是政府信息发布的主体,政府本身占有和控制着大量的政府信息,因此公共图书馆要积极与政府进行合作,建立良好的沟通机制,得到政府的认可和支持,才能开展好政府信息服务;其次,各个公共图书馆之间的合作,需要采用共建共享的方式整合各地的政府信息资源,减少成本,扩大效益;再次,图书馆应与档案馆合作。有信息专家指出“政府拥有80%的政府信息,档案馆拥有60%的政府信息”[10],而《条例》又规定了图书馆和档案馆同时作为为公众提供政府信息服务的场所,所以图书馆可以考虑和档案馆合作,采取政府信息资源共建共享的策略。例如,2005年加拿大的国家图书馆就和国家档案馆进行合作,共同对政府信息进行采集和存档[11]。
《条例》刚刚颁布,很多公众还不知道图书馆可以获得政府信息,还不能把图书馆和政府信息联系起来。因此,要向公众广泛宣传公共图书馆在政府公开信息服务方面所做的工作,提高公共图书馆的认知度,使我们整合的资源能够被公众所使用。同时,对于政府信息有需求的用户,图书馆应对其进行指导,使用户无论是在图书馆还是在网络上都能够顺利地找到所需信息。
[1]Library of Congress Collections Policy Statements[EB/OL].[2009-10-25].http://www.loc.gov/acq/devpol/govus.pdf.
[2]美国国会图书馆整合政府出版物页面[EB/OL].[2009-10-25].http://www.loc.gov/rr/news/lcgovd.html.
[3]加拿大联邦出版物定位[EB/OL].[2009-10-24].http://www.collectionscanada.gc.ca/7/5/index-e.html.
[4]图书馆澳大利亚主页[EB/OL].[2009-10-24].http://www.nla.gov.au/librariesaustralia/.
[5]PANDORA主页[EB/OL].[2009-10-24].http://pandora.nla.gov.au/.[6]日本众议院主页[EB/OL].[2009-10-28].http://www.shugiin.go.jp/index.nsf/html/index.htm.
[7]日本国立国会图书馆主页[EB/OL].[2009-10-28].http://www.ndl.go.jp/.
[8]国会会议录检索系统[EB/OL].[2009-10-28].http://kokkai.ndl.go.jp/.
[9]中华人民共和国政府信息公开条例[EB/OL].[2009-12-04].http://www.gov.cn/zwgk/2007-04/24/content_592937.htm.
[10]马玉杰, 杨红梅, 杨爱志.档案部门作为政府信息公开主要场所的作用与意义[J].档案学研究,2008(2):34-36.
[11]加拿大政府网络存档[EB/OL].[2009-10-26].http://www.collectionscanada.gc.ca/webarchives/index-e.html.