公共图书馆“泛”政府信息的整合
2010-05-03萨蕾李丹
萨 蕾 李 丹
(国家图书馆 北京 100081)
1 “泛”政府信息的含义及特点
1.1 “泛”政府信息的含义
2007年4月《中华人民共和国政府信息公开条例》(以下简称《条例》)颁布并于2008年5月开始实施。《条例》第2条对政府信息做了如下规定:“政府信息,是指行政机关在履行职责过程中制作或者获取的,以一定形式记录、保存的信息。”[1]对政府信息的认定和理解应当把握以下3点:第一,从政府信息的性质看,政府信息是与履行行政管理职责密切相关的信息;第二,从政府信息的产生方式看,政府信息不仅包括本机关在履行职责过程中制作、加工的信息,还包括在履行职责过程中从其他机关、组织、个人那里获取的信息;第三,从政府信息的存在形式看,它应当是以一定形式记录、保存的信息,既可以是纸质文件,也可以是胶卷、磁带、磁盘等其他储存介质文件,但是没有载体的口头消息、社会传闻等不属于政府信息,行政机关也不会提供此类信息。
通过对政府信息的解释不难看出,在日常生活中还有许多从严格意义上讲不属于政府信息但又与政府信息息息相关的信息,如并非行政机关在履行职责过程中制作或获取但却与其履行职责有关的信息,可以是相关报道、视频、网站等。这部分信息对政府信息利用有着极大的促进作用,可以说是政府信息的衍生信息,并与政府信息一并构成广义的政府信息。为方便论述,本文引入地理及经济学中“泛”的概念,将广义的政府信息统称为“泛”政府信息(见图1)。
“泛”政府信息包括以下几种类型:①正式出版物(如图书、报刊)中对政府公开信息的解读、宣传和说明性信息;②非正式政府出版物及政府信息公开目录以外的政府网站信息;③政府机构组织的各类会议、公共活动及其衍生出来的内容,如专题网站、会议视频资料、会议新闻报道等;④政府官员出席活动的讲话或政府官员的博客等主要以政府职员为主体的信息;⑤其他由政府信息衍生出来的信息。
1.2 “泛”政府信息的特点
“泛”政府信息包括政府信息的所有特点,但又不局限于此,还有一些其他特色。
从来源上看,“泛”政府信息的生产主体更加多样化。政府信息生产主体主要是指行政机关,这里的“行政机关”是广义的,既包括狭义的行政机关也包括被授权组织。政府信息的内容包括政府制作的信息、政府获取的他人信息以及其他主体制作但与政府职责的履行密切相关的信息。由于“泛”政府信息的范围更广,因而信息生产主体具有多样性,既包括行政机关,又包括政府官员等其他主体(如其他机构或组织)。
从存在方式来说,“泛”政府信息的存在方式更为多样。图书、期刊、报纸、网站、新闻报道、视频、转发文件、博客等都是“泛”政府信息存在的方式。
从文献特征来说,“泛”政府信息的文献特征更为丰富。目前,出于方便用户检索的考虑,政府信息整合从全文、标题、发布日期、内容分类等方面提取特征进行著录。而对于“泛”政府信息来说,由于其范围更广泛,存在方式、类型更多样,注定其文献特征更丰富。例如,对于某些政策、法规出台背景信息的报道以及对其实施后的影响及效果的报道等,如何将其与原文件整合并形成一定范围的主题信息,如何对相关会议或仪式的视频进行著录、对某些博客或新闻报道进行链接等,都对其整合提出了更高的要求。
2 公共图书馆对“泛”政府信息进行整合的必要性
自2008年《条例》施行以来,各公共图书馆一直在对政府公开信息的整合进行尝试、探索,其目的在于为用户提供有序的信息资源。然而,对各种与政府信息相关的信息资源的整合工作还未得到充分的重视。虽然这部分信息资源不属于政府信息,但也很有必要将其与政府公开信息在同一平台上进行整合,其原因在于:
一辆红色的士从医学院附属医院向中山路缓缓行驰,车里坐着龙斌、竹韵、威力公司一名男员工、以及竹韵家的小保姆。小保姆坐在车门边,竹韵坐在司机后边,龙斌身子仰靠着车椅,坐在正中间。他的脸色苍白,表情阴郁,竹韵手里捧着一束鲜花,给车里沉闷的气氛增添了几分鲜活,这是海力托人送来祝贺龙斌康复出院的礼物。
第一,政府是社会信息资源最大的拥有者,也是最大的信息生产者、消费者和发布者,这些信息资源关系国计民生,涉及群众的切身利益,为社会所关注。政府公开信息只是其中的一部分,用户对大量的其他相关信息也同样有着广泛的需求。
第二,《条例》施行后,大部分政府网站都开通了政府信息公开目录专栏,提供政府公开信息;同时,信息公开的分类体系标准、核心元数据标准等一系列标准的研究均取得了良好的进展,极大地增加了公众获取政府公开信息的便利性。相比之下,政府信息外围的信息资源内容多样、位置分散,一般没有经过专业的信息加工、编目与整合,检全率与准确率低,给公众的获取造成很大的困难,因此,对其进行深度揭示、科学整合,使其由无序变有序是非常必要的。
第三,政府公开信息一般是比较独立的信息,各种信息之间关联度较低,而信息需求者往往并不满足于孤立的信息,而是希望获得更为丰富的信息资源。如果将政府公开信息与相关的信息进行整合,则可以集点成线、集线成面,在更深、更广的层面上为信息需求者提供服务。这也是当今信息检索的发展趋势。
第四,用户在检索信息时需要的往往不是某一信息,而是以该信息为核心的一组信息资源的总和,从而对其所感兴趣的某一事物获得全面的认知,了解社会生活的某一侧面。“泛”政府信息的分散性往往使用户的信息需要无法得以满足,所以亟需对该类信息进行整合。
3 “泛”政府信息整合的基本原则
3.1 系统性原则
系统性原则包括整体性、层次性、主题性三方面。整体性是指要保持信息资源对象学科的完整性;层次性是指要保持信息资源整合的结构性(多维性),要求按多种类型、多种层次、多种方式进行多维整合;主题性是指以信息内容为核心聚合各类信息资源。
“泛”政府信息以政府公开信息为核心。因为围绕每一项公开的政府信息都有众多的与之相关的信息资源,如与《条例》的颁布相关的信息资源包括《条例》公布前的相关社会背景、对《条例》制定过程中的各种消息的报道、《条例》颁布后各级政府转发执行的情况、社会各界对《条例》执行情况的反响、《条例》执行过程中出现的问题等。如果将所有相关的信息资源整合在一起,不仅可以按照知识内容对信息资源进行聚类,为用户汇集更广范围内的信息资源,而且可以勾勒出清晰的政府信息生命周期,为研究政府信息资源的利用情况提供便利。
3.2 时效性原则
信息资源系统是个开放性系统,但它并不是永恒不变的,而是与信息资源的增长及用户需求等有着密切联系的,是随着外界环境的变化而不断变化的有机整体。
由于“泛”政府信息内容广泛、形式多样,因此具有较强的动态性,如新形成或变更的政府信息,属于公开范围的在规定时限内予以公开;原来具有保密属性的政府信息随时间推移不再属于保密范围的则予以公开;政府信息的衍生信息随政府公开信息的增加而增加;政府信息未变化,与之相关的信息有了新的变化,则相应增加、变更或减少,等等。
公共图书馆在对“泛”政府信息资源进行整合时,要注意保持其动态性,广泛地进行搜集,确定有价值的信息并实时跟踪,以确保信息资源的时效性;及时对虚假信息资源进行过滤筛选,将最有价值的信息资源提取给用户,以确保信息资源的真实性;及时围绕新产生的信息资源内容进行整合,对信息之间的关联、关系予以更新。
3.3 真实性原则
“泛”政府信息的作用是为公众生活提供指南、为社会经济发展提供参考、为政府行为决策提供依据。基于这些特点,公共图书馆对“泛”政府信息进行整合时应为信息需求者提供真实、权威、严谨的信息资源。政府公开信息一般都经过行政机关的严格审查,但与其相关的其他信息由于发布者不受控制,往往分布较为分散、权威性差、规范程度低。因此,应在采集、加工、发布的过程中对“泛”政府信息进行人工筛选、整理与控制,不能仅依赖机器自动处理,必须通过人为干预为信息需求者提供可信度高的信息资源,以避免误导使用者。
笔者认为,为提高“泛”政府信息的真实性,图书馆应在整合的过程中增加考证环节。在图书馆工作中,考证多用于名称规范工作,指的是当文献信息源本身无法提供可识别的个人名称信息时,编目员通过对文献信息源之外的其他参考信息源进行查询并获得相关信息的过程。传统名称规范考证工作是对名称规范权威性的有力保障。所以将考证这一概念引入“泛”政府信息的整合,目的在于保证“泛”政府信息的真实性与权威性。在“泛”政府信息的整合工作中,参考源应以各级政府网站、政府出版物、权威报刊、权威工具书等为首选,其他相关资料为参考,需要时可与相关政府部门取得联系、搜集资料。
4 “泛”政府信息的整合框架
基于“泛”政府信息的特点,笔者认为,对其进行整合应基于内容管理,以政府公开信息为核心,并与图书馆目录体系相结合,构成多元多维的知识网络。
近年来,信息资源的组织越来越注重内容,如OCLC(Online Computer Library Center,联机计算机图书馆中心)推出的服务FictionFinder就是围绕某个特定主题来组织各种类型文献的;再如,越来越多的网站、博客以标签云的形式来组织信息资源。同时,信息资源检索呈现综合化的特点。由于信息使用者需要获取内容全面、类型完整的信息,所以公共图书馆应致力于使用户快速获取信息、提高信息资源的利用效率。因此,公共图书馆在对“泛”政府信息资源整合时,应以基于内容管理基础的深度知识挖掘为首要任务,力求为用户提供更多、更有价值的有效信息,以解决“泛”政府信息资源的分散性与用户信息需求的综合性之间的矛盾。
笔者认为,应将存在于不同物理空间的各种类型、各种内容的信息资源以内容为线索,以政府公开信息为核心进行整合,并形成资源覆盖面广、系统的知识体系,以使数据对象间具有统一性和有机关联性,体现知识间的内在联系(见图2)。
从图2中可知,由中央政府信息公开专栏、地方政府信息公开专栏、政府公报、图书馆OPAC系统政府出版物目录中的信息资源汇集成公共图书馆的政府信息整合平台,以这一整合平台的政府信息资源为核心,并将其与图书馆OPAC目录系统、报刊与网络等新闻媒介、电视等传播媒介提供的“泛”政府信息资源整合在一起,形成公共图书馆“泛”政府信息资源库,用户可通过公共图书馆主页提供的可视化导航获得所需的“泛”政府信息资源。
5 “泛”政府信息整合之要点
5.1 元数据的制作应注重兼容性,并突出“泛”政府信息的特点。
元数据是资源组织的基础,通过规范、结构良好的元数据对资源进行描述有助于提高资源的可检索性,对于使用者的知识拓展也将起到重要的作用。
国内外对于政府信息资源的元数据标准均开展了多年的研究,有了较为成熟的元数据方案,使公共图书馆制作的元数据可与之保持一致性,以利于资源的共享。国外得到广泛应用的元数据方案主要有GILS(Government Information Locator Service,政府信息定位服务)及DC-Government(都柏林核心政府元数据)两种,国内也形成了一些建议方案,如CGIMC(China Government Information Metadata Core,中国政府信息资源元数据核心集)、e-GRMS(e-Government Resource Metadata Standard,电子政务信息资源描述元数据标准)等。而“泛”政府信息里的另一部分——政府信息的衍生信息,由于对其开展的研究较少,还没有形成独立的元数据标准。这部分信息资源与政府信息资源在内容上有很多共同点,加之提高信息资源的兼容性可以更好地保证信息资源间的共享与交换,因此对这部分信息应按照其自身特点,在已有的成熟元数据标准上进行复用与扩展。下面以国务院办公厅成立的政府信息公开目录及指南编制工作小组制定的《政府信息公开目录元数据方案》为例加以说明。该方案定义了12个基本元素:索引号(必选)、名称(必选)、内容概述(必选)、生成日期(必选)、有效期、文号(条件必选)、相关信息、发布机构(必选)、关键词(必选)、信息分类(必选)、获取方式(必选)、著录日期[2]。图书馆应结合信息资源的特点,对这12个基本元素进行适当调整,如衍生信息里一般不会出现文号,因此可以不选用“文号”这一基本元素;“泛”政府信息形式多样,因此应在元数据方案中借鉴《网络资源描述元数据著录规则》[3]定义“资源类型”这一基本元素,对资源内容的特征和类型进行描述;在对“泛”政府信息进行整合的过程中应注重其真实性、权威性,因此应在元数据方案中借鉴《网络资源描述元数据著录规则》[3]定义“资源评价”这一基本元素,著录编目员、专家、用户等对资源的评价信息。
5.2 公共图书馆对“泛”政府信息的控制应充分利用图书馆成熟的知识组织方法
对政府信息资源进行整合时是否应与图书馆编目体系保持一致,在国外并无统一的做法。在GILS元数据中,有关分类的赋值多引用已有的标题表和分类法(如美国国会图书馆标题表等),也有一些观点不主张使用图书馆的主题词表,认为主题词表过于复杂,必须接受专业培训才能使用(如美国一些州就研制了专用的主题词表,而不使用美国国会图书馆标题表)。
图书馆的知识组织方法历经百年的发展,已经相当成熟,体系完整,结构合理。尽管限于其专业性强、内容过于繁复而在图书馆界之外没有得到普遍的应用,但其优点仍是不容置疑的。因此,对网络资源进行编目、整合时,对这种成熟的组织方法不应弃之不用,而应在新的理念与技术的支持下提高其易用性,发挥其优点。
公共图书馆对“泛”政府信息资源进行整合时可利用电子政务主题词表,但同时也应结合图书馆成熟的标引工具,以更好地实现揭示信息资源的功能,为信息需求者提供更有效、便捷的导航。
具体来说,在主题标引方面,图书馆首先应将现有的《综合电子政务主题词表》与《汉语主题词表》进行映射,以达到两个词表体系完美嵌合的目的;其次,将关键词作为单纯参照补充到图书馆的主题规范标目中,一方面借助发展较为完善的规范主题词表体系提高检索的准确率,另一方面,通过规范主题词在各种形式的相关资源之间建立关联,构建基于知识点的知识库。
5.3 “泛”政府信息应按主题进行聚合,注重信息之间的关联性。
如何对不同物理空间的信息资源进行整合是近年来研究的热点问题,主题地图(Topic Map)作为一种知识组织工具,为信息资源的整合提供了可能实现的解决途径。随着国内外学者对其研究逐渐深入,主题地图开始被广泛应用到主题分类、知识表示与本体、知识构建、网络知识发布、语义网等方面。主题地图实际上是一个知识网络,网络的各个节点代表不同主题的知识,节点之间的连线则代表主题之间的联系。主题地图分成资源域和主题域,资源域可以是任意形式的信息资源,主题域在资源域之上定义生成,主题地图通过主题域实现对各种信息的整合。主题地图中的主题可以用自然语言和半自然语言来表达,可以借鉴该领域内的学科分类体系和叙词表来建立,其知识点呈网状分布。基于主题地图的分类体系可以跨越知识资源在存储形态、存储方式和地理位置等方面的限制,实现不同类型、不同地域位置的知识资源的一体化架构。基于主题地图的特点可以看出,主题地图非常适合用于对“泛”政府信息资源的整合。当然,对于形式多样的“泛”政府信息,主题地图的本体构建会是相当困难的工作,这一点需要通过技术的完善及实践的探索逐渐实现。
6 结 语
由于“泛”政府信息自身的特点及网络资源服务体系的不规范,“泛”政府信息资源的整合面临诸多问题。如何通过有效的整合使“泛”政府信息资源得到合理的利用,是公共图书馆需要进一步深入研究的。然而,可以预见的是,要对浩如烟海的“泛”政府信息资源进行整合,仅凭公共图书馆的一己之力是很难完成的。因此,对这类资源的整合应该集各级各类图书馆、政府部门、专家学者乃至互联网的每一个使用者之力,共同构建一个共建共享的政府资源平台。
[1]中华人民共和国政府信息公开条例[EB/OL]. [2009-11-30].http://www.gov.cn/xxgk/pub/govpublic/zhinan_821.htm.
[2]魏云波.对我国政府信息公开目录建设的若干思考[EB/OL].[2009-11-30].http://202.96.31.19:8080/WEB_GT/Resource/2%20weiyubo.ppt.
[3]网络资源描述元数据著录规则[EB/OL]. [2009-11-30].http://cdls.nstl.gov.cn/.