英国国家档案馆在线社交媒体档案库及其特色
2015-04-03赵玉王健
赵 玉 王 健
(中国人民大学信息资源管理学院,北京,100872)
1 背景
英国国家档案馆(The National Archives,简称TNA)2012年11颁布的《文件收集政策》(Records Collection Policy)取代了2007 年的旧版本《文件征集和处置政策》(Acquisition and Disposal Policy)。《文件收集政策》中规定了英国国家档案馆需要长期保存文件的归档范围、收集时间和保存地点。
为了处置与公众相关的文件,英国国家档案馆接着颁布了一系列《操作选择策略》(Operational Selection Policies,OSPs)。这些策略接受各方的意见,包括文件使用者、档案工作者、使用该策略的政府机构等,并会根据这些意见进行修订和更新。在2014 年4 月11 日针对英国政府网站档案馆(UK Government Web Archive,简 称UKGWA)颁布的《操作选择策略第27 则:英国中央政府网站资产》(Operational Selection Policy OSP27: UK Central Government Web Estate,简称OSP27)中正式对政府机构网站归档项目的范围和内容作出说明和规定。
英国国家档案馆对政府机构网站的归档由来已久。早在1997年,英国国家档案馆就利用国家数字档案数据集系统(National Digital Archive of Datasets ,简称NDAD)对政府机构的数据集有选择地收集和保存。这些数据集及其背景信息来自政府部门的物理转移。为了保证数据通过NDAD网站能够被下载或者购买,NDAD 将原始数据的格式统一转为开放的CSV格式。
2010 年至今,随着政府公布数据集方式的演变,英国国家档案馆推出UKGWA 捕获和保存这些数据。英国国家档案馆利用UKGWA在文件产生的原始背景下保存政府机构网站所有形式的内容(包括网页、官方出版物、数据集、多媒体等网站信息)及元数据(比如形成时间、形成者等),保证数字档案资源的内容、背景和结构的完整性。
2013年12月,英国中央政府部门逐渐由各自的网站向集成的GOV.UK 转变,英国国家档案馆的目标由抓取部门网站的数据集和部门网站本身变为每年两次对data.gov.uk 清单上的数据集及data.gov.uk网站本身进行全面捕获和抓取。目前,UKGWA 已是世界上最大的和使用最频繁的网站档案馆之一,拥有超过30 亿资源定位符并仍然以每月超过1000 万的页面浏览量增加。
表1 UKGWA与OSMA对比表
2 在线社交媒体档案库的出现和发展
2.1 背景
在线社交媒体档案库(Online Social Media Archive,OSMA)建于2014年5月8日,是英国国家档案馆在社交媒体蓬勃发展的背景下建设的UKGWA的重要组成部分。随着Twitter、YouTube 等社交媒体在英国社会的流行,英国政府机构开始普遍利用社交媒体和其他数字媒体形式与公众在线交流。相应地,文件的产生方式也随之改变。正如英国国家档案馆馆长Clem Brohier所说,“社交媒体在政府部门活动中的作用越来越重要,政府机构利用Twitter 阐释政策,通过YouTube 推广各种举措。因此英国国家档案馆有必要开发出专门的系统支持社交媒体平台上的归档工作,并将收集的信息作为官方公众文件的一部分。……后代可以通过推文了解历史,正如我们通过历史电报了解过去。”
为了适应这种变化,英国国家档案馆适时将政府机构的社交媒体账户产生的信息有选择地作为文件列入归档范围,以可获取、保存背景信息和再利用的方式来保存所产生的数字文件,保证文件的真实性和完整性。从2014 年5 月8 日起,英国国家档案馆对中央政府部门在官方推特账户上发布的推文和YouTube账户上发布的视频进行归档。
UKGWA(英国政府网站档案馆)和OSMA(在线社交媒体档案库)之间的关系,详见表1。
2.2 归档范围
为了有效地利用资源和限制所捕获文件的范围,英国国家档案馆Twitter的归档工作根据以下规则进行,英国在线社交媒体档案库收集的文件是政府机构而非公众个人或者其他组织在推特上发布的推文,其归档范围如下:国家政府机构和非内阁部门的推文;其他政府组织和非政府组织可按照政府部门的要求归档;在UKGWA 归档范围内的网站链接都会被保存。但并不是政府机构所有的推文以及每条推文下面的内容都会被保存,在线社交媒体档案库也对不在归档范围的内容作出规定:转发的推文、对推文的的回复和对话、官员个人的账户、不在UKGWA 归档范围的网站链接(比如报纸文章)。
在推文的收集方面,英国在线社交媒体档案库一次就能够捕获多达3200 张推特的“快照”。用户可以获取出现在推文的链接,还可以通过网络档案馆或者完整的网址访问原来的网页。英国在线社交媒体档案库保存的带有编码的推文能够确保每条推文和它的背景信息(比如发布日期和时间)的完整性,为以后的长久研究提供了可靠的资源。
图1 2012年伦敦奥运会官方推特账户
此外,在YouTube 视频的捕获方面,英国在线社交媒体档案库目前运行的视频档案库测试版具备搜索功能,即按照发布的部门,可以搜索整个视频目录。Twitter 目前没有搜索选项,但也可以使用英国国家档案馆已公布的JSON和XML文件查询和分析推文所包含的信息。
2.3 现状
目前,在线社交媒体档案库上保存了包括2006 年至2014 年早期产生的7000 多个视频和2008 年至2013年9月产生的65000条推文,这些被归档的社交媒体的内容是在“在线社交媒体档案库”项目的试点阶段被捕获的,收集了包括2012年伦敦奥运会(见图1)和2012年女王钻石庆典(见图2)等历史性事件的文件。
图2 2012年女王钻石庆典
在线社交媒体档案库的出现和发展标志着英国国家档案馆开始捕获政府机构在社交媒体上产生的文件,并将其长期保存。2003年以来,英国政府网站在线开放的超过30亿的资源(包括网页、文档、互动游戏等)被英国国家档案馆作为UKGWA 的一部分归档。现在,随着社交媒体的出现,这个规模将会越来越大。在线社交媒体档案库上保存的文件和视频,成为UKGWA众多档案资源的组成部分。英国国家档案馆的在线社交媒体档案库根据英国国内各个社交媒体平台使用的现实情况,有针对性地选择了使用最为频繁的Twitter和YouTube提出具体的应用指南,因此有很强的实践指导性。
3 结语
随着网上服务理念的日益成熟,电子政务应用建设水平不断提高,越来越多的政府机构采用Web技术,通过网站发布信息、提供服务、办理业务,实现与公众之间的直接互动。在这些活动过程中,必然产生大量有价值的Web资源。政府网站信息不仅包含了大量的政府政策法规、新闻、通告等,还是对政府网络活动的最真实记录,并且其中有不少都是“原生性”数字信息。
政府网站信息资源是政府为了履行职责,向公众提供服务而发布在政府网站上的信息,是政府运作的记录凭证,具备长期保存价值,其重要性不言而喻。作为英国政府网站档案馆(UKGWA)的有机组成部分,在线社交媒体档案库(OSMA)中的社交媒体文件无疑属于重要的政府网站信息资源。
不管是为了开发政府网站信息资源所包含的社会和经济效益,还是为公众长久获取政府网站信息资源提供途径,又或是为后代保存重要的数字记忆,开展政府网站信息资源长期保存工作刻不容缓。而英国国家档案馆在这方面的有益探索,即英国政府网站档案馆(UKGWA)和在线社交媒体档案库(OSMA)项目的开展,为我国档案馆和图书馆界进行政府网站信息资源长期保存工作提供了借鉴,值得我们思考与学习。
[1]OPERATIONAL SELECTION POLICY(OSP27). http://www. nationalarchives.gov.uk/documents/information-management/osp27.pdf.[2015-05-28].
[2]The National Archives Makes Social Media Part of the Nation's Official History-Videos and tweets archived online as the public record.http://www.nationalarchives.gov.uk/documents/press-release-social-media-archive.pdf.[2015-05-28].
[3]英国国家档案馆.http://www.nationalarchives.gov.uk/.[2015-05-28].