APP下载

全球社交媒体归档行动概览与展望

2016-02-03

浙江档案 2016年12期
关键词:社交机构信息

1 引言

随着互联网软硬件设施以及智能设备的普及,社交媒体在人类活动中得到越来越普遍的使用。社交媒体正形成海量信息,记录人类形形色色的活动。为了保存人类活动的证据,留存社会记忆材料和信息资源,社交媒体归档获得档案领域的关注,美国、英国、澳大利亚、加拿大、中国、韩国等都开始在政策与数字档案馆的建设方面进行考虑,或已开展相应的行动。

然而,社交媒体归档从技术、社会、文化、法律等方面给予档案领域管理挑战,例如信息量大、互动性、超媒体、即时性造成的档案化保存困难,所有权和隐私的鉴定与保护问题,缺乏和平台服务提供商的合作以及无存档机制等不利因素,但当前在理论或实践上都没有一套完善的方案。

本文一方面梳理全球社交媒体归档的主要进展,呈现各国成果和经验;另一方面审视目前各国社交媒体归档面临的主要问题,从中进一步探讨社交媒体归档改进的关键点与未来的走向。

2 全球社交媒体归档行动概览

2.1 英国

英国国家档案馆有着长久的网站归档历史,业已形成庞大的网页档案库,社交媒体信息也是其捕获对象。它从2011年启动针对社交媒体归档的两年期项目,平台为Twitter与YouTube,以账户为单位收集信息,收集对象仅限于英国核心政府机构,使用的是自主开发的、用于捕获与提供利用社交媒体内容的自动化工具。英国国家档案馆的社交媒体归档确保了收集的账户即便原始账户消失,其形成的内容依然可用。

2014年,英国国家档案馆发布了第一批可在线利用的社交媒体档案,包括几千份原始视频和超过65000的Twitter信息,主要内容包括:内阁办公室、英国政府、国防部等51个政府机构Twitter账户发布的信息,2012年奥运会与残奥会7类主题信息,38类政府机构的视频库,2个2012奥运会与残奥会的视频库[1]。

2.2 美国

2.2.1 联邦政府机构

与英国国家档案直接归档政府机构的社交媒体信息不同,NARA主要指导与监督形成信息的联邦机构依据NARA和自身的规定归档,并发布了《社交媒体文件管理指南》,对捕获、保管期限等做了相应规定[2]。

依据NARA发布的《社交媒体白皮书》,截至2013年5月,美国联邦疾病控制中心、农业部、住建部、国务院、退伍军人事务部、总务管理局、文件与档案管理署、海军、史密森学会、美国海岸警卫队、环保部等10余个联邦机构都各有其社交媒体归档政策,且已经在开展相应工作[3]。例如,美国联邦疾病控制中心关于社交媒体信息的管理政策有《疾病控制中心社交媒体工具、指南和最佳实践》《Twitter指南和最佳实践》《Facebook 指南和最佳实践》。

2.2.2 国会图书馆

与NARA主要关注联邦政府机构不同,国会图书馆收集的对象更为广泛,包括社会组织、机构、群体和个人所形成的信息,其目的主要是为未来的研究提供丰富的社会材料。2010年4月,美国国会图书馆和Twitter签订了一项协议,国会图书馆从协议生效起可获得Twitter公司建立起即2006年到2010年4月的tweets档案。国会图书馆起初的目标是:获取与保存2006年至2010年的tweets档案;建立安全与可续的流程来接收和保存直到当前的日常与持续的tweets流;建立迄今为止所有档案的组织框架。到2013年1月,这些目标得以实现,国会图书馆拥有1700亿条tweets,且持续增长[4]。

2.2.3 美国地方州

美国各州如亚利桑那、俄亥俄、纽约、北卡罗莱纳、华盛顿、俄勒冈、德克萨斯、缅因、佛罗里达、马萨诸塞也都在不同程度开展社交媒体归档项目,如,华盛顿州2011年颁布了《华盛顿州政府社交媒体应用指南与最佳实践》,从隐私、利用、服务协议、内容的合法管理、安全、文档保管等方面规范社交媒体账户的运营与维护;亚利桑那州在2012年发布的《公共机构电子通讯、社交网络与网络文档通用保管期限表》中规定社交网络与网络文档的类型、保管期限以及保管的起始时间。此外阿拉巴马州的档案与历史部门从2006年起就开始收集阿拉巴马州档案机构的Facebook页面、阿拉巴马州的美国国会代表和参议院的twitter、州政府机构的YouTube视频等。

2.3 澳大利亚

澳大利亚国家档案馆同样关注社交媒体归档,但目前政策比较简单。澳大利亚国家档案馆认为社交媒体形成了新类型文件,各联邦机构有义务管理好这些文件,并发布了《使用社交媒体工具过程中的文件管理事宜》,主要从如下方面提示联邦机构应当注意的文件管理问题:如何管理存储于第三方的信息、如何确保捕获的是准确和真实的文件、机构与使用社交媒体的雇员捕获社交媒体文件却不能满足于动态变化的社交媒体时有哪些职责、哪些互动类的信息需要捕获、是否需要保存所有的活动信息[5]。同时,澳大利亚国家图书馆收集所有澳大利亚中央政府机构的网络档案(AGWA),社交媒体文件也是其中收集的对象。

2.4 中国

社交媒体在中国有着极其广泛的用户群,政务微博与微信已建成当前中国最大的网络议政厅。依据档案事业发展“十三五”规划,为了提升电子档案管理水平,核心任务之一就是要研究制定重要网页资源和社交媒体文件的归档管理办法。可以看出,中国的社交媒体归档也开始进入行动之中,亟待政策、技术、专业等方面的支持。

2.5 第三方机构

社会的营利或非营利的非官方机构同样参与或协助收集网络信息。Internet archive是典型代表,作为非营利机构,它一方面帮助留存社会信息资源与文化遗产,至2016年就建立20年的Internet archive已为网络保存了4450亿的网页,总量达到23PB,社交媒体平台Twitter、Facebook与YouTube的网页抓取量是2015年最高的15个网站中的3个。另一方面,Internet archive也协助社会组织、机构、群体与个人归档保存所需网络信息满足个性化需求,开发了颇为广泛的应用工具archive-it帮助个人与机构归档社交媒体[6]。

3 回顾:成效与机遇

从当前全球的社交媒体归档行动来看,工作已经取得一定成效,具体来说:

3.1 占据互联网阵地

第一,从内部的电子系统转向更加开阔的互联网平台,拓展了档案职业阵地。尽管互联网归档已有20年左右的历史,但各国档案领域参与的深度与影响力有限,其他信息行业如图书馆、信息技术部门或是第三方机构都有更丰富的实践。社交媒体是当前互联网的主流应用之一,是主导互联网的web 2.0技术与理念的典型代表,对社交媒体的归档可以说是从互联网的核心开启档案领域的新工作,改变此前参与有限的被动状态。

3.2 探索数字环境中的档案领域转型

在互联网的驱动下,人类社会正面临数字转型带来的社会、文化、技术挑战,从社交媒体入手,探索在开放、互动、动态、异构化、参与的环境中如何重塑数字文件形成、保存与开发利用流程,档案领域管理对象、管理主体、管理方式等核心要素如何变化。具体来说,在社交媒体归档过程中,涉及归档范围与标准、捕获方式与技术、归档信息整合、归档信息长期保存与可信性维护,以及归档信息资源智能开发与利用等问题,这些问题的探讨本质上就是在新的数字环境中推动档案理论、方法论以及实践的创新。

3.3 形成系列实践成果

一方面,通过归档行动保管一定数量的社交媒体信息,为社会、组织与个人留存开展活动的证据与记忆材料,形成具有丰富价值的信息资源库;另一方面,由此形成的一系列政策、指南与经验报告,都可为后续的社交媒体归档行动乃至其他国家地区的实践提供借鉴。例如,NARA基于十数个联邦机构的社交媒体归档实践经验所发布的《社交媒体白皮书》,从政策、方法、工具与注意事项上提供了诸多可借鉴之处。

4 审视与展望:问题与走向

尽管全球的社交媒体归档有一定成果,但在对象、方式、主体,或是人文、管理与技术层面都还存在很多不确定性,归结起来就是谁来管、管什么、怎么管以及如何落实这些构想的问题。

4.1 捕获对象的明晰

确定社交媒体归档收集范围前,要明确两个问题:第一,关于政府类社交媒体信息的互动类信息中,完整性如何界定,一份主体信息下的评论是否是完整信息的一部分?英国国家档案馆并不捕获用户评论;然而,不少机构或学者如澳大利亚国家档案馆认为互动类信息应当考虑归档。另一方面,如果考虑归档互动类信息,那么哪些要捕获、有什么标准,是根据内容质量、主题还是形成者来判定?

第二,关于政府类社交媒体以外的其他组织、社区、个人等形成的信息。社交媒体为人类提供了即时记录生活与工作的平台,形成的是许多有价值的信息资源和反映人类社会的证据与记忆材料,有着归档的必要性。那么,这些信息由谁归档、政府是否有权归档、如何归档、如何管理?

4.2 机制的系统化构建

行动的落实在很大程度上需要系统机制的保障。当前,社交媒体归档相关制度并不完善,法律、标准、政策、指南等的缺失现象较为严重,很多问题没有妥善的预案予以解决,甚至无指导性的意见。即便是较早出台社交媒体指南的NARA,在很多归档问题上并无定论。例如,在保管期限的设定上,NARA建议在现有保管期限表中查得的部分则依据现有规定,未能查得的部分则先设为永久,待新规定出台后再重新设定[7]。

因此,为深入指导未来的社交媒体归档,需要建立系统的机制予以保障,主要包括:统筹全局的顶层设计,从战略层面定位社交媒体归档的目标与其主要构件;社交媒体归档的行动计划,指导实现目标的实施路径,基于目标设定分目标,在每个分目标下分配所需行动及行动时间;配套相应的实施性指南,提供每个行动的指南和标准,从而保证每个管理流程有明确的制度可参照执行,包括收集范围设计、捕获、分类、保管期限设定、整合等一系列环节。

4.3 协同参与的全方位落地

社交媒体归档往往要求不同主体协同合作完成,档案馆、图书馆、信息组织等记忆机构的协作,公众的参与,社交媒体服务提供商的支持等都是协同合作的方式,因此社交媒体归档项目受任务量和复杂性的不同需要不同相关利益者的参与。社交媒体的信息往往是在开放与互动中形成,且是在形成主体之外的第三方平台上,这些信息的归属权、管理权、处置权以及利用权都涉及不同的相关利益者。另外,这些信息的数量巨大,单独某一类主体难以独立完成归档及归档之后的长期保管与开发。因此,协同合作的参与模式理论上较为契合社交媒体归档需要。

然而,这种参与还需从理论设想到实践中落地。目前,众包在美国、英国、荷兰等国对数字化资源的鉴定与著录都有诸多实践,但对数字原生信息的管理贡献有限。从技术、管理、司法、人文等方面实现大众参与尚有难度,例如,技术上如何实现群体的协同工作、管理上如何分配不同参与人员的权限与职责、司法上如何保障相关利益者的权益、人文上如何保证参与人员的社会性需求等。

4.4 技术的配套升级

社交媒体无论是信息的捕获、有序整合还是技术鉴定都与技术息息相关,技术是将行动落实于实践中的必然载体,也是当前社交媒体归档要攻克的主要方向。

当前,技术层面的问题主要涉及捕获、整理以及开发利用。例如,在英国比较主流的方法是通过公共可获取的API捕获社交媒体信息,实现对内容的精确裁剪,以满足版权限制与用户利用需求,并可连同元数据一同捕获。但这些方法对Facebook却不那么适用,英国国家档案馆至今无法归档其中央政府在Facebook上发布的信息。且一旦归档范围要包含用户评论,现有的捕获工具又会面临自动化升级的挑战。而这些信息的捕获只是归档的第一步,归档要求的有序化组织信息意味着如何通过技术将信息整合,海量的半结构化信息的组织与语义挖掘则又是另一个技术难题,这也就是为什么国会图书馆在接收了千亿条的信息后并不能提供这些信息的利用,原因就在于海量信息的整合存在困难。

4.5 长久保存问题的衔接

在前端控制与全程管理的框架中,归档不是孤立的,还要为后续环节提供支持。作为过程性环节,它涉及收集、鉴定、整理等,鉴定为归档选定了对象,保管期限设定、分类方案等使信息得以有序化。而此后的长期保管、利用等都是以归档时形成的信息体系为基础,无论是保管上的具体要求还是利用环节的管理,都将以归档时的分类体系或是背景信息作为参考。

因而,社交媒体归档要在前端设计好归档方案,在设计捕获工具、捕获对象、捕获内容、捕获方式、整合原则时考虑未来的长期保管和开发利用中可能面临的需求和问题,从而在前端奠定管理流程中无缝链接的基础。

5 结语

总而言之,社交媒体归档还有长远的探索路途,这为文件、档案、信息等领域提供了极大的研究与实践空间,有待各国与地区采取更多行动。当前全球的社交媒体归档已有一定成效,但还需进一步明晰管理要素、分辨面临的挑战和走向,从人文与技术层面构建优化管理体系。

注释与参考文献:

[1]Josh Gerstein. Feds stalled plan to vet visa applicants through social media[EB/OL]. [2016-03-09].http://www.politico.com/blogs/underthe-radar/2015/12/feds-considered-vettingvisa-applicants-on-social-media-216899.

[2][7]National Archives and Records Administration. Bulletin 2014-12: Guidance on Managing Social Media[DB/OL]. [2016-09-09].http://www.archives.gov/records-mgmt/bulletins/2014/2014-02.html.

[3]National Archives and Records Administration. National Archives and Records Administration White Paper on Best Practices for the Capture of Social Media Records[DB/OL].[2016-09-09].http://www.archives.gov/recordsmgmt/resources/socialmediacapture.pdf.

[4]Erin Allen. Update on the Twitter Archive at the Library of Congress[EB/OL]. [2016-09-09]. http://blogs.loc.gov/loc/2013/01/updateon-the-Twitter-archive-at-the-library-ofcongress/.

[5]NAA. Records management issues to consider when using social media tools [EB/OL].[2016-09-09].http://www.naa.gov.au/recordsmanagement/agency/digital/socialmedia/index.aspx.

[6]Kalev Leetaru. How Much Of The Internet Does The Wayback Machine Really Archive?[EB/OL]. [2016-09-09].

[7]http://www.forbes.com/sites/kalevleetaru/2015/11/16/how-much-of-theinternet-does-the-wayback-machine-reallyarchive/#2715e4857a0b4edc16de88d4.

猜你喜欢

社交机构信息
社交牛人症该怎么治
聪明人 往往很少社交
社交距离
你回避社交,真不是因为内向
订阅信息
一周机构净增(减)仓股前20名
一周机构净增(减)仓股前20名
一周机构净增仓股前20名
一周机构净减仓股前20名
展会信息