我国网络空间中档案领域的缺位审视和参与展望
2019-09-10周文泓
周文泓
摘要:通过对社交媒体信息保存行动的调查,文章借助各类案例来解析档案领域未来可参与的空间。据调查,当前档案界对社交媒体信息保管的参与有限,正面临失却先发契机、错失发展资源、弱化档案话语权的危机。同时,由于社交媒体乃至互联网信息保管的复杂性,档案领域依旧拥有参与的巨大空间:为匹配庞杂社交媒体信息保管补充资源、为缓解信息边界难分引发的主体矛盾贡献方法、为显性化构建社交媒体作为档案库整体的关联提供思路、为多元保管方式融合汇聚焦点、为共推保管能力综合建设指引升级方向。
关键词:社交媒体;网络空间;网络归档;信息保管
分类号:G206;G203
Absence Review and Participation Prospect of the Archival Field in Cyberspace in China
——Based on Social Media Information Preservation Actions
Zhou Wenhong
(School of Public Administration of Sichuan University, Chengdu,Sichuan, 610064)
Abstract:By investigating the action of social media information preservation, the article analyzes the participation space of archival field in future with various cases.According to the investigation,archive field limitedly participates in social media information preservation currently.It is facing the crisis of losing the first opportunity,missing the development resources and weakening discourse power of archives.Meanwhile,due to the complexity of the social media and Internet information preservation,the archive filed still have a huge space for participation:supplement resources for matching complicated social media information custody,contribute method for alleviating subject contraction resulted from vague information boundary,presenting ideas for dominant construction of social media as a whole association of archives,providing focus for integration of multivariate custody methods,and offering upgrading direction for comprehensive construction of custody ability.
Keywords:Social Media; Cyberspace; Web Archiving; Information Preservation
1背景:社交媒体信息保管呈现互联网多方契机与挑战
2019年4月19日,以新浪微博为主体产生的2000多亿公开博文与5000亿互动纳入国家图书馆互联网信息保管项目,引发社会关于国家数字记忆的热议。然而,依据所发布的消息,档案领域未显性参与其中,这向档案学界发出警示:是否失却了“互联网+”背景下全面开拓领域的契机,在当下着力建设档案安全与利用体系时是否有必要向互联网原生数字信息拓展,是否有什么补救措施,在未来可否有更多作为?所幸,互联网信息保管实践从风险视角对我国档案领域在数字空间的延续发出危机预警的同时,社交媒体信息保管的复杂性依旧为保有参与甚至主导机遇提供可能。政务社交媒体信息的档案化管理、同国家图书馆性质类似的涵盖范围更广的社交媒体保管项目等大大小小的实践在各国与地区均有所体现。然而,法律法规、政策制度、收集方案、长久保管策略、技术工具、利益机制等多方面仍存难解之题。
理论层面,社交媒体信息保管已非档案领域新论题。首先,围绕社交媒体信息保管从证据、信息、资产、资源、记忆等多维度明晰其必要性[1];其次,管理特点与挑战如制度不充分、信息量大、技术环境复杂等得到明确[2][3];再次,组织架构、制度规范、技术工具等相关应对策略不断提出,如政府机构、档案机构以及社交媒体平台等多元主体参与机制、社会化记忆机构联盟、优化归档政策、API或爬虫工具的开发等得到倡导[4][5][6][7]。此前研究多处于将档案机构设定为资源主导主体与档案管理方法占据主流的前提下,同档案机构参与有限的现状并不一致,有待对照我国现实展开理论探索。
由此,文章基于我国现有的社交媒体信息保管相关实践,从意识、能力、行动及结果等方面对档案领域的参与予以审视,同时亦结合国内外实践面临的挑战,解析档案领域的参与点及其不可或缺的优势维度,以期档案领域同社交媒体乃至网络空间形成更加优化的双向建构机制。
2缺位表象:社交媒體信息保管中的滞后性有限行动
我国社交媒体信息保管实践表现为:(1)长久以来由各平台自主行动,依托平台制度与功能呈现,各平台均有一定的信息保管制度、技术配置和用户端信息保管模块,涵盖形成、修改、收集和整合、存储、删除、利用、保护、中止或终止服务时的信息处理等环节。例如,微信数据得到腾讯公司尽其商业上的合理努力保障在本软件及服务中的数据存储安全[8]。(2)随着网络空间治理上升至国家战略高度,有序化的信息形成、传播、存取亦通过法律法规与规章制度得到一定程度的规范,包括《网络安全法》《互联网个人信息安全保护指南》《微博客信息服务管理规定》等,对网络信息尤其个人信息的边界及其形成、收集、存储、利用等一系列管理环节尤其是安全保管提供指导[9]。(3)图书馆从国家数字记忆高度启动互联网信息保管项目并以新浪为首个基地,将社交媒体信息保管的覆盖面、社会化程度与价值均提升至新高度。从已发布的信息可发现:整体目标是对互联网重要内容的社会化保管与利用;项目处于起步阶段,社交媒体是当下重要代表,未来将有一系列社交媒体平台加入;信息保管范围与保障资源将得到从国家到社会的多方支持[10]。(4)政务类社交媒体信息归档管理亦在近年来纳入档案事业规划中,档案事业“十三五”规划把社交媒体归档管理方法列为核心任务之一[11]。现有制度具有关联的是《信息和文献WARC文件格式》(GB/T 33994-2017)、《政务网站网页归档指南》(征求意见稿)、《政务服务事项电子文件归档规范》(征求意见稿)[12],具体行动方面则没有公开信息表明有相关档案化实践。
对比已有实践可发现,档案话语和方法在社交媒体乃至网络空间的显示有限。一方面,档案领域的参与程度不足,行动远落后于其他领域,尚待形成制度以落实于实践,网络空间档案化管理的意识与能力未在档案机构中得到充分构建。在社交媒体平台以及更广阔的网络空间中,档案机构实践极为不足,面临失却拓展与升级实践领域机遇的窘境。另一方面,即使不以档案机构或档案专家的参与作为论定指标,档案话语与方法亦没有在其他主体的实践中体现,除了互联网信息保管项目在启动阶段以图书馆为主导以外,平台协议或法律法规、政策规范的论述中均缺少档案核心术语,可对照的管理环节关联度不高,例如信息保护在制度中更偏向于最短保管时间以防不当利用,管理环节上价值鉴定与长期保管鲜有提及。
3缺位挑战:网络空间档案化先发契机、资源、话语权的陷落
互联网已被视作权力与规则重构、思维革命、社会组织数字转型乃至从哲学层面触发世界的认识与作用方式变革的重要空间,档案领域无论是主动还是被动都将在场景、主体、对象、方式、方法上面临重构。互联网信息保管项目作为面向未来的行动集合并非反映网络空间中档案领域缺席的孤立事件,社交媒体第二代网络的典型代表是网络空间最为关键的组成之一,社交媒体信息保管映射的是“互联网+”背景下数字技术为人类信息管理拓展出的尚需理论与方法创新并亟待实践入口及其延伸出的广阔领域,未能及时参与很大程度意味着我国档案领域错失参与建构网络空间档案化的诸多机遇,亦影响到理论研究、学科发展、人才培养乃至整体事业的优化升级等。在现阶段,主要体现为:
3.1错失数字空间中的先发契机
相较于此前第一代网络作为实体世界的附属以静态形式呈现与辅助实体世界的信息存取,社交媒体所引领的第二代网络根本性地建构出同实体世界并驾齐驱且相互关联的数字空间。社交媒体等主流网络应用形成了大量原生数字记录,这些信息有着多元的数字与社会特点,绝不可能照搬已有实践经验来实现良好治理,这为参与管理的主体提供在探索中实现理论、方法与实践数字转型的机遇。对照现实,在没有任何框架明确管理主体边界的“蛮荒期”,档案领域尤其是档案部门在新浪网保管项目中未能及时获得主导或是参与资格,不仅是丢失某个社交媒体平台,而且预示着后续的一系列互联网信息保管项目均存在无法深度参与的风险,先发契机的丢失进一步表现为未能利用以社交媒体平台为代表的数字空间的建构红利来拓展自身职能、范畴、意识、文化、能力、方法等。
3.2遗落数字空间中的发展资源
社交媒体平台推动的是各类组织、机构、群体乃至个人的数字转型,转型进程中既可能是升级拓展,亦可能是边缘化甚至消失,这很大程度上同获取的资源密切关联。对档案部门而言,两大类资源是关键:一是信息对象,即足够价值量的信息需档案化管理;二是管理活动所需的保障性资源包括人财物等,这类资源既同信息对象数量与质量相关,也和管理活动的价值关联。在未能及时参加社交媒体这一极具战略价值的信息资源库保管项目的情况下,档案部门缺乏数字档案资源中极为重要的组成。在第一代网络时期,信息记录形成主体主要是党政机构与主流社会组织,档案部门已具有较充分的资源,然而以社交媒体为代表的第二代网络提供了社会化的情境、平台和工具,社会大众、群体以及小型机构反而成了主要的信息形成者,如果无法拓展管理范围,那么从比例与价值上是信息对象资源的倒退。未能参与“国家数字记忆”这一战略性行动使得檔案部门缺少了扩充的动力,直接影响档案领域整体的可持续发展。
3.3弱化数字空间中的信息、档案管理话语权
在以社交媒体为代表的互联网信息的归档管理中,档案部门的参与有限,即便是政府所形成的信息都处于缓慢进程中,拓展至社会的那部分则更无涉猎。一方面,社交媒体信息由谁管理并无严格限定,未来数字空间中由互联网所形成的那部分信息的管理规则及其解释很大程度上都将依托于这个大型项目的实践成果。因而,未能及时参与和引领此类项目很大程度上使档案领域缺失了制定与解释规则的权利,那么在由谁主导、制定与实施具体方案等方面档案领域难以获得主动权。另一方面,不仅在信息管理范畴,且在档案管理方面都可能失却部分主导权。无论是首期新浪项目还是整体互联网信息保管项目,所保管信息很大一部分实质上可认定为档案。这些档案如何管理或将选择怎样的管理方法与模式将难以由档案领域确认,由此引发的是这些信息档案化管理的理论框架、方法、原则、模型以及具体路径均有从其他领域进行重构与解释的可能,档案地位随之弱化。
4生存之机:复杂社交媒体信息保管呈现的参与空间
能为档案领域提供后发参与甚至主导的空间究竟是什么?可从两方面分析:一是从学界到业界均在倡议并逐渐纳入发展进程的社会化保管建构目标,他们在构想层面达成一定共识,或是由信息、文化或记忆机构统一保管,或是在这些机构的指导下由形成者、平台、第三方社会机构协同保管;二是社交媒体信息保管在全球范围内已有前沿实践,较具代表性的有美国联邦政府社交媒体文件管理、美国国会图书馆Twitter档案项目、英国国家档案馆政府社交媒体档案库、旨在保管互联网记忆的Internet Archive平台、以记录社交媒体平台重大事件为重点的DocNow网站、提供存档功能的Facebook,这些实践在互联网全球化框架下显示社交媒体信息保管共性的重难点问题,对我国亦较具参照价值。
社会化保管构想与现有实践呈现的问题与挑战诸多,由此为档案领域提供了贡献空间:
4.1充实资源——匹配庞杂社交媒体信息保管要求
社交媒体信息受其碎片化、傳播速度、主体数量等特性所影响,规模已远超此前模拟环境中人类数千年来累积的信息总量,人类通过档案馆、图书馆、博物馆等在管理历史信息资源时尚因诸多条件限制而不时出现古籍丢失、损毁等新闻,那么社交媒体信息保管问题将更加突出。
面对庞杂的社交媒体信息,一方面,软硬件基础设施(即信息保管所需的存储与运行设备、管理系统、开放平台等)缺一不可,且需不定期升级更换。另一方面,信息的收集、整理、开发、利用以及日常运营涉及诸多事务,需要大量技术、法务、人文、管理等不同专长的人才。因而,在以构筑整体网络资源为目标的情况下,社交媒体信息保管行动绝非某类机构可独立开展。以美国国会图书馆为例,其对2006年至2010年的Twitter文本进行全部收集,而后宣布从2017年12月31日起转而有选择地收集,收集范围调整的一个重要原因是难以配备充足的基础设施,当前一个检索任务需要24个小时才能完成,除非能投入成千上万台服务器。
这从资源协同的维度为档案领域提供契机。档案机构作为有着悠久历史的公共文化单位与记忆主体,负有保存文化遗产的职能,亦有相应资源支撑其可持续运行与拓展。档案领域尤其是管理类主体如档案部门作为专业权威载体,有足够经验和实体资源参与到社交媒体信息的协同保管中来。
4.2贡献方法——缓解信息边界难分引发的主体矛盾
社交媒体在主体层面有两大特点:一是内容生产者与消费者互通互换,并同提供网络服务的平台形成多边信息消费场景,用户既通过平台消费平台或其他用户的信息,同时也贡献信息,平台作为服务提供者亦对信息有相关权益;二是完整映射主体或活动的整体信息往往由不同主体共同形成,例如就某个用户发布的信息而言,评论、转发、点赞等是其不可或缺的构件,集成信息的过程必然需要关联到更多信息及其形成者与利用者。
因而,为保证完整性就必须将不同主体形成的有关联的信息同时收集,如何将这些信息纳入保管项目并提供利用则面临主体利益与取向冲突。一方面,从形成者、保管者以及利用者之间的关系来看,信息权属与隐私的界定和保障困难重重。已有实践均将用户发布的公开信息纳入保管的潜在范畴,那么法理上将个人或私人机构所形成信息捕获至公共机构并提供利用是否侵犯其信息资产,且一旦提供利用是否会违反形成者的意愿或造成伦理风险?另一方面,共同形成者机制下缓解不同形成者的权益与取向冲突则更为复杂,需从伦理上明晰人与信息的利益边界,更要从法理层面确定形成者与信息的权属规则,例如信息所有权与管理权在共同形成者的情境下如何规制。
档案领域可提供方法参考:一方面,开放与隐私鉴定是文件、档案管理的工作内容,相关经验与方法可以贡献其中。另一方面,文件、档案管理围绕形成者、保管者、用户开展工作,面向不同利益相关者形成管理机制,已有模式与规则可提供参照。此外,档案领域亦在网络背景下探索理论与方法升级,实践经验在适应性优化基础上可为社交媒体信息保管提供方法帮助。
4.3提供思路——显性化构建社交媒体作为档案库整体的关联
社交媒体信息保管是对信息内容、背景、形式等要素的总体行动,从宏观到微观都是以叠加和关联形态呈现。微观层,即使一条记录,也可能与其他记录关联,例如围绕某个主体、某类事件产生关系。宏观层,社会组织、机构、个人在社交媒体平台开展社会活动的同时也依托社会网络产生信息互动,他们以各自形成的信息构筑档案空间,在此基础上,相互连接和叠加成更大的档案空间。社交媒体平台要作为整体关联的档案库得以持续运行,且纳入保管项目也需维护此特质,以便最大程度还原社交媒体信息所记录下的多元场景、主体、活动以及相互联系。
因而,社交媒体信息的形成与传播机制在网络化情境得以构建,随之在信息捕获、整合、开发与利用中都要维护处于形成与传播中的海量复杂关联。这些关联往往隐性嵌入信息对象及其元数据中,需借用技术结合人工分析共同将其完整显性化。一方面,捕获需配置方案以明确社交媒体信息中有哪些关联(如社交、内容、时间、地点、活动等),明确有哪些关联具有意义,且能够与应当先捕获哪些关联;另一方面,在面向利用的整合过程中,需进一步补全与提炼关联。然而,这些关联的捕获与呈现需制定并动态升级规则与技术方案,基础设施、技术、专业人员与方法均要全面升级。例如,Internet Archive只能依据平台或时间提供检索结果,难以提供某个主体或某个事件的全貌。
档案领域的方法与实践经验可提供解决思路,更加深人们对社交媒体平台作为信息库的形成机制的理解,最大限度还原其内涵与价值;同时,档案领域的长久实践对明晰、解析与显性化信息与信息内部构件以及信息库整体的关联有一定方法与路径,对贯通全程的有序化工作和维护真实性、完整性与有效性,以有机关联为重要对象均可提供更完备的整体保管策略。
4.4汇聚焦点——助力多元保管方式融合
社交媒体信息保管有赖多元主体协作成为共识。现有实践可发现社交媒体网络服务提供商、形成者、记忆机构、第三方社会机构等均有所参与,但在数字记忆与遗忘的博弈平衡中面临保管什么、谁来保管、如何保管、保管的信息如何利用等缺乏明确方案的问题。
各保管主体因立场、目标、意识、能力、方法、资源存在差异极易产生冲突,致使实践在机制与行动层就陷入无法兼顾各方利益的困境。以Facebook为例,它向社会开放接口供开发使用部分信息,导致技术公司剑桥分析通过10多万用户信息关联捕获到8000多万相关用户的信息用于美国总统竞选,这在信息所有权、管理权、利用权以及隐私等方面招致用户、社会以及国家权力机关的声讨。另以英国国家档案馆的社交媒体档案库为例,Twitter同YouTube的信息得以捕获,Facebook由于平台技术配置无法捕获而导致政府社交媒体信息完整性受损。
档案领域同样为融合各有差异的保管方式提供空间,即各保管方式中体现的档案化理念、方法与目标,它是各保管方式应当与能够相兼容协同的聚合点。诸多实践都可看出将保管信息视作档案,如美国国会图书馆Twitter档案项目、Internet Archive就是以存档为目标进行信息保管;尽管不是所有信息都可严格界定为档案,但档案管理方法体现于整体管理中,例如Internet Archive所应用的Archive It工具在捕获方面同档案管理要求相契合,在NARA的认可下用于前任总统奥巴马的社交媒体档案项目;社交媒体信息的长久保管亦同档案管理目标相一致,即使是社交媒体平台如Facebook、Twitter亦是认识到它的商业与社会价值,或是采用冷保存等方法尽量保证全体信息的持续存储,或是同时向记忆机构提供部分备份。这些实践均有档案管理痕迹,可以档案化为支点梳理各保管方式的异同,在有限档案化升级为贯通式深度档案化的过程中完善不同保管方式的定位、协同点和相协作功能。
4.5升级方向——共推保管能力综合建设
社交媒体信息保管不仅在上述的资源保障、主体机制、对象构建、方式协同方面挑战重重,更在解决方案的落地上面临可行性问题,即是否有充分技术、平台、系统、工具等确保具体设想在数字空间中得以实现。社交媒体信息保管难度在于要素各有阻碍而综合之后构成更加难以清晰条理的复杂整体。同时,对档案领域而言,在社会与数字转型背景下,机构改革后的发展困局、数据冲击中的范畴界定、数字技术发展的应用迷思、社会互动结构变换下的方法与流程困惑等在挑战中提供发展方向与机遇,社交媒体信息保管是极为适合的试验田,而档案领域也能依此贡献以满足社交媒体信息真实保管与合规合理资源式开发的两大目标。
由此,生存之战中,档案领域能够也应当有充分意识与行动在以社交媒体为代表的网络空间档案化管理中明晰自我定位、功能、发展方向与具体策略,从而在相互建构的驱动下形成动态持续的优化机制。由此,在双向互通机制下,社交媒体提供空间推动档案领域实现升级式自我建构,档案领域亦在参与中推进社交媒体乃至整体网络空间的有效信息保管,从而实现人类世界档案化保管能力的综合建设。
5结语
总而言之,生存之战已打响,社交媒体与其所代表的网络空间是同实体世界并驾齐驱的存在,更是宝藏同危机并存的新大陆。现有实践中档案领域稍显落后,具体表现为先发契机、资源与话语权受限,但社交媒体信息保管的复杂性为其提供了广阔的参与空间。本文仅从资源、主体、对象、方式、复杂整体的角度进行初步论证,有待更加完备的理论构想与实证研究,亦需明晰档案领域参与社交媒体甚至网络空间保管的思路。
*本文系国家社会科学基金青年项目“基于多元数字技术的网络空间参与式归档研究”(项目编号: 18CTQ037)阶段性研究成果。
注释与参考文献
[1]万凯莉.美国Twitter存档项目对我国社交媒体信息归档的启示[J].浙江档案,2014(5):8-11.
[2]WILEY J.The Onslaught of Big Data and the Information Governance Imperative Information Governance for Social Media[M]//ROBERT F.Smallwood.Information Governance: Concepts, Strategies, and Best Practices. New York City:Wiley,2014:1-22.
[3]BUSHEY J.Convergence, Connectivity, Ephemeral and Performed: New Characteristics of Digital Photographs[J].Archives & Manuscripts,2014(1):33-47.
[4]宋香蕾.政務微博档案化模式研究[J].档案学研究,2017(1):51-56.
[5]HOCKX-YU H.Archiving Social Media in the Context of Non-print Legal Deposit[EB/OL].[2019-04-19].http://library.ifla.org/999/.
[6]高晨翔,黄新荣.我国社交媒体文件的归档政策研究[J].图书馆学研究,2017(7):47-55.
[7]NARA. National Archives and Records Administration White Paper on Best Practices for the Capture of Social Media Records[EB/OL].[2019-04-19].http://www.archives. gov/records-mgmt/resources/socialmediacapture.pdf.
[8]腾讯网.腾讯服务协议[EB/OL].[2019-04-19].http://www.qq.com/contract.shtml.
[9]国家互联网信息办公室.政策法规[EB/OL].[2019-04-19].http://www.cac.gov. cn/xzfg.htm.
[10]新浪科技.国家图书馆首个互联网信息战略保存基地落户新浪[EB/OL].[2019-04-19].https://tech.sina.com.cn/i/2019-04-19/doc-ihvhiqax3936874.shtml.
[11]国家档案局.全国档案事业发展“十三五”规划纲要[EB/OL].[2019-04-19]. http://www.saac.gov.cn/news/2016-04/07/content_136280.htm.
[12]国家档案局.国家档案局办公室关于征求《政务服务事项电子文件归档规范》等6项档案行业标准项目意见的通知[EB/OL].[2019-04-19].http://www.saac.gov.cn/ daj/tzgg/201903/5e26a638415c490a92f6ce50636dba2b.shtml.