社交媒体政务文件长期保存的鉴定要素与内容分析
2022-11-22农颜清苏州大学社会学院
农颜清 周 毅/苏州大学社会学院
关键字:社交媒体;政务文件;长期保存;鉴定
1 问题的提出
互联网时代,以“三微一端”为代表的社交媒体平台与日俱增,其因为传播成本低、速度快、受众范围广等特点而被政府部门广泛应用于电子政务工程建设。截至2020年12月,全国31个省份开通共计近17万个社交媒体账号,在账户持续增长与运营中产生了海量社交媒体政务文件[1]。社交媒体平台已然成为政府部门管理和服务的新阵地,政府部门在社交媒体上创建、发布、传播与利用的文件,是政府相关部门通过网络开展相关活动的最真实记录,具有重要的凭证价值和科学研究价值,理应进行长期保存。2019年1月1日起施行的《机关档案管理规定》明确指出机关档案应包括业务数据、公务电子邮件、网页信息、社交媒体档案。在针对公众的某次调查中,89.45%的受调查者认为政府社交媒体文件需要进行归档保存[2]。
政府部门社交媒体文件属于电子文件但又有自身特点,其鉴定要求和鉴定方法都需要针对其特点制定。目前学界已就社交媒体文件进行长期保存的动因、政策制定、文件归档各阶段方式方法等主题展开探索与实践,形成了较为规范系统的社交媒体政务文件保存经验。从社交媒体政务文件具体内容来看,不同的社交媒体平台之间以及社交媒体平台与其他平台如官网、App、OA办公系统等所采集的政务文件内容存在较多重复性或关联性;从长期保存价值来看,社交媒体政务文件具有凭证价值和记忆价值[3]。学界就如何通过保管时间与保管方式等来固化社交媒体政务文件长期保存鉴定结果、促进信息长期保存等,开展了政策与实务研究。学者们首先从多个视角介绍与分析国内外相关政策[4-6],就如何构建我国社交媒体文件长期保存的政策体系提出意见[7][8];在操作实务层面的研究中,学界目前的研究重点集中于采集[9][10]、归档[11][12]、整理[13][14]、鉴定阶段[15]等业务流程的实施方法及其所使用的工具,同时也通过对国外相关实践项目的评介来推广工作经验。
由此可见,在宏观层面上我国目前还缺乏社交媒体政务文件鉴定方面的系统性总结,在微观层面上主要集中对社交媒体政务文件的采集、归档、整理等问题展开研究,对鉴定环节的探讨相对较少。鉴定是对归档文件去粗取精,优先保管有保存价值的文件并使其发挥更大的作用,以满足社会需要的过程[16]。鉴定工作在整个社交媒体政务文件的长期保存中处于首要和关键性环节[17],同时也是社交媒体政务文件长期保存工作中难度最大且争议最大的环节。本文就社交媒体政务文件长期保存的鉴定展开研究,主要解决由谁鉴定、如何鉴定以及鉴定什么等问题。
2 社交媒体政务文件长期保存的要素及内容
政府部门通过社交媒体平台抢占舆论阵地、实现政务公开、提升政务信息的辐射力、更好地服务群众、推进政民互动并化解矛盾,是政府社会管理和公共服务职能的内在构成要素[18]。但在大数据环境下,社交媒体政务文件类繁多、数据量大,载体无形化,具有原创性、时效性、易衰减、易消逝等特点,要想从中筛选鉴定出具有长期保存价值的社交媒体文件,显然面临着具大的挑战。鉴定理论是档案学的基础理论。自20世纪八九十年代以来, 档案鉴定理论已经成为档案学领域中讨论焦点,鉴定对象也经历着从纸质文件到电子文件等的变化,鉴定方法与技术也在不断丰富与更新,有关理论研究也取得了一系列成果。文件处理部门、机关企事业单位档案室、档案馆等都是实施档案鉴定的主体,并且在鉴定过程中承担着各有侧重的任务。面对社交媒体政务文件,档案馆理应有更大作为。为使鉴定工作更好地适应数据环境,档案馆应在已有经验、技术条件下组织实施社交媒体政务文件鉴定过程,以档案保管期限表为依据建立长期保存鉴定标准。在鉴定过程中可通过智能化鉴定法和人工鉴定法对文件的内容和技术等进行鉴定。
2.1 鉴定主体
随着互联网技术的快速发展,为了保存网络上的“社会记忆”,近年来已有许多国家展开多样的项目实践。国外的有英国政府网络存档项目、在线社交媒体档案项目、ARCOMEM项目,国内的有中国 Web 信息博物馆、网络信息资源保存项目等。开展以上项目的主体种类较多,涉及图书馆、档案馆、高校及相关科研机构,每个行动主体选择保存社交媒体政务文件的内容、保存方式各有不同,也呈现出各式各样的鉴定标准,这就导致社交媒体政务文件保存质量不高,也不利于社会记忆的完整构建,因此有必要统一鉴定机构,并形成具有指导作用的信息资源鉴定标准。
在社交媒体政务文件长期保存鉴定中,应始终坚持以档案馆鉴定为主,主要原因如下。第一,这是由档案部门职责所决定的。档案馆是存档管档的中心,社交媒体政务文件经过采集、鉴定和归档后即成为档案,这个过程事实上就是档案馆赋予社交媒体政务文件具有可采信的法律证据价值的过程。第二,档案部门在鉴定工作中具有独特优势和丰富经验。档案馆一直承担着档案价值鉴定、到期鉴定工作,在鉴定工作中有着成熟的经验和独到的方法技巧。大数据时代,档案馆在不断提高自身能力,以适应时代发展变化,并快速将其工作对象由纸质档案转向电子文件[19],它对社交媒体政务文件的鉴定能力也将会逐步提高。第三,国家政策的支持。《档案法》第三章第二十一条规定“鉴定档案保存价值的原则、保管期限的标准以及销毁档案的程序和办法,由国家档案主管部门制定”。此外,2018年国务院发布《进一步深化“互联网+政务服务”推进政务服务“一网、一门、一次”改革实施方案》和《关于加快推进全国一体化在线政务服务平台建设的指导意见》等文件,明确将档案工作纳入“互联网+政务服务”,同时也明确了档案部门职责。这有利于档案部门加深对我国社交媒体上电子政务发展进程的了解,更好地分析产生和形成政务文件单位的职能活动、事件、任务,从而对社交媒体政务文件的价值做出“确定性判断”[20],实现高质量的资源保存和社会利用,延长社会记忆的长度。
还应以用户参与鉴定为辅。在数字环境下,社交媒体政务文件鉴定团队应由多学科人才组成,以便吸纳和利用各方利益相关者的建议及资源[21],提高鉴定工作的合理性和科学性。近年来,引导、吸引公民参与档案工作的实践并不少见。荷兰阿姆斯特丹档案馆开展“Velehanden”活动,通过积分兑换礼物的方式吸引网民通过网站参与档案的转录、著录、贴标签、建立索引等。英国国家档案馆在开展ARCOMEM项目的采集工作前,通过社交媒体收集公民意见,最终建立一个反映集体记忆、社会感知的社交网络数字档案馆[22]。吸引用户参与社交媒体政务文件鉴定,借助民众智慧挑选出最具保存价值的文件并制定最佳的保存策略。这无疑是既能减少档案部门鉴定工作量、降低鉴定成本,又能提高鉴定工作质量的有效举措,有利于进一步推动数字时代社交媒体政务文件鉴定工作的良性发展。
2.2 鉴定对象
我国政府机构在各类社交媒体平台上发布了大量社交媒体政务文件,由档案馆自行从平台接口自行鉴定显然不现实。较为合理的方式是由业务部门采集本部门需要鉴定保存的社交媒体政务文件,再移交至档案馆进行鉴定。由业务部门采集,有助于确保文件来源的合法性和可信度。
业务部门在采集信息过程中,应在优先采集与本部门职责相关的原生性形态社交媒体政务文件基础上,考虑次生性形态社交媒体政务文件。原生性形态社交媒体政务文件是政府行政活动过程中产生的源信息,通常表现为通知、公告、手册、指南和相关的政务数据,其最为重要的特点是仅采集政府发布的文件,不包括用户参与的评论、留言等内容。次生性形态的政府社交媒体文件为政府和网民互动所产生的信息,通常表现为补充性说明、支撑性材料、网民评论、公众意见和建议。在某些社交媒体政务文件下,用户所发表的评论、留言对于机构政务活动的记忆和研究具有重要意义,对政府决策也具有重要的参考价值。
2.3 鉴定方法
对社交媒体政务文件进行鉴定,有智能鉴定法和人工鉴定法两种。智能鉴定法是较为理想的鉴定方法,档案工作者要紧紧抓住契机,通过不断的探索和研究,使鉴定工作真正地实现智能化。2019年政府工作报告指出,要坚持创新引领发展,培育壮大新动能,拓展“智能+”。随着人工智能技术愈加成熟,人工智能技术的应用范围将不断扩大,政府部门也主动在社交平台上开设账号,服务公民。由于发展时间较短、经验不足,同时存在各社交媒体账号之间的定位不清等问题,出现了一个部门在一个社交媒体平台上有多个账号,以及同一份文件内容在多个平台和账号发布的情况,这给档案部门的鉴定工作带来了困难。面对海量的社交媒体政务文件,智能鉴定法是最为理想的鉴定方法。国家安全监督管理总局档案馆研发的“机关文书档案保管期限智能识别系统”已成功应用于其档案数据信息交互平台,实现了智能化判定档案保管期限的功能。智能鉴定方法主要通过应用机器学习、专家知识系统等手段,实现社交媒体政务文件的鉴定自动化,这不仅有利于提高鉴定速度和效率,而且可以减少因主观意识产生的判断误差。该鉴定方法适用于批量文件的鉴定,可在社交媒体政务文件归档鉴定、进馆鉴定时运用。
人工鉴定法,也称直接鉴定法,要求由鉴定人员逐件、逐页地详细审查具体分析每一份社交媒体政务文件,在对文件来源、内容、真实性、完整程度和价值大小等进行全面分析的基础上,确定该文件的保管期限和保存方式。人工鉴定法是有效保障社交媒体政务文件鉴定工作质量的可靠方法。该鉴定法要求鉴定人员有较高的专业素养,需深入理解文件所产生的背景、事件、活动,方能做出正确的判断。应注意到,由于受到个人主观影响较大,可能会出现同一份文件有不同鉴定结果的现象。同时,人工鉴定法的工作效率相比智能鉴定法要低很多。在对社交媒体政务文件的鉴定中,由于文件数量众多且当前智能技术的不断发展,人工鉴定法一般是作为智能鉴定法的补充。当系统智能鉴定无法识别文件的价值时,应转入人工鉴定程序。在文件的到期鉴定中,应采用人工鉴定法逐件、逐页地审查社交媒体政务文件价值。
2.4 鉴定内容
2.4.1 内容鉴定
在对社交媒体政务文件内容进行鉴定时,主要鉴定其价值和内容的相关性。档案价值鉴定是档案管理工作中一项十分重要的业务环节,做好档案价值鉴定工作是做好档案管理工作的前提条件。同样地,做好社交媒体政务文件的价值鉴定是实现数字连续性、构建完整社会记忆的重要保障。因此,在社交媒体政务文件鉴定工作中,应贯彻“职能鉴定”和“机构与业务相关性”的核心思想。即在鉴定工作中,宏观上以文件形成者的职能来判断机构形成有价值文件的能力,微观上以文件内容与机构工作的相关性判断文件的价值。在社交媒体政务文件发布工作中,为了充分利用社交媒体平台互动性强的特点和加快重要信息传播速度,不同账号之间存在互转载政务文件的现象,导致同样的社交媒体政务文件在不同的账号里都有存在。因此,在鉴定政务文件价值时,要先判断该份政务文件是转载类文章还是原创类文章,并且只需要对原创类文件进行价值鉴定。
从宏观上来说,可以基于社交媒体政务文件的来源机构进行价值鉴定。国家级部门和省一级部门账号发布的社交媒体政务文件通常价值更高,与民生息息相关的如食品、医疗、公安、社保等相关部门社交媒体账号发布的政务文件价值也较高。从微观上来说,要根据每份政务文件的媒体形式、内容、时间来判定其潜在的利用价值。在具体操作上是可以从三个方面进行综合评价:社交媒体政务文件内容是否包含该机构政策、业务与职责的证据;这些文件内容是否只存在于社交媒体平台,是否已经被保存;在鉴定互动性内容价值时考虑内容是否符合国家法律以及本部门相关政策法规。
在社交媒体内容相关性鉴定中,主要考虑两个方面的相关性。一是将内容相同但呈现形式不同的政务文件相关联。政府部门在扩大信息传播面,提升信息传播速度的同时,需要适应不同社交媒体平台的特性和用户的阅览习惯,因此同一份社交媒体政务文件在不同的社交媒体平台上可能会有不同的展现形式。二是以事件或者活动为主题将相关政务文件相关联。如以“新冠疫情”“东京奥运会”等为主题将各大社交媒体平台中相关的政务文件进行关联,构建完整的社会记忆。
2.4.2 技术鉴定
对社交媒体政务文件进行技术鉴定,保障数据信息的真实、完整、可读和安全。
真实性鉴定。对社交媒体政务文件真实性的鉴定应包括两个方面,即机构账号真实性的鉴定、社交媒体政务文件数据真实性的鉴定。当前,社交媒体平台均已开通账号认证功能,账号主体提交运营资质等文件即可获得社交媒体平台认证特殊符号,如在微博平台中以蓝色“V”标志表示官方账号。在对社交媒体政务文件进行鉴定时,要首先鉴定账号是否为经过认证的政府部门账号,其次通过数字签名技术检验社交媒体政务文件内容的真实性。
可读性鉴定。进行可读性鉴定是技术鉴定最重要的内容,具体指研究每一份社交媒体政务文件的可读状况,避免在操作过程中出现漏洞,导致保存一些无法利用的文件。可读性鉴定主要包括可读状态检测、无差错读取技术检测等[23]。除了较为常规的归档鉴定、进馆鉴定、到期鉴定等需要进行可读性鉴定外,在电子文件进行迁移或格式转化后,也要及时开展可读性鉴定。
安全性鉴定。不仅要确保每份即将存储到电子文件数据库中的社交媒体政务文件是安全的、不被病毒污染,还要确保鉴定文件数据存储环境同样是安全的、不受网络攻击。
2.5 鉴定结果
对社交媒体政务文件进行鉴定将会有三种不同的结果。第一种,社交媒体政务文件具有长期保存价值,需进一步判定其保管期限和保存方式。在保管期限方面,社交媒体政务文件保管期限表的制定可以适当参考纸质文件保管期限表[24],切勿因为电子文件的存储不占物理空间而盲目延长保管期限。在保存形式方面,主要有网页快照、WARC和原格式保存三种,在确定具体保存方式时可以兼顾其不同特点。网页快照形式无法完整复现捕获内容,同时不利于数据关联开放运用;WARC格式不仅可以将多种类型的数据及其描述性信息聚合到一个文件夹中,还可以把数据对象看作数据格式进行存储[25];原格式保存复现效果较好,易于利用。
第二种,社交媒体政务文件不具备长期保存价值,应将其销毁。即对已到或超过保管期限的社交媒体政务文件进行再鉴定时认为其已无保存价值,遂将其进行销毁处理。当前,档案管理人员在实际销毁工作中更倾向于鉴而不毁,使得库房所存档案数量只增不减,利用率却迟迟不见提高,还占用了大量的存储空间,不利于优化馆藏资源。电子文件的保存虽然不需要占用物理空间,却需要花费更多的技术、物力、财力。社交媒体政务文件的销毁可以由保管主体即档案馆提出,也可以由公众提出。档案馆进行销毁时,应将待销毁文件以清单形式在相关社交媒体平台发布,公众提出销毁的文件应经过鉴定团队审核。如,英国国家档案馆制定删除方案(Take Down Policy),若有部门或个人向档案馆提交申请要求将相关资源剔除出收藏列表,由相关领域专家组成的评议小组就会严格按照方案中的条款决定是否将相关内容删除,以此确保档案馆所保存的网络信息资源不存在争议,维护相关者的权益。具体的销毁鉴定过程应为:在销毁清单列出后,应建立一个由主管领导为组长、业务部门人员和档案人员为组员的鉴定团队,对清单中的文件进行再鉴定,在鉴定过程中可以采用逐步淘汰法,剔除肯定无价值的文件,可能还有价值的则暂时先留下,这样降低操作难度,随着时间的推移又会有一部分文件的价值逝去,即可销毁[26]。
第三种,暂时无法判定社交媒体政务文件是否具有长期保存价值时,出于对系统内其他电子文件安全的考虑,须将其导出存入另一个文件管理系统。可定期组建由业务部门人员和档案人员组成的团队,对其进行内容鉴定和技术鉴定。
3 社交媒体政务文件鉴定中亟待解决的问题
3.1 档案室的鉴定职责不明确
长期以来,由于理念、知识和技术等方面的原因,档案室的鉴定工作存在较多问题,如存而不鉴或鉴定标准混乱、鉴定结果不统一等。社交媒体政务文件的鉴定对档案工作者的专业技能提出了更高要求,当前社交媒体政务文件鉴定工作默认由档案馆开展。而社交媒体政务文件数量呈几何级增长,将从工作压力、保存空间、运营负担等多个方面对档案馆提出挑战,这种挑战的加剧与当前档案室的鉴定职责不明确密切相关。
吸引档案室参与社交媒体政务文件鉴定工作,有助于提高社交媒体政务文件鉴定工作的效率。因此,可以明确档案室参与社交媒体政务文件鉴定工作的职责有:在社交媒体政务文件的鉴定中,档案室工作者应结合实际情况制定适合本单位的保管期限表;通过积极参与培训等方式,提高利用智能技术的能力,可将定期采集的本部门社交媒体政务文件通过智能系统进行鉴定,从而减轻档案馆的鉴定工作量;对于无法鉴定的文件可以及时与档案馆交流沟通,在档案馆协助下完成单位文件的鉴定工作。此外,档案室并不具备长期保存社交媒体政务文件的能力,因此档案室还应积极参与档案馆的保管期限表制定、到期鉴定工作等,积极献言献策,将本单位社交媒体政务文件长期保存需求以及在一线工作中所收获的经验等向档案馆反馈。
3.2 智能化鉴定推进缓慢
智能化鉴定方式是较为理想的社交媒体政务文件鉴定方式,不仅能大大减轻鉴定工作者的工作压力,还能利用算法、深度学习等技术提高鉴定效率。有研究者提出基于黑白名单的智能鉴定法不但能保证对前端业务系统形成的全部电子文件实现鉴定,而且提高了效率、鉴定准确率和系统性能等[27]。但该技术尚未成熟,也存在着许多隐患,并且没有在实际工作中广泛运用。当前在实际鉴定工作中要想实现完全的智能鉴定还需做很大努力。
目前智能化鉴定法的推行还存在多方面的障碍,一方面是人的因素,另一方面是支持性和规则性数据的缺失。具体来说,人的因素主要指鉴定工作者,当前鉴定工作者技术水平普遍不高,无法灵活运用各种智能技术,在内心里也无法真正接纳智能技术[28]。其次,规则知识库是智能鉴定系统顺利实施的基础[29],它的开发需要有大量的、完善的数据支持,其中包括大量的社交媒体政务文件、国家认可的鉴定标准、鉴定过程中所涉及的知识和专家的鉴定意见等。然而,我国目前并没有出台明确的针对社交媒体政务文件的鉴定标准,如保管期限表等,收集归档的社交媒体政务文件也较为零散。因此,当前和今后应健全文件的价值鉴定标准和制度,抓紧构建智能鉴定所需的规则库。
3.3 互动性内容是否需鉴定有待考究
互动性内容主要包括用户通过评论、留言等功能对政府部门在社交媒体平台发布文件后进行互动以及政府部门发布具有互动性质的文件,如转发、留言、投票等。2017年5月国务院办公厅印发《政府网站发展指引》,其中明确提出要注重政府网站的互动交流功能,并强调对于参与式信息的归档保存。
目前对于社交媒体平台上的互动类信息是否应参与鉴定保存还未有相关政策法规进行明确。虽然当前已有的实践,如英国国家档案馆仅鉴定保存政府发布的主体信息,转发、评论等互动性信息被明确指出不予归档保存,但是这种做法也明显破坏了社交媒体政务活动微观层面的完整性。互动性内容理应是社交媒体政务文件的重要组成部分。但是,若将互动性内容与文件一起参与鉴定保存,还应考虑该类内容权属问题。由于评论及反馈信息的生成者主要是网络参与者[30],这就决定了社交媒体政务文件的归档决定权和归属权将不仅是政府部门,还应包括参与互动的用户[31]。若想将其进行长期保存,还应逐一获取用户同意或授权,这将进一步增加社交媒体政务文件的鉴定难度。
4 结语
鉴定是决定社交媒体文件是否长期保存的关键性环节,也是解决馆藏数量递增、资源利用率低等问题的直接措施。针对社交媒体政务文件的海量增长和吸纳用户参与鉴定提高鉴定质量的双重需要,鉴定社交媒体政务文件应由档案馆鉴定为主,用户参与鉴定为辅的形式进行价值鉴定。受限于技术水平和相关政策标准的束缚,智能化鉴定方法作为理想的鉴定方法还有较大提升空间。当前社交媒体政务文件的鉴定包括内容鉴定和技术鉴定。经过严格的鉴定程序后,有长期保存价值的社交媒体政务文件将会被赋予保管期限和保管方式继续保存,无长期保存价值的文件将会被销毁,暂时尚无法判断是否具有长期保存价值的文件则被抽出单独存放。上述鉴定要素、内容和方法等共同构成了社交媒体政务文件鉴定的主要工作框架 。