APP下载

人工智能时代档案鉴定工作的回顾与展望

2024-01-19许振哲上海理工大学档案馆

浙江档案 2023年12期
关键词:进馆人工智能价值

许振哲/上海理工大学档案馆

鉴定是档案工作的重要环节,正规的档案鉴定工作可以追溯至1789年法国大革命[1]。在这之后的200多年时间里,世界各国根据档案工作实际,围绕档案鉴定工作展开研究,形成了一系列具有代表性的档案鉴定理论。近年来,随着科技的迅猛发展,人类社会已大踏步迈入人工智能时代,各行各业的工作模式正在发生广泛而深刻的变革。技术已不再是桎梏,而是成为实际工作开展的助力因素。新形势下,既往的档案鉴定理论是否能够适应实际工作的需求?档案鉴定工作应当如何顺势而上?

1 国内外档案鉴定理论回顾

从20世纪初开始,各种具有代表性的档案鉴定理论相继问世:1901年迈斯奈尔提出年龄鉴定论,主张尊重高龄案卷;20世纪20、30年代,卡林斯基提出职能鉴定论,认为一个单位的地位越高,其职能越重要,生成的档案就越有价值;詹金逊提出行政官员决定论,主张档案的鉴定和销毁应由行政官员决定,档案工作者不宜参与;1956年,谢伦伯格提出文件双重价值理论,认为档案具有第一价值和第二价值,需要档案工作者在档案鉴定工作中发挥更大的作用;到了20世纪80年代,随着电子文件的大量涌现,宏观鉴定理论应运而生,主要包括布姆斯的社会分析与职能鉴定理论,塞穆尔斯文献战略以及特里库克的宏观鉴定战略,主张以更加宏观的视角全面考量文件的社会职能。我国的档案鉴定理论诞生较晚,始于20世纪80年代,包括相对价值标准理论、价值鉴定论、本位原则理论等[2]。虽然不同理论具体描述有所差异,但其内核仍不可避免地打上了西方档案鉴定理论烙印,未能跳出既定价值鉴定框架。

21世纪随着人工智能技术深入发展,新的档案鉴定思潮也随之出现。2015年,周林兴、邓晋芝二人提出“(经过鉴定后)所保存的档案都是过滤后的档案,所反映的不是完整的而是被选择了的历史,所呈现给后人的不是原汁原味的而是被强化或弱化了的社会记忆……因此,基于历史视域的考量,应当弱化档案鉴定”[3]。马伏秋认为“我国档案鉴定理论研究与实际工作严重脱节,档案鉴定工作缺乏科学、具体的理论指导……应当彻底废止销毁鉴定”[4]。杨冬权指出:“档案的这种多重价值或多方面价值就使档案的‘选择性管理’漏洞百出,捉襟见肘,无法应付。只有‘全部性管理’才能适应档案价值多重性的需要,才能满足未来利用者的各方面需求……我国档案工作面临着一个从‘选时代’到‘全时代’的全新蜕变和全面改变”[5]。

周林兴等人关于档案鉴定工作的论述,是对人工智能时代档案工作模式的尝试与探索,也是对传统档案鉴定理论的挑战与突破,有学者将他们的观点统称为“档案鉴定非必要论”[6]。观点一经问世,在学术界引起轩然大波,引发无数讨论。在技术条件已然成熟的今天,档案界为何对档案鉴定非必要论充满抵触与质疑?当前我国档案鉴定工作存在哪些问题?弱化鉴定甚至取消鉴定在未来是否具备实现的可能性?

2 我国档案鉴定工作存在的实际问题

2.1 归档鉴定模式因循守旧

关于档案应由文件形成者还是档案人员鉴定,档案界至今争论不休。我国采用“档案人员、业务人员和有关领导三结合”的鉴定模式,理论上看可以让文件形成者与档案人员共同参与到鉴定环节中,很好地解决了冲突,实际则不然。有学者指出,“我国所谓的三结合,实际只是两结合,机关或者档案馆的领导并不会亲自参与鉴定工作……鉴定工作由档案部门和业务部门人员共同组成的鉴定小组来操作,这种组织看似科学,实际上难以正常开展工作和保证质量……三结合只在工作到一定阶段时出面议一议,把把关[7]。”三结合鉴定模式的初衷,是“一道程序,三方参与”,保证每一份档案的价值能够被全面充分地认知。然而实际工作中,却变成了“彼此独立,三重过滤”,归档鉴定、档案室鉴定、档案馆鉴定彼此割裂,不再是一个综合性环节,而是成为三道线性流程。每个流程的鉴定人员都拥有同时鉴别档案第一价值和第二价值的权利。这就导致三结合的鉴定模式不仅无法全面综合地鉴别档案价值,反而会在每个鉴定环节都将一部分有价值的档案剔除在外。

归档鉴定模式因循守旧还表现为,对档案保管期限表和归档范围的全面依赖。当前鉴定工作主要依据国家档案局2006年发布的《机关文件材料归档范围和文书档案保管期限规定》和2012年发布的《企业文件材料归档范围和档案保管期限规定》[8]。上述文件发布至今已有相当长的时间,很难满足当前形势下的档案鉴定需求,加之保管期限表中往往掺杂大量“重要的”、“一般的”这类模糊不清的字眼,直接影响档案人员对档案价值的实际判断。傅荣校指出:“我国目前的档案保管期限表尚无法充分反映出现有的先进的价值理论和鉴定标准,也无法充分体现出与我国目前鉴定理论发展水平相适应的内容,鉴定理论与档案保管期限表之间的衔接不力,直接影响了鉴定理论的发展和更新……可能使那些具有重要第二价值的文件遭到毁灭性的打击”[9]。归档范围的局限性对档案鉴定工作造成了较大影响,也让很多档案进入可归可不归的灰色地带,大量非官方背景的社会记录未被纳入档案资源对象范畴,难以进入档案管理的“资源池”,难以保证档案的齐全完整性[10]。

非官方来源的档案不在归档范围,无法进馆;官方来源的档案经过层层筛选,十不足一。最终呈现给公众的,都是官方视角、人为选择、支离破碎的社会记忆,未来的研究者从“一家之言”能否窥得历史的本来面貌?这是否已然背离了档案鉴定工作初衷?

2.2 价值鉴定标准存有局限

有学者根据性质将档案鉴定划分为档案质量鉴定(包括档案的原始性、真实性、完整性、准确性、载体质量鉴定)和档案价值鉴定,并认为档案价值鉴定是档案鉴定的核心[11]。档案价值,通俗而言就是档案对人类的有用性,不同的价值体系、不同的判定标准,都会影响人们对档案价值的认知。“对本单位无用的档案,可能对全社会有用;对自己无用的,可能对别人有用;对今天无用的,可能对明天有用;对国家或单位无用的,可能对家庭或个人有用;表面看无用的,可能实际上有用”[12]。因此有学者认为档案价值具有多重性和不确定性,甚至有人陷入了档案价值“不可知论”的泥潭[13]。

人类对事物的认知需要经历一个由浅入深、螺旋上升的过程,在这个过程中对于档案价值的认知,对鉴定标准的界定亦不可避免地带有局限性。举例而言,档案馆是否存在永久保存,但从未被利用过的档案呢?答案是肯定的。如果这份档案从未被利用过,它的价值从何体现呢?如果它没有价值,为何能够接收进馆永久保存呢?也许有人会说,档案现在没被利用,不代表未来没有价值。那么问题又来了,日常工作中,难免碰到需要查询的档案没有归档的情况,这些档案显然是具有价值的,为何在鉴定环节没有考虑这部分档案未来可能存在价值,而是选择将其拒之门外呢?由此看来,当前档案价值鉴定标准在理论与实际两端均难以自洽,认知的局限决定了人们在某个特定阶段不可能全面认清档案的价值,由此确立的价值鉴定标准,必然会导致相当数量有价值的档案无法入库、散佚蒙尘。

档案价值的多重性和不确定性决定无论何种价值鉴定体系都必然存有一定的局限性。那么“形成档案全归档,归档档案全留存”[14]显然成为给后世留下宝贵档案遗产的最佳途径。

2.3 档案销毁鉴定推进不力

根据流程,可以将档案鉴定划分为进馆鉴定、开放鉴定和销毁鉴定三个环节。不同于进馆鉴定严苛刻板,销毁鉴定中“鉴而不销、销而不毁”的现象频频发生[15]。档案在进馆鉴定环节会被划定保管期限,理论上保管期满的档案对党和国家不再具备有用性。然而在实际工作中,人们往往倾向于这些档案在未来依然具有发挥价值的可能,从而将保管期限一再延长。档案进馆鉴定与销毁鉴定遵循的是同样的价值评判标准,为何在进馆鉴定环节可以做到应归尽归、蹈矩循规,而在销毁鉴定环节却是态度暧昧、谨小慎微?

以上这种现象一方面源于当前档案保管期限表条款太少,内容过于概括,保管年限划分简单随意,只有10年、30年、永久三个档次,不足以囊括不同门类的所有档案。另一方面,档案销毁相关规范性文件太少、年份太早,且用词充斥一般的、重要的等模糊字眼,缺乏明确的、可供参考的销毁依据,很难作为实际工作的参照。这就导致各级各类档案馆在期满鉴定过程中畏首畏尾,慎之又慎,不敢轻言销毁,唯恐造成党和国家的损失。

现阶段档案销毁鉴定推进不力,还有更深层次的现实原因:实际工作中,需要查阅的档案却被告知已经销毁的现象并不鲜见,销毁鉴定也因此愈发举步维艰。档案工作者对进馆鉴定和销毁鉴定的双重标准并非本意,档案价值的不可捉摸,决定了销毁鉴定必然要承担相当程度的风险,正是出于对档案事业的热忱与责任,才会让对待进馆鉴定无比严苛的档案工作者在销毁鉴定时产生一次又一次的宽容。当前形势下,唯有废止销毁鉴定,才可能在源头规避给党和国家档案事业造成损失的一切可能。

3 人工智能时代档案鉴定工作前景展望

纸质档案时代档案保管能力有限,这也是档案鉴定工作产生的直接原因。人们通过衡量预测档案对当下以及未来的有用性,从既有档案中挑选出一部分加以保存。电子档案时代,载体类型发生变更,档案存储密度呈几何级提升,已完全能够承载不断增长的馆藏数量,然而电子时代档案工作需依赖人类加工,海量的数字档案全部进馆,光凭人力不可能完成,因此档案鉴定工作依然未能摆脱传统模式的桎梏。

随着卷积神经网络的发展成熟,深度学习技术的推广使用,人类社会开始大踏步迈入人工智能时代。相信在不久的将来,随着人工智能技术在档案领域的深度应用,机器将取代人类,完成各项繁复的档案工作。机器可以根据人类设定的算法逻辑进行实时归档、自动著录、动态鉴定,并在此过程中不断收集用户行为数据,实现升级优化。人工智能时代的到来,必将打开档案鉴定工作新局面。

3.1 确立全部性管理总体方针

载体形式的升级为档案全部性管理提供了充足的存储空间,人工智能技术的应用则让全部性管理由理论成为可能。通过机器深度学习,未来档案工作可以实现全过程自动化管理,“形成档案全归档,归档档案全留存”将成为人工智能时代档案工作的总体方针。

需要注意的是,全部性管理只是在归档环节不再对档案价值进行判定,并不意味着档案归档鉴定的取消。归档鉴定不仅包括档案价值鉴定,还包括档案质量鉴定,传统档案鉴定工作侧重于价值鉴定,一定程度上忽视了质量鉴定的重要性。人工智能时代,档案管理的对象是电子数据,这就决定将来电子文件单轨制运行、单套制管理是大势所趋。为确保电子档案的原始性、真实性、完整性、准确性,加强档案质量鉴定刻不容缓。人工智能时代,档案工作者的职责不仅没有减轻,反而更甚以往。电子档案元数据、电子签名、时间戳等元素未来都将成为档案质量鉴定的对象。档案部门可以通过数字证书授权中心核验归档人的电子签名,确保归档文件传输过程未经篡改,保证其真实性、准确性;通过联合信任时间戳服务中心核验档案的时间戳,确保档案的原始性;档案部门还可以保存文件历次修改的元数据,为将来的研究提供多元的视角,传承更加完整的社会记忆。

3.2 构建档案价值动态鉴定体系

档案价值是动态的,会随时间、场合、用户的变化呈现不同程度的有用性,任何档案价值鉴定理论都难以全面衡量档案的价值。因此人工智能时代实行全部性管理,取消前端归档价值鉴定,可以有效解决进馆档案的取舍问题。

然而随着全部性管理进程的推进,档案馆未来可能面临馆藏数量繁多、检索效率低下的困境。传统鉴定模式下,馆藏资源相对有限,用户可以根据检索结果逐一阅览;全部性管理模式下,电子馆藏浩如烟海,任意词条检索得到的结果都将是成千上万条,如何从中高效地筛选有用信息将成为困扰用户的最大问题。

为保证用户的检索利用效率,提升档案利用体验,档案部门应通过档案利用平台主动抓取用户行为数据,利用卷积神经网络进行关联运算,构建终端档案价值动态鉴定体系。档案利用平台将单位时间内用户群体的检索词条、档案点击量、档案累计浏览时长等数据进行关联并深度运算,通过用户的行为数据来衡量一段时间内哪些档案对用户更具有用性,并将检索频次、档案利用率等数据加权换算,作为衡量馆藏档案动态价值的标准。当用户进行检索时,利用平台将优先把单位时间内加权检索分值更高的结果推送给用户,免除用户逐一浏览海量信息的困扰。

图 开放档案智能鉴定数据库

人工智能背景下的档案价值动态鉴定体系,以用户行为数据为依据,将档案检索利用率作为价值鉴定的唯一指标。该体系中档案的价值并非一成不变而是随档案检索利用频次的波动不断变化,从而能够极大地提升用户检索利用效率,也可以动态满足不同时代不同群体的差异化利用需求。

3.3 构建开放档案智能鉴定数据库

目前,各地档案馆普遍存在“只进不出”或“进大于出”的现象,一些保存期限为10年、30年的档案更是近乎永久保存,档案销毁鉴定已然名存实亡,直接废止销毁鉴定可以为实际工作减去很多不必要的麻烦。

废止销毁鉴定意味着所有档案不再有保管年限的划分,进馆档案都将永久保存,但这并不意味着档案只要归档进馆就一劳永逸。全部性管理的根本目的是更好地服务利用,而用户最终能够接触到多少档案完全取决于档案开放水平。很多地区的档案部门秉持谨慎的态度对待档案开放鉴定,尽管新版档案法将档案开放期由30年减少到25年,但一些档案的开放期仍然一再延长,久久未能面世,可谓“养在深闺人未识”。

档案开放是档案价值得以发挥的必然路径,但涉及国家安全或者重大利益以及其他到期不宜开放的档案则有必要进行多次开放鉴定。想要兼顾用户的实际利用体验与信息安全,实现档案开放利用的长效机制,必须构建一个开放档案智能鉴定数据库维系电子档案的内部运转。

如图所示,馆藏纸质档案和归档电子文件转化为电子档案后进入开放档案智能鉴定数据库,首先根据文件的时间戳鉴定档案是否形成期满25年,年限已满档案转入档案开放鉴定库,年限未满档案转入待开放库;其次对开放鉴定库中的档案进行二次鉴定,经济、教育、科技、文化等适宜开放的档案转入人工智能训练库,涉及国家安全或重大利益的档案转入加密库;待开放库的档案形成期满25年后再次转入开放鉴定库,加密库档案自进库之日起,再次开放期满后转入开放鉴定库,重复上述开放鉴定流程;人工智能训练库是数据库的最后一个模块,所有进入训练库的档案,可供人工智能直接接触、深度学习,并向用户推送信息、标记出处。开放档案智能鉴定数据库的建成,可以借助人工智能自动完成档案开放鉴定,“应开放尽开放”“能公布全公布”,最大程度发挥档案的价值。

猜你喜欢

进馆人工智能价值
凤庆县、双江县完成农村土地承包经营权确权登记颁证档案进馆工作
关于开展铁路建设项目档案进馆工作的思考
2019:人工智能
人工智能与就业
数读人工智能
一粒米的价值
“给”的价值
下一幕,人工智能!
太仓市强化对事业单位民生档案的进馆
高校图书馆进馆人次月份统计分析——以广州大学图书馆为例