从数字化到数据化:档案管理思维的转变
2020-09-08赵跃王俊慧
赵跃 王俊慧
摘要:从数字化到数据化是档案工作转型的重要表现,也是带动档案管理思维转变的重要动力。文章通过比较档案数字化和档案数据化所体现的档案管理思维,提出数据转型时期要推进存取导向思维向开发导向思维的转变、信息服务思维向知识服务思维的转变、信息管理思维向智慧管理思维的转变、开放档案思维向开放数据思维的转变的观点。
关键词:数据时代;档案管理思维;档案数据化;档案数字化
分类号:G271
From Digitalization to Datafication: The Transformation of Archival Management Thinking
Zhao Yue1, Wang Junhui2
(1.School of Public Administration of Sichuan University, Chengdu, Sichuan, 610065; 2.School of Information Management of Wuhan University, Wuhan, Hubei, 430072)Abstract:From digitalization to datafication is an important phenomenon of archival work, and also an important driving force for the transformation of archival thinking. By comparing the archival thinking embodied in the digitization of archives and the datafication of archives, this paper puts forward the view of promoting the transformation of preservation-oriented thinking to developmentoriented thinking, information service thinking to knowledge service thinking, information management thinking to intelligent management thinking, and open archive thinking to open data thinking.
Keywords:Data Era; Archival Thinking; Datafication; Digitization
档案管理思维是人们对档案及档案工作的理性认识,对档案管理实践的开展具有导向作用。作为一种存在于人脑的主观认识,档案管理思维具有时代性特征,同人类的档案管理实践及其相关认识活动和文化发展水平是一致的[1],而在众多推进现代档案管理实践发展并决定档案管理思维转变的因素当中,信息技术无疑是最具影响力的因素。20世纪90年代,我国档案信息化建设正式拉开序幕,档案工作开始从模拟时代迈向數字时代,档案数字化成为数字时代档案工作的重要内容。21世纪初,大数据、人工智能等新一代信息技术开始推动档案信息化向纵深发展,档案工作也开始从数字时代迈入数据时代,档案数据化逐渐引起档案界的关注[2]。作为两个时代的产物,档案数字化和档案数据化也体现出不同时代的档案思维。为揭示从数字化到数据化所体现出的档案管理思维变化,笔者基于档案数字化所体现的档案管理思维,结合数据时代下档案及档案工作的新形势、新变化和新动向,论述档案管理思维的具体转变,以期对档案界认识新时期的档案与档案工作有所启示。
1存取导向思维向开发导向思维的转变
“存”是档案工作之本,档案馆最重要的职能就是安全、长久、可持续地保存档案。1980年,中央书记处做出开放历史档案的决定后,档案工作开始走向开放、走向社会,档案馆职能向“取”拓展,档案开放获取与利用编研等工作受到重视。由此,存取导向思维成为改革开放后我国档案管理实践中的一种典型档案管理思维。存取导向思维影响下的档案数字化关注档案原件的安全保护与档案信息资源的保存、获取,但这种思维存在“重存轻取”的偏见。一方面,为加快档案数字化进程,档案机构往往过度追求馆藏档案数字化率,将传统载体档案的“转换”和“存储”作为档案数字化工作的首要任务和工作重点,从而忽视了对档案开发价值和用户需求的把握;另一方面,数字化后的档案虽然改变了档案的存在形式、拓宽了档案信息获取渠道,但并没有实现对档案信息资源的深度开发。档案数字化为计算机检索提供了基础,但浅层次的档案数字化往往只能实现对档案的计算机化识别和读取,无法实现对档案信息的计算机理解和分析,档案数字化仍停滞于更细粒度的档案数据化处理与开发之外。
相比之下,开发思维导向下的档案数据化则更加关注对档案数据资源的开发与挖掘,这使档案信息资源的开发深度与开发层次发生了变化,开发的重点也从档案信息资源本身走向了细粒度档案数据资源所包含的知识,这推动了档案数据和信息内容向知识的转化。2014年,计算机科学家Sara Klingenstein和Simon Dedeo协同历史学家Tim Hitchcock在《美国国家科学院院刊》上刊发文章《伦敦老贝利的文明进程》,利用大数据技术绘制出法律词汇在当时社会背景下的演变趋势,揭示了刑法中至今仍然有效的几个重要趋势[3],他们将天体物理推理应用到数据库分析中,挖掘法律文献并进行社会分析,使法律文献获得了新的意义和价值。而这项研究对于档案馆和图书馆等馆藏机构而言,意味着对其馆藏资源的重新定位,通过数据化以及数据开放服务,在数据驱动下可实现对传统馆藏资源价值的重新发现[4]。
数据转型时期,数字化依然是档案工作的重要内容,但档案数据化为档案管理带来了数据态的管理对象,这将有力推动计算技术、计算思维与档案数据资源开发的结合,即在数据时代,档案数据化开发会逐渐成为档案工作的重点。总之,推进存取导向思维向开发导向思维的转变,有助于实现档案资源在数据层级的开发,可为当下档案机构开展国家重点档案的保护与开发提供新思路。
2信息服务思维向知识服务思维的转变
档案服务是连接档案资源与档案用户的中间环节,档案服务的好坏将直接影响用户满意度以及档案价值的实现[5]。20世纪90年代,如何借助信息技术、应用不同的服务方式为档案用户提供所需档案内容信息引起了各级档案部门的关注。此后,档案用户需求、档案价值实现与档案信息服务的“信息服务思维”逐渐在档案实践中发挥作用。档案数字化工作的推行凸显了档案工作中的信息服务思维,它推动档案服务从基于实体的服务转向基于信息的服务,实现“线下”至“线上”、“一对一”至“一对多”、“定点寻找”到“异地获取”的转变,但不可否认的是,信息服务思维的本质仍是档案用户主动索取所需档案内容信息的过程。基于数字档案所提供的档案信息服务仍存在以下局限:其一,数字化后的档案内容仍需要用户有意识地进行查询与检索,并未形成档案信息内容间完整的关联网络;其二,数字化后的档案内容依然只有经过人的阅读理解,才能为人所感知并转化成有用信息,进一步呈现出完整的档案知识体系。
知识服务理念自21世纪后便被引入档案领域,但长期停滞于理念层面,未能在档案实践中发挥出应有的作用。档案数据化强调将数字档案转化成数据资源,进而实现对档案数据资源的深度挖掘与开发。通过引入知识组织、知识发现、知识可视化等领域的技术,对档案数据资源以新的方式组织、开发和可视化呈现,可真正实现基于档案知识的服务,改变档案服务对实体和信息的依赖,发挥档案在知识层次的价值。例如,为实现档案知识发现,就要在考虑档案内容与载体特征的基础上,在档案资源的收集、分类、提炼、整合的过程中,以数据化—结构化—语义化—网络化—智慧化为主轴,通过数据源—数据集成—数据存储—数据处理—数据可视化—知识应用—评价反馈等环节,经由知识关联、知识聚合、知识共享等处理,形成由知识元、知识链、知识域、知识网所构成的多层档案知识体系[6][7]。
总之,在数据时代,推进信息服务思维向知识服务思维转变,有助于提升档案部门对馆藏数字档案资源内容层面的把控能力,促进档案信息服务向知识服务的转型,同时也为档案部门进一步开展數据服务、智库服务提供动力。
3信息管理思维向智慧管理思维的转变
自20世纪90年代起,为迎合档案信息化建设浪潮,档案部门开始部署档案管理信息系统,将很多手工操作的流程和环节转移到计算机当中,逐步实现档案管理由实体管理向信息管理的转变,信息管理思维也逐渐在档案工作中得以形成。档案数字化工作受信息管理思维的影响,对纸质档案数字化后所形成的数字档案资源的管理依赖于档案管理系统或第一代数字档案馆系统,而这些管理系统的功能多停留在“收、存、管、用”相关的基本业务环节。可见,档案数字化促进了对纸质档案的信息化管理,这对于纸质和数字档案的科学管理、规范管理和安全管理具有重要价值。然而,这与近年来兴起的智慧管理还有很大差距,智慧管理作为未来数据时代和智能时代档案管理的一种全新模式,不仅需要依靠云计算、大数据、人工智能等技术,还需要树立“数据驱动”的理念,推进档案数字化向数据化的转型。
在数据时代和智能时代,档案部门首先需要关注的不是相关技术的引入问题,而是需要认真思考哪些业务环节亟须通过自动化和智能化来提升工作效率和质量,哪些业务环节可以借助智能技术来达到更好的效果,以此确定档案管理智能化建设需求和目标。在此基础上,再与相关技术部门或第三方探讨论证应该应用哪些成熟技术、通过哪些方式方法、做好哪些资源准备、梳理哪些流程和业务规则才能推进档案管理工作智能化的实现,如智慧收集、智慧归档、智慧鉴定、智慧编研等。作为推动智慧管理实现的重要技术支撑,人工智能在国外文件保管领域的应用包括文本分类与分析、文件鉴定、选择、处置与敏感性审查等,并且已有一些档案领域的实践案例可论证其应用的可行性。例如,澳大利亚维多利亚公共档案馆基于Proof of Concept项目,利用机器学习技术实现对维多利亚州政府大量非结构化电子邮件的鉴定、处置和敏感性审查,致力于提高政府信息的透明度和可问责性,通过政府信息公开,满足人民对公共事务相关信息的需求。同时,该国政府财政部门在Proof of Concept项目的基础上还继续深入开展文件管理自动化实践,目的在于将该类技术拓展应用至文件管理工作全流程[8]。
但正如Gregory Rolan等学者所言,人工智能应用于文件保管工作仍面临一些障碍:其一,目前人工智能技术在文件保管领域应用的可行性大小尚未可知,仍缺乏相关案例的佐证;其二,机器学习方法产生的工作方案对技术提出极高要求,即需结合其他新技术进行融合应用,否则将失去人文关怀;其三,人工智能技术与人文关怀的融合还较为不成熟,如对文件的鉴定和销毁,不仅要注重文件本身的内容质量,还需结合文件背景资料和关联网络,甚至对数据价值重组再生进行预测,这都将影响最终判断[9]。可见,档案数据化以及数据化后的档案数据治理是人工智能技术成功应用的重要保证。
总之,在数据时代和智能时代,推进信息管理思维向智慧管理思维转变,有助于档案智慧管理的实现,推进数字档案向智慧档案、数字档案馆建设向智慧档案馆建设的转变。
4开放档案思维向开放数据思维的转变
开放档案曾被认为是档案史上具有划时代意义的一场革命,因为这意味着全体公民都享有了利用档案的权利[10]。档案管理单位必须依法向社会各界及时公布和开放可以被利用的信息,以防馆藏档案信息错过最佳价值实现时机[11]。可以说,开放档案是我国国家档案馆的法定义务,也是各项档案开发利用工作的大前提,但一直以来,在开放档案思维的作用下,档案开放利用的形式较为有限,一般档案馆对所有已到开放期限的档案,经鉴定无需继续保密或控制使用后便进行系统整理,编制提供利用者自行检索的案卷或文件级开放档案目录,并向社会开放利用,但利用者通常只能前往档案馆查阅大厅进行现场利用,不仅查阅数据有限,而且一般情况下只能以摘抄为主。数字化以及数字时代的到来,虽扩大了开放档案信息的获取途径,如通过网站发布开放档案目录信息,但并未真正实现档案开放利用工作的变革与创新。
近年来,全球掀起的科学数据、社会科学数据、政府数据等领域数据开放运动引起了极大反响。以政府开放数据为例,政府开放数据是指任何人都可以访问、使用和共享的公共数据,是经过开放鉴定且在政府开放许可范围内的,不受著作权、专利权等的限制,可以面向社会公众开放供自由获取的数据[12]。在这场声势浩大的开放运动影响下,各国档案部门都开始了对档案数据开放的探索。无论是国际档案理事会还是美国、英国等欧美发达国家,都在关注并加紧探索档案部门以及档案工作者在数据开放中应该扮演的角色和承担的义务,很多国家档案馆也积极参与到数据开放运动当中。例如,新西兰档案馆在其官网上开设了“开放数据”栏目,为用户提供已开放的档案数据集[13]。当前,国内档案部门也参与到政府数据开放当中,但其发布的数据大多是档案部门的“政务数据”,这并非是真正意义上的档案数据。有学者从政府数据开放的角度出发并认为,档案数据开放可以简单理解为将档案机构收集保存的所有原始数据向公众开放[14]。
2016年国家档案局发布《全国档案事业发展“十三五”规划纲要》并提出:要制定档案数据开放计划,优先推动与民生保障服务相关的档案数据开放[15]。2020年6月20日发布的修订后的《中华人民共和国档案法》第二十八条规定:“档案馆应当通过其网站或者其他方式定期公布开放档案的目录,不断完善利用规则,创新服务形式,强化服务功能,提高服务水平,积极为档案的利用创造条件,简化手续,提供便利。”可见,所谓国家层面的档案数据开放目前更多是指档案目录数据的开放。因而笔者认为,档案数据开放与档案部门参与政府数据开放不能等同。档案部门参与政府数据开放,开放的数据多为档案部门的政务数据;而开放数据思维下,档案数据开放应更加强调“开放与档案相关的数据”,因而应重点考虑开放包括目录数据以及档案数据化后从档案内容中提取的细粒度的内容数据。
因此,从开放目录数据到开放内容数据的转变,将会成为新时期开放档案思维的又一次变革,而这次思维变革是建立在档案数字化向数据化转型的基础之上的。在档案数据化的基础上,档案部门设计档案数据开放平台,以数据集的形式发布人物、活动等专题类档案数据,这将会带来档案数据价值發现和档案数据重用的重大创新。
5结语
国家大数据、数字中国、智慧社会等战略愿景的提出,推动着重要信息资源高度数据化、互联化和智能化[16]。档案资源作为辅助党委政府决策,服务社会和群众生产生活的重要信息资源,具有数据化处理与开发的必要性。档案数据化是档案与档案工作在新兴信息技术影响下形成的新趋势,它反映了外部技术和方法输入后,档案界面对机遇和挑战的积极应对。面对档案管理实践的时代变化趋势,能否及时更新档案管理思维,关乎数据时代档案工作和档案学研究的整体规划和总体战略。文章通过比较档案数字化和档案数据化所体现的档案管理思维,提出数据转型时期要推进存取导向思维向开发导向思维的转变、信息服务思维向知识服务思维的转变、信息管理思维向智慧管理思维的转变、开放档案思维向开放数据思维的转变。在数据转型的背景下,档案界应更新档案管理思维,积极寻求档案工作与档案学研究的转变方向,找寻数据环境下,档案在数据治理和社会管理中的角色与定位。结合国家重点档案保护与开发工作,以试点开发为手段,推进档案数据化进程,不断探索档案工作与国家战略的切合点,以积极应对数据时代档案工作的挑战。
*本文系2019年四川大学创新火花项目库项目“档案4.0:智慧社会的档案认知与档案工作趋势研究”(项目批准号:2019HHS-06)阶段性研究成果。
注释与参考文献
[1]丁海斌.档案管理思维论[J].档案,2014(2):47-52.
[2]赵跃.大数据时代档案数据化的前景展望:意义与困境[J].档案学研究,2019(5):52-60.
[3]Klingenstein S,Hitchcock T.DeDeo S.The civilizing process in Londons Old Bailey[J].Proceedings of the NationalAcademy of Sciences,2014(26):9419-9424.
[4]Huwe T K.The Value of Data-Driven Special Collections[J].Computers in Libraries,2014(9):23-25.
[5]周耀林,赵跃.档案资源建设与服务联动模式探析[J].档案学通讯,2015(5):51-57.
[6]朱令俊.数据驱动下档案知识发现的路径研究[J].档案与建设,2020(2):30-34.
[7]牛力,袁亚月,韩小汀.对档案信息知识化利用的几点思考[J].档案学研究,2017(3):26-33.
[8][9]Rolan G,Humphries G,Jeffrey L,et al.More human than human?Artificial intelligence in the archive[J].Archives and manuscripts,2019(2):179-203.
[10]陈永生.档案开放利用情况的数据分析——档案充分利用问题研究之二[J].档案学研究,2007(4):15-17.
[11]陈兆祦,和宝荣,王英玮.档案管理学基础[M].北京:中国人民大学出版社,2005:307.
[12]吕颜冰.论档案部门参与开放数据建设的问题与途径[J].档案管理,2016(1): 20-23.
[13]董芳菲.开放数据环境下新西兰档案馆的角色定位及其启示[J].档案与建设, 2018(10):24-28.
[14]马海群.档案数据开放的发展路径及政策框架构建研究[J].档案学通讯,2017(3):50-56.
[15]全国档案事业发展“十三五”规划纲要[J].中国档案,2016(5):14-17.
[16]向立文,李培杰.档案部门实施档案大数据战略的必要性与可行性研究[J].浙江档案,2018(10):10-12.