档案与数据协同管理的历史溯源与现实动因
2023-06-06何思源刘越男祁天娇
何思源 刘越男 祁天娇
摘要:档案与数据有着千丝万缕的联系,但在数据如火如荼的当今社会,却呈现割裂发展的状态,亟待协同管理。从档案管理与数据管理关系演变的角度来看,虽然二者在信息化发展过程中各有侧重,但同根同源,协同管理有着深厚的历史根基;从现实发展的角度来看,档案与数据的法理联系和现实差异以及共有的资产视角要求协同,数字化转型发展需要理念协同,面临的共同难题促使协同,优势互补和方法相通支持协同,管理体系的相对割裂呼唤协同。
关键词:档案管理 数据管理 协同管理 数字转型
Abstract:Recordsanddataareinextricably linked, but in todays society where data is in full swing, the two have developed in a fragmented manner and are in urgent need of collaborative management. From the perspective of the evolu? tion of the relationship between records manage? ment and data management, although the two have their own focus in the process of informatiza? tion development, they have the same root and ori? gin, and collaborative management has deep histori? cal roots.From the perspective of realistic develop? ment, the juridical links and realistic gaps between records and data and the common asset perspec? tive require collaboration,the digital transformation requires the concept of collaboration,the common challenges faced by both prompt collaboration,the complementary advantages and common methods support collaboration, and the relative fragmenta? tion of management systems call for collaboration.
Keywords:Records management;Data manage? ment; Collaborative management; Digital transfor? mation
在数据成为新型生产要素的数据时代,政府和企业纷纷成立数据管理部门,浙江、广东等地率先在政府部门设立首席数据官,开展数据治理。档案与数据有着千丝万缕的联系,却呈现割裂发展的状态。一方面,档案部门面临来自数据部门的冲击与挑战,档案工作如何融入数据生态已成为摆在档案工作者面前的现实问题;另一方面,纸质环境中档案管理的线性思维模式和静态管理方式不再适用,[1]数据管理能为档案领域带来新的思维和方法。档案与数据协同管理逐渐成为档案领域的重要议题,《“十四五”全国档案事业发展规划》明确提出“大力推动科学数据与科研档案协同管理”的任务要求。
目前,檔案与数据协同管理相关研究主要涉及概念关系[2]、法律协调[3]、机构设置[4]、实施策略[5]、科研档案和科学数据协同管理[6-7]等,但都侧重应对之策,较少涉及动因分析,缺乏历史维度的考量。本文追溯档案管理与数据管理的发展历程,在历史维度探析二者关系的演变脉络,使档案与数据的协同管理能够厚植历史根基,在此基础上从组织机构的视角出发,进一步分析协同管理的内外动因,以更深刻地认识协同管理的重要性和必要性。需说明的是,本文中出现的文件及文件管理均指英文语境下的records及records management,可在一定程度上将其作为中文语境下档案及档案管理的对应词,但由于中外体制差异,无法完全对等,故将其翻译为文件及文件管理,以示区分。
一、档案管理与数据管理的历史溯源
(一)传统环境中的档案管理与数据管理同根同源
从历史发展的角度来看,文件管理就是前数字时代的数据管理,其起源可追溯至公元前4000年。[8]在前数字时代,现代数据管理所谓的结构化和非结构化数据都以统一的形式存储在各类介质中,且都通过文书工作进行手工管理。[9]
在两河流域的苏美尔文明中,人们用楔形文字在泥板上进行刻写,记录数据,形成文件。这些文件通常与经济活动有关,如记录贸易、销售等的数量,以跟踪货物交易、存储等活动,[10]类似于现代的货物清单或ERP系统中的数据表。随着社会的发展,文件的制作和使用逐渐从经济领域扩展至政治、法律等领域,包括皇家信件、官员名单、法律案卷、法律规范、外交协议及关于出生、死亡、婚姻等的记录。[11-12]在古埃及,文件也被用于记录土地所有权、作物产量、税收等经济及宗教问题。[13]
在中世纪的欧洲,王公贵族和封建领主保管着关于人口出生、死亡、婚姻、税收、商业和银行交易等的文件。随着各国君主制的巩固和强化,行政类的文件有所增加,[14]例如英国的《末日审判书》(Doomsday Book)。到17世纪,商业发展需要精确的人口和贸易数据,对留存和查阅文件提出更高的要求。[15]此时,制作文件的书写人员的地位与当今社会的计算机系统分析师或编程人员的地位相当。[16]
从我国档案管理的发展历程来看,档案也是数据的记录形式。商朝有记录生产、政治、军事、谱系的甲骨档案,西周有记载册命、赏赐、志功、征伐的金文档案,秦朝出现大量律法档案和石刻档案,隋唐时期出现关于科举及官员的甲历档案,明代有专门记录人口、土地和赋役的黄册和鱼鳞图册。[17]
从现代意义上的档案与数据视角进行审视,可发现上述人类活动形成的各种原始记录既符合档案的要求,也符合数据的特征,既是档案,也是数据,制作和管理这些原始记录的业务活动既是档案管理,也是数据管理。
(二)数字环境中的档案管理与数据管理渐行渐远
进入20世纪,政府职能日益扩大、商业活动更加复杂、新的文件制作工具层出不穷,文件数量激增,组织机构希望以适当的格式、在适当的时间,以尽可能低的成本获得准确的信息,[18]开始产生有效和全面管理数据及信息的意识。[19]虽然二者都积极应对这一新挑战,但采用了不同的思路和方法,文件管理开始分化,现代意义上的文件管理和数据管理逐渐形成。
在某种程度上,二者的分化首先表现在发展思路的差异上,文件管理采用“做减法”的思路,数据管理采用“做加法”的思路。源于美国的现代文件管理侧重控制数量和文书削减,致力于留存核心的文件,维护其证据和记忆价值,消除不必要、重复或无价值的文件,核心举措是基于文件保管期限表的鉴定与处置活动。这种传统得到《文书削减法》等法律的强化,并一直延续至今。我国民国时期的机关档案室管理工作,亦体现出这种思想,如文书档案连锁法的“目的是想通过几道简便的手续,把文书工作和档案工作连锁起来,以改变文书运转迟缓和档案管理分散、垄断的状况”[20]。数据管理则“另辟蹊径”,构建了全新的管理体系,致力于运用现代信息技术解决信息爆炸式增长的问题,侧重技术应用,逐渐脱离手工管理模式。文件管理强调文件的凭证性和文化性,从长远角度开展生命周期管控,只有少数文件才需要永久保存;数据管理强调文件的资产性与现实性,将文件视作一种可用多种方式进行开发利用的资源,[21]倾向于管理更多的数据,致力于拓宽数据的范围和边界。
在数据管理独立发展的初期,二者仍保持一定联系,早期信息系统和数据库中的数据通常来自传统载体形态的档案。但随着信息化的深入推进,二者的差异愈发明显。时至今日,档案管理和数据管理相对割裂已经成为普遍现象。在宏观层面,数据法规政策很少将档案管理纳入其中,而档案法规政策也很少考虑数据管理的需求。在微观层面,企事业单位等组织机构内部相继建立数据管理体系,虽在管理对象上与现有档案管理体系存在交叉、重叠,但在体制、制度、业务、资源、服务、技术、系统等多方面都存在相对割裂的问题。
二、档案与数据协同管理的现实动因
虽然档案管理与数据管理存在分歧,但同根同源,在数字化转型和智能化发展走向纵深的时代,二者又一次面临交汇融合的问题。从理论层面来看,数据与档案之间的法理联系和现实差异以及共有的资产视角要求协同;从实践层面来看,数字化转型发展需要协同理念,面临的共同难题促使协同,优势互补和方法相通支持协同,管理体系的相对割裂呼唤协同。
(一)档案与数据之间的法理联系和现实差异要求协同
从法理层面来看,档案与数据存在天然联系。《档案法》规定“档案是指过去和现在的机关、团体、企业事业单位和其他组织以及个人从事经济、政治、文化、社会、生态文明、军事、外事、科技等方面活动直接形成的对国家和社会具有保存价值的各种文字、图表、声像等不同形式的历史记录”[22];《数據安全法》规定“数据是指任何以电子或者非电子形式对信息的记录”[23]。对比发现,除档案界所谓的“实物档案”外,其他类型档案都符合数据的定义,因此,可在很大程度上将档案视为数据的一部分,即近似地认为档案属于数据、数据包括档案,如图1所示。
从现实层面来看,档案与数据存在显著差异。数字时代,档案管理系统通常采用非结构化数据解决方案。即便是结构化数据,通常也会被转为非结构化数据(如PDF等版式文件)进行归档保存。而在数据管理领域,虽然既包括结构化数据,也包括非结构化数据,但解决方案主要面向结构化数据,非结构化数据管理往往通过元数据等结构化数据实现。因此,实际工作中的档案与数据各有侧重、互不相同,档案资源以非结构化数据为主,数据资源以结构化数据为主,如图2所示。
档案与数据的法理联系和现实差异之间的“落差”要求协同。因为对组织机构来说,既需要非结构化数据,也需要结构化数据,需要在两种不同类型的资源之间建立关联,实现协同治理和开发利用。
(二)资产视角要求链接档案与数据管理
在数字化转型过程中,档案领域和数据领域都积极引入“资产及资产管理”视角。共同的资产视角要求将档案管理与数据管理链接起来。在档案界,国家标准《信息与文献文件(档案)管理概念与原则》(GB/ T 26162—2021,采标自ISO 15489—1:2016)将“文件”定义为“机构或个人在履行其法定义务或开展业务活动过程中形成、接收并维护的作为凭证和资产的信息”[24],将其理解为组织机构的业务活动凭证和信息资产。在数据管理领域,“数据资产(data asset)”首次出现于1974年;[25]国际数据管理协会(DAMA In? ternational)明确指出“数据是一种组织资产,如今的组织依靠数据资产做出更高效的决定,并拥有更高效的运营”[26]。在资产视角下,档案和数据都需要满足权属清晰、可流通等条件,都关注如何确权、如何增值、如何流通等问题,迫切需要展开合作与协同。
(三)数字化转型发展需要采用协同管理理念
信息技术与经济社会的交汇融合引发数据迅猛增长,数据已成为国家基础性战略资源。全球范围内运用数据推动经济发展、完善社会治理和提升政府能力正成为趋势。在数字化转型背景下,各类组织机构都面临着巨大变化和不确定性,机构内各部门、各领域、各要素无法“单打独斗”,亟须更新理念,迫切需要采用协同管理的思路实现跨部门合作、跨领域发展。档案和数据都在整个组织机构范围内形成和使用,二者应协同高效、相互配合。为服务整体数字化转型,档案部门需积极探索融入数据管理整体框架的路径方法,充分发挥档案管理在数据管理中的作用,将成熟理论、方法和工具运用到提升数据治理能力、推进数据共享等方面,激发数据要素活力,并将数据管理的方法、技术与工具引入档案管理活动中,释放档案管理与数据管理的协同价值,助力更高层级的数字化与智慧化发展。
(四)面临的共同难题促使档案与数据管理协同
档案管理和数据管理面临着共同难题,需要合力应对,共商发展策略和解决方案。
首先,二者都面临外在驱动力不足的难题。档案部门和数据部门的职能定位具有相似性,既不是数据形成者,也不是利用者,而是以第三方的角色为业务部门提供信息支撑和数据服务。二者都属于“成本中心”,无法直接创造经济效益,其价值需要经过转化才能实现,即通过赋能业务发展和经营决策推动效率提升和效益增加。因此,二者都面临来自组织机构的压力,需要得到高层领导的支持,并通过档案和数据的开放共享和利用服务等方式实现资产化增值,从而证明自身價值和效益。
其次,二者都面临与业务发展相融合的难题。在实际工作中,一方面,数据的归档采集难以融入业务流程,业务部门承担着较重的数据归档采集负担,从而影响业务开展效率;另一方面,档案和数据管理也存在不能充分释放数据资源价值,未能在业务部门需要时及时提供真实、准确、有效的数据支持的短板,使业务部门有“付出大于收获”之感,容易产生抵触和排斥心理。
再次,档案质量和数据质量普遍存在不足,难以有效满足业务需求。二者均对数据提出了较高的质量要求,但由于并不是数据的直接形成者,很难从源头保障数据质量。虽然档案部门在20世纪90年代就已提出前端控制、全程管理等理念与原则,但在实际操作过程中仍然受到各种因素的影响和制约。
最后,二者都需要平衡开放与保密、流通与安全的挑战。档案和数据的价值在于开放和流动,但前提是保障安全。近年来,党和国家实施网络空间安全战略,出台《网络安全法》《数据安全法》等法律,高度重视网络安全、数据安全等问题,强调自主可控,大力推进软硬件等信息基础设施的国产化,档案和数据工作都面临着巨大的安全保障压力。
(五)档案管理和数据管理的优势互补和方法相通支持协同
档案管理和数据管理各有优势、各有劣势,能够相互借鉴、取长补短。档案管理的优势在于,经过长期历史积累,已建立起完整的档案管理体系,有《档案法》《档案法实施条例》(修订中)等法律法规的保障,有国家档案局等发布的部门规章、规范性文件、标准规范等作为依据和参考,有完善的组织架构(档案局、档案馆、档案室等)和人才队伍,有配套的奖惩机制,有与档案事业发展相适应的档案学科建设,在档案质量管控、价值鉴定、归档保存、真实性保障、元数据、连续性管理等方面形成较成熟的管理策略、流程与方法;其劣势在于信息能力较弱,缺乏完整的信息化人才队伍,在有效应对数字化变革和数据化发展带来的冲击与挑战方面面临严峻挑战。而数据管理恰好相反,其优势在于信息化能力和数据开发能力;其劣势在于仍处于起步阶段,缺乏健全完善的管理机制和制度体系,尚未普遍理清哪些数据需作为资产进行管理,面临着数据质量不高、难以发现、利用不便、流通不畅等问题。
在管理目标上,档案管理和数据管理具有相似性和互补性,档案的“四性”(真实、完整、可用、安全)与数据的“六性”(完整、及时、准确、一致、唯一、有效)既有互通之处,也有互补之处。在管理环节和方法上,档案管理与数据管理都遵循生命周期的理论与原则,在业务流程中涉及许多共性管理活动和相通的工作方法,为协同管理奠定了基础。在形成获取阶段,二者均需精准识别管理对象,可同步开展排查工作,纳入归档范围的数据必然是重要数据资产,而具有保存价值的数据资产也应被纳入归档范围。在数据组织阶段,二者均需建立目录体系,用元数据对资源进行描述,以便于发现、定位和检索。在数据存储阶段,二者均需考虑数据的长期保存和持续可用,确保数据在需要时可发现、可读取、可解释。在数据使用阶段,二者均涉及数据检索、开放共享、利用服务等工作,且需要对数据进行分级分类,旨在平衡开放与保密的不同诉求。在数据处置阶段,二者均需基于数据价值,对数据的保管期限进行判定,并采取适当的措施对数据进行处置。此外,在管理人员设置、治理、风险管理、应急规划、合规性等方面,二者也有着共性的管理要求和方法。[27]
(六)档案管理与数据管理的相对割裂呼唤协同
在相对割裂的情况下,如果档案部门和数据部门的职能定位和工作边界不清,将会面临管理资源重复投入带来的资源浪费和效率低下等问题,业务部门也将“无所适从”。例如,在数据采集阶段,业务数据应归档至档案管理系统,还是进入数据部门的数据管理平台?如果既要归档,又要入湖,业务部门将重复工作。当数据不一致时,应以档案管理系统的数据为准,还是以数据管理平台中的数据为准?再如,在数据获取阶段,当业务人员需要利用数据时,应在档案管理系统中检索,还是在数据管理平台中检索?业务人员如何能够知道该从哪里获取数据?现有的两套管理体系常常使业务部门感到困惑和不解,迫切需要考虑如何更好地实现档案与数据的协同管理。一方面,档案管理的概念和方法可融入数据管理体系,并将在多年探索中形成的体系化知识贡献于刚刚起步的数据管理,弥补数据管理长期保存视角的不足;另一方面,数据管理的方法和工具也应融入档案管理体系,支撑数智赋能的档案知识服务。
三、结语
虽然档案管理与数据管理在信息化发展过程中各有侧重,逐渐形成相对独立的管理体系,但二者同根同源,协同管理有着深厚的历史根基;与此同时,在大数据时代,二者面临着又一次的交汇融合,受到多种内外动因的综合作用,协同管理势在必行。2022年3月,美国国家档案与文件署(NARA)发布评估报告——《机构首席数据官与文件管理项目的协调》,明确指出“以前认为文件管理和数据管理是不同的领域,彼此不同,现在应将其视为相关领域,需要在机构信息管理框架内进行协作、互惠和更紧密的整合”[28]。数据管理的兴起既是挑战,更是机遇,档案部门应将档案与数据协同管理作为推动档案事业转型升级的契机,将其视为未来档案工作发展的重要方向,并予以规划实施。
*本文系中国石油天然气集团有限公司软科学研究课题“企业档案与数据资产协同管理研究”(中油研20210211)的阶段性研究成果之一。
注释及参考文献:
[1]何思源,安小米.文件信息学:起源发展与批判反思[J].图书情报知识,2022(4):92-100;151.
[2]MCDONALD J. Records management and data management : closing the gap [J]. Records Management Journal, 2010, 20(1):53-60.
[3]王玉珏,吴一诺.档案法律融入数据法律体系的内在逻辑、问题与路径[J].档案学研究,2022(3):28-35.
[4]徐拥军,张臻,任琼辉.国家大数据战略背景下档案部门与数据管理部门的职能关系[J].图书情报工作, 2019(18):5-13.
[5]蔡盈芳.数据管理业务与档案融合管理研究[J].檔案学研究,2021(3):40-46.
[6]刘越男,何思源.科学数据与科研档案的管理协同:调查与思考[J].图书情报工作,2022(1):96-105.
[7]何思源,刘越男.科学数据和科研档案的管理协同:框架和路径[J].档案学通讯,2021(1):49-57.
[8]GRAY J. Data management: past, present, and fu? ture [EB/OL]. [2022-08-25]. https : //www.microsoft. com/en-us / research / publication /data-managementpast-present-and-future/.
[9] [19]DOGIPARTHI H. History of information governance [R/OL]. [2022-08-25]. https : //www. re? searchgate.net/publication/330844911_History_of_Infor? mation_Governance.
[10][11][15][16]COX R J. Closing an era: historical perspectives on modern archives and records management[M].Westport: Greenwood Press, 2000:25,29,31,36.
[12] [13]FRANKS P C.Records and information management [M] . 2nd. Chicago: American Library Asso? ciation, 2018:2.
[14][18]JULIUS S D.Evolution of records manage? ment and archive administration in Swaziland[D].Lon? don: University of London, 1991: 42,48.
[17]周雪恒.中国档案事业史[M].北京:中国人民大学出版社,1994:18-253.
[20]傅荣校.论三十年代南京国民政府的文书档案改革[J].档案学通讯,2005(1):87-90.
[21]DRAKE M A.Encyclopedia of library and infor? mation science[M]. 2nd.Boca Raton: Taylor & Francis Group, 2005:137.
[22]中华人民共和国档案法[EB/OL]. [2022-08-08].http : // www. npc. gov. cn / npc / c30834/202006/ 14a5f4f6452a420a97ccf2d3217f6292.shtml.
[23]中华人民共和国数据安全法[EB/OL].[2022-05-24]. http : //www. npc.gov.cn/npc/c30834/202106/ 7c9af12f51334a73b56d7938f99a788a.shtml.
[24]ISO 15489-1:2016Information and documenta? tion—Records management—Part 1: Concepts and principles [S/OL]. [2022-05-22]. https : //www.iso.org/ standard/62542.html.
[25]PETERSON R E. A cross section studyofthede? mandformoney: the United States, 1960-62[J].The Jour? nal of Finance, 1974,29(1):73-88.
[26]DAMA国际.DAMA数据管理知识体系指南[M].DAMA中国分会翻译组,译.2版.北京:机械工业出版社,2020:4.
[27][28]National Archives and Records Administra? tion. Agency chief data officer coordination with records management programs[R/OL].[2022- 08- 26].https:// www.archives.gov/files/records-mgmt/resources/cdorm-assessment-report.pdf.
作者单位:1.中国人民大学信息资源管理学院
2.中国人民大学电子文件管理研究中心