融合与转型是大数据视域下档案工作发展进路
2022-08-29中国海洋大学档案馆王文越
文/中国海洋大学档案馆 王文越
伴随着5G、大数据、云计算、互联网、物联网等信息技术的革新浪潮,“作为新型的生产要素,数据在未来必将进一步成为推动国家、企业和社会取得可持续发展竞争和发展优势的重要动力源”。全方位的“数据化”趋势催生出“档案”与“数据”的相关议题,正如英国国家档案馆的Sonia Ranade所言:“我们正从档案数据为元数据且文件的价值被锁定在扫描图像或纸质载体中的世界转变为可以对整个文件进行挖掘和分析的世界。”笔者认为,在数据时代的冲击下,“档案”与“数据”并非零和博弈,传统档案行业和档案工作者如何重塑自身角色定位,转型增值,如何将“档案”与“数据”交叉融合,改变“独狼式”工作模式,多元协商协同发展,助推档案事业全面纳入国家大数据战略,是摆在传统档案行业和档案工作者面前全新的机遇与挑战。
一、大数据视域下档案工作发展现状
大数据研究热潮始自2012年美国政府启动的“大数据研究和发展计划”,随之席卷全球。2015年8月31日,《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50号)正式公布,“是我国促进大数据发展的第一份权威性、系统性文件。”明确提出在未来5~10年推动大数据发展和应用逐步实现,建立以用数据说话、决策、管理、创新为内核的管理机制,成为“推动经济转型发展的新动力”“重塑国家竞争优势的新机遇”“提升政府治理能力的新途径”。2015年10月,中共十八届五中全会将大数据上升为国家重要战略。2016年3月,又将其作为专章列入《国民经济和社会发展第十三个五年规划纲要》,7月,中共中央办公厅、国务院办公厅印发《国家信息化发展战略纲要》,大数据作为国家重要基础性战略资源,对中国经济社会发展的时代意义逐步明晰,标志着我国数据红利大规模释放时代正式到来。自此,国家层面相关政策、文件的陆续出台进一步为大数据的发展“保驾护航”,助推国家大数据战略“落地”和“结果”。国家档案局紧随国内外大数据飞速发展步伐,在《全国档案事业发展“十三五”规划纲要》中明确提出要“探索电子档案与大数据行动的融合”“制定档案数据开放计划”“建立档案数据安全制度”。2021年6月,《“十四五”全国档案事业发展规划》进一步提出要“推动档案全面纳入国家大数据战略……实现对国家和社会具有长久保存价值的数据归口各级各类档案馆集中管理……”对档案事业发展起到战略导向和引领作用。2021年,新修订的《档案法》实施,新增第五章“档案信息化建设”,明确规定电子档案的法律效力和凭证作用,这是国家第一次从法律高度对档案信息化建设做出全面系统的阐释,旨在回应以数字化、网络化、智能化为特征的信息化浪潮,为推进档案管理数字化转型提供法治支撑。可见,大数据正以不可逆的态势成为激发当前国家社会改革发展的动力源泉,也被认为是档案学学科建设、理论研究与档案实践发展的新增长点之一。
二、“档案”与“数据”的概念与内在关联
笔者通过文献研究法、案例分析法和比较分析法等开展研究,认为清晰界定“档案”与“数据”的内涵与外延,厘清两者的交叉点及其关系是在大数据背景下档案突出职能特性和发挥不可替代作用的前提和必备条件,是亟须解决的首要问题。
笔者以新修订的《档案法》中的档案概念与新颁布的《数据安全法》中数据概念进行比较,《档案法》中第二条明确规定:本法所称档案,是指过去和现在的机关、团体、企业事业单位和其他组织以及个人从事经济、政治、文化、社会、生态文明、军事、外事、科技等方面活动直接形成的对国家和社会具有保存价值的各种文字、图表、声像等不同形式的历史记录。而《数据安全法》第三条明确指出:本法所称数据,是指任何以电子或者其他方式对信息的记录。基于以上两个概念,笔者分析认为:首先,档案中对于“各种文字、图表、声像等不同形式的历史记录”都属于数据中对于“任何信息的记录”的广义范畴。而数据在其全生命周期管理过程中体现出的实际业务操作的决策参考、数据整合归集的开放共享、学术研究的理论溯源和佐证等多元价值恰与档案概念阐释的“对国家和社会具有保存价值”不谋而合。因此,对国家和社会具有保存价值的数据才可能被归档,成为“档案”。“档案”也是具有长久保存价值的“数据”。其次,国际上,加拿大早在1998年就已颁布《统一电子证据法》,直接将“电子文件”和“电子数据”等同起来。国内,根据中共中央办公厅、国务院办公厅联合印发的《电子文件管理暂行办法》(中办发〔2009〕39 号) 和国家档案局印发的《电子档案移交与接收办法》(档发〔2012〕7号),作为档案重要组成部分的电子档案是指“具有保存价值并归档保存的电子文件”。内容、结构、背景等三要素齐全的“电子文件”是优质的“电子数据”。所以“电子档案”即“电子数据”,“数据态”是档案的存在形态之一。可见,“档案”的概念与“数据”的概念存在明显交叉。从而决定了两者的关系不可能泾渭分明,必然走向协同融合。
三、大数据视域下档案管理利用实践分析
(一)山东省大数据建设。在大数据背景下,2019年初,山东省数据大厅在原省档案馆政府公开信息查阅中心基础上改造升级建设而成,由山东省政府办公厅、省档案馆和省大数据局共同参与,旨在整合、优化、共享全省政务信息资源,开辟档案工作与大数据协同融合发展的新思路,是山东省积极融入国家大数据战略的有效探索。时任山东省委书记刘家义在省数据大厅调研大数据建设和应用工作时强调:“数据是国家、社会的资源……彻底打破部门垄断、数据分割和信息烟囱林立,真正让大数据应用深入‘神经末梢’,实现数据开放共享、便民利民。”此外,2021年底,在国务院电子政务办安排部署下,“沪鲁通办”档案查询上线试运行,由省内至省际,打通信息孤岛,实现了山东省和上海市不同省际平台间档案利用服务“一网管全域”“一网通办”,这是档案资源跨省双向开放与大数据建设相结合的又一重要举措,是档案信息资源共享与大数据应用领域新的融合典范,为全国一网通办的顺利建成提供服务平台流程再造和模式创新等参考。可见,山东省大数据建设应用为档案信息资源的管理利用带来新的契机,有助于突破传统档案工作模式的窠臼和藩篱,进一步发挥和强化档案服务功能,“让数据多跑腿”推进档案服务民生质效逐步提升。
(二)中国商飞。科研数据与档案管理利用的协同优势在企业发展中尤为突出。以中国商飞为例,中国商飞公司作为大型客机项目的主制造商,在其整个大型客机项目研制过程及各参研单位的工作中形成了海量的科研数据,这些科研数据为各参研单位承担项目及关联环节提供生产依据和技术保障,具有重要价值且共享度高。如何将海量科研数据归档、管理、利用好,是企业档案部门工作职能的创新延伸和转型趋向。档案部门在参照传统档案“收、管、用”工作的基础上,注重提高档案的信息化程度。档案部门就像一个数据枢纽,向有利用需求的各参研单位发送传递科研数据,在数据传递中越来越多地承担数据的有效性、一致性、完整性、可追溯性的工作职能。大型客机的数据利用都将以档案部门归档、保存数据为依据和准绳。在档案管理利用模式下的科研数据体现出精准、高效、实时、多样交叉等特点。科研数据与档案管理利用的协同优势推动档案部门摸索出科研数据档案管理特点及规律,制订一系列科研数据档案管理办法及规定,促使档案部门工作组织结构以及职能行使得到拓展提升,从而在中国商飞大型客机项目的研发和应用中发挥出更为积极的作用。
(三)长沙市轨道交通集团有限公司。长沙市轨道交通集团有限公司将客票、设备及工程数据与档案管理利用相结合,作出了很好的尝试和表率。该公司遵循档案收集管理利用的基本原则和方法,注重轨道交通有关数据的实时收集,及时归档,科学管理,方便利用。首先,利用归档的客票数据分析地铁1号线客流分布情况,其中按年度同比统计客流分布特征,按月度环比比对客流分布状态,根据数据分析结果,针对客流高峰期和节假日提前制订调流预案和安全措施。其次,通过建设项目档案数据开展所有扶梯故障原因和故障等级评估分析,统计扶梯故障原因、等级、时间、频次、生产厂家等数据,以及扶梯故障原因占比分析,包括硬币、残留物、产品质量及人为因素等,形成故障维修类档案,为企业提前预判、规避购置、排查扶梯隐患等提供借鉴。再次,依照长沙地铁2号线一期工程土建工程设计变更档案数据,分析统计变更标段、类型、位置、频率、原因等数据,为顶层设计、生产经营、项目开发和利用提供决策支持。“档案”与“数据”协同融合的成功实践,展现出传统档案行业和档案工作者在大数据背景下的发展机遇,同时也面临挑战。
四、大数据视域下档案发展路径探索
当前,有关“档案”与“数据”的问题在行业内展开探讨,赵跃在《“档案数据”一词的使用语境与学科内涵探析》一文指出:“数据管理不在档案机构的职能范围内……档案学科更应该输出的是数据档案化管理的要求、理论知识与方法指导。”部分学者则强调,档案机构应当在大数据管理体系中占据主体地位。笔者认为,如何回应大数据的最终归属问题不是一蹴而就的。就目前而言,“档案”与“数据”两者将会在协同融合道路上长期共存。传统档案行业和档案工作者如何重新确定边界,重塑自身定位和把握转型方向,是优先于大数据最终归属且需理性思考的问题。
(一)边界重新确定。加拿大档案理论家休·泰勒(HughTaylor)说:“只有无限探索和拓展,触碰整个档案行业的局限……我们才能逃脱死水一潭的状态。”在大数据背景的影响下,档案边界问题的深度和广度不可避免地被重新定义。首先,档案管理目的的边界,由原先的长期保存、凭证作用、历史文化价值等延伸至满足数据管理需求层面。其次,档案法治边界的拓展要确保目前的档案法律与数据治理体系相融合,挣脱传统数据、档案、信息等的概念桎梏,立足保存与利用中的现实问题,避免进入长期保存阶段后,档案管理法规与前期数据流通过程中的法规产生矛盾,始终保证数据全生命周期治理标准的一致性,尤其是将重要数据归口到档案数据对应环节后的分类管理,是亟待重点协调的部分。再次,传统档案部门和档案工作者要突破将“归档”作为工作起点的固化思维,主动将档案部门对数据质量管理、长期保存等要求向数据处理前端即数据质量控制过程迁移,不仅要对归档以后的数据进行协调和管理,也要对正在流通过程中的数据进行管理集成,以期档案和数据尽可能在管理运行体系全流程中达到和谐统一。档案边界的重新确定促使传统档案行业和档案工作者开始审视调整自身角色定位。
(二)重塑自身定位。笔者认为,当前传统档案行业和档案工作者亟须审视调整自身角色定位以应对来势汹汹的数据浪潮,主要是针对档案人员素养进行重塑。首先,档案管理意识理念应由以保管、被动服务为导向向以利用、主动服务为导向转变。在中国古代,档案被“登于天府”“置之宗庙”“藏于金匮”。如今,档案不再被“束之高阁”,切实成为与国家富强、社会安定、民生保障息息相关的重要资源。在数据要素日新月异的关键时期,档案人员的意识理念应主动随之变换,契合国家大数据战略发展思维和趋向,真正为档案事业的未来发展谋求一席之地。其次,对于档案数据管理方面的知识储备相对匮乏,需广泛研读借鉴信息治理、数据治理、数字记忆、数字人文等理论,涉猎现代信息技术等相关研发应用,为档案数据管理的良性运转和转型奠定扎实的理论基础。再次,注重数据技术的探索和提高。“数据密集型”范式的大量应用为档案数据管理带来影响。以可视化技术为例,2014~2016年,“可视化”连续三年入选大数据发展十大趋势,“可视化推动大数据平民化”位居2016年大数据发展十大趋势榜首。Lemieux指出,现在正是探索新技术与新实践在档案活动中的绝佳时刻。他认为,可将可视化分析技术应用于档案整理与著录。可见,数据技术的探索和提高为档案数据管理开阔了革新空间,提供了精准的技术支撑。
(三)把握转型方向。笔者认为,在数据时代,传统档案行业和档案工作者的转型主体来自于档案服务领域。档案服务始终是档案全生命周期价值的最终体现。当前,档案数据化并不仅限于单纯的技术研发层面,而是基于人工智能时代,由多元主体参与、多模式协同,档案服务体系整体创新转型框架,将推动档案服务工作需求由粗粒度的档案文档服务模式,运用数据科学理念与方法驱动,最终切换到细粒度、智能化的档案数据服务模式,从根本上解决传统档案文档内容分散、零碎问题,满足用户档案数据化利用新需求,提升档案数据化开发利用服务能级,构建档案资源由“模拟态”经“数字态”向“数据态”转型的“档案数据生态链”,为新时代档案数据化发展提供指引。
五、结语
大数据时代对于档案的影响重大而深远。笔者认为,“档案”与“数据”并非零和博弈,而是在协同融合道路上长期共存,如何有效地拥有、管理、整合、挖掘档案数据资源,让“每一个数据都在互联网上获得生命、产生智能、散发活力和光彩”,是传统档案行业和档案工作者认真思考、探寻和修正的重点,也是未来档案事业全面纳入国家大数据战略的关键一步。