APP下载

浅论大数据背景下档案管理模式的发展及挑战

2022-05-30袁月林

科技创新导报 2022年18期
关键词:数据治理挑战大数据

中图分类号:G270.7DOI:10.16660/j.cnki.1674-098x.2205-5640-1709

作者简介:袁月林(1963—),女,本科,研究馆员,研究方向为档案管理。

摘要:大数据背景下,数据治理成为了国家、企业不可忽视的重要课题,技术革命催生了开放共享乃至人机协同的发展场景,对于档案管理而言也具有加大的影响。档案作为传统的记录,实质上也可以转化为数字化的电子数据,那么档案管理与档案数据管理的趋同性使得数据治理理念的融入成为了大势所趋,但是档案管理模式也具有其发展的背景、特點及挑战,本文以数据治理为视角,阐述数据治理与档案管理的内涵及发展,进一步探讨在此层面上档案管理事业所面临的挑战及应对策略,以期推动我国档案管理事业的更好、更快发展。

关键词:大数据  数据治理  档案管理  挑战  策略

On the Development and Challenges of Archive Management Mode in the Context of Big Data

—— A Perspective of Data Governance

YUAN  Yuelin

(Jilin Province People's Hospital, Changchun, Jilin Province, 130021  China)

Abstract: In the context of big data, data governance has become an important issue that cannot be ignored by the state and enterprises. The technological revolution gave birth to the development scene of open sharing and even human-computer collaboration, which also has an increasing impact on archives management. Archives, as a traditional record, can also be transformed into digital electronic data in essence. The convergence of archives management and archives data management makes the integration of the concept of data governance a general trend, but the archives management model also has its development background, characteristics and challenges. This paper expounds the connotation and development of data governance and archives management from the perspective of data governance, further explore the challenges and countermeasures faced by the cause of archives management at this level, in order to promote the better and faster development of the cause of archives management in China.

Key Words: Big data; Data governance; Archival management; Challenge; Strategy

1 “大数据”背景下的数据治理与档案管理

“大数据”的概念是在新兴技术发展升级带来的科技革命背景下诞生,在经历概念的逐渐演化后,其更多指向了技术的演变和使用,这些技术可以在众多冗杂、且呈指数增长的数据中,在正确的时间向正确的用户提供正确的信息。大数据具有数量巨大(Volume);结构化、半结构化、非结构化的多样性特征(Variety),以及传输速率快、实时性(Velocity)为代表的传统的“3V”特征,也具有数据或数据源质量、准确性及不确定性水平差异的特点,其质量和准确性(Veracity)的保证是重要的,与此同时,数据所具有的潜在价值(Value)也是另一大关键特征,也即“5V”特征属性。

由于数据产生、存储、分析、计算力等技术的提升使得数据的存在不仅仅作为不断累积的映射和记录的体现,数据作为重要的“资源”之一,其本身的价值以及其可带动其他产业转型的附加价值均得以进一步挖掘,例如政务数据的公共管理价值、科学数据的研究价值、商业数据的商业价值等,这些数据驱动的价值对于公共治理、科学研究范畴及经济领域等各领域具有不可小觑的重要意义,有学者发现数据要素已然成为实业、学界、管理界的重要研究对象,大数据范畴下的科技属性为诸多领域的产业带来资源重整、运行方式的变革[1],同时也推动了各领域向以数据依托的精细化管理发展[2],因此,数据在成为了其中新的价值元素,而围绕数据价值下的数据治理成为新的挑战。例如,我国学者从大数据价值发现的角度提出了4C(Collaboration)模型(数据协同、计算协同、分析协同、人机协同)进行数据价值发现,同时也指出治理层面所需要解决的伦理问题、智能系统行为等多重挑战[3]

2 数据治理视角下档案管理的内涵发展与转变

从传统的纸质档案资源通过光学字符识别(OCR),到数字化的电子档案资源,档案早已演化为“大数据”资源中的重要组成部分,“档案”与“档案数据”概念趋向统一。基于大数据背景下的数据治理视角,档案管理在数据治理的映射下,其内涵也可作为数据治理的一部分而得以丰富,同时,由于档案也是国家公共治理、社会治理的重要组成部分,需要达到现代化、智能化的水平,档案管理更是精细化管理的重要环节,而“档案治理”也因此应运而生,在我国2016年《全国档案事业发展“十三五”规划纲要》中,档案治理成为了档案事业发展的重要关键词之一[4]。在数据治理视角下的档案管理实际上就是针对档案数据治理,一方面脱胎于传统的档案管理,具有档案管理的特征,另一方面也与数据治理本质属性共通,具有明显的数据特征。从这两个角度出发,档案管理的内涵可从主体客体层面、技术理论与应用层面及法律规制层面的发展进行理解。

2.1 主体及客体层面

传统的档案管理具有明显的管理特征,是基于政府或企业本位,由相应管理者从事的具有垄断特征的管理事务,而治理更倾向于具有基于现代化管理科学的涉及公共或私人的多元化管理的特征[5]。因此,传统的档案管理的主体是档案部门,往往是单一主体,具有一定的垄断性和独立性,档案管理负责的档案信息往往以“孤岛”的形式存在,处于隔绝、无法交互共享的状态。而数据治理视角下的档案管理的主体往往会因为档案数据来源的分散性、档案数据本身的复杂性和多元性而拓展为多元主体,在一定程度上应当与数据治理形成融合和共振,例如政府与公众、不同的政府或企业部门之间等,对于单一的档案管理部门而言,更应当从数据价值挖掘的角度出发,探索管理的过程模式,而非仅着眼于所负责管理的档案本身,在某种程度而言,数据技术就是一种精细化的治理术,在这个意义上,档案管理者无疑面临更高的要求和挑战。

传统档案管理的客体也即档案信息,通常强调的是信息的稳定、安全性,但是数据治理视角下的档案数据需要具有开放共享的特征,强调的是数据背后蕴含的价值挖掘,运用数据技术进行安全、高效、智能化地收集、存储、分析、利用数据,可以发现,自2007年我国通过立法的形式公布《中华人民共和国政府信息公开条例》以来,政务信息的公开成为我国探索数据治理的重要里程碑,随着2012年上海构建全国首个政府数据开放平台的落地,我国的各级政府数据逐步开放,透明化的政府信息、让阳光照进政务已成为现实,精细化管理逐步得以实践。在这一趋势之下,我国的档案数据开放计划也成为了“十三五”工作要点之一,电子档案“单套制”管理的变革也是基于数据开放流动、数字化发展的需求而提出,逐步将实体运行方式转化为数字化的虚拟运行模式[6],大数据所具有的虚拟替代属性也在档案管理范畴内得以体现,这种虚拟化的数字客体,可以充分利用互联网的优势,实现动态精准地调配与利用,同时易于实现有序的组织与开放共享,从主客体范围的拓展,进一步提升治理能力,丰富档案管理内涵属性的边界。

2.2 技术理论与应用层面

大数据时代的核心关键词之一就是计算分析,大数据的分析主要包含4种类型[7]。第一为描述性的分析,也即描述已经发生的现象,是对过去现实状态的一种收集和记录,在一定程度上,描述性的分析手段可以纪念馆一定的未来趋势的推断。第二为诊断性的分析,是针对某个问题的分析,找到某种问题的发生原因。第三为预测性的分析,它使用既往的数据预测未来可能发生的事件,其主要应用的技术包括数据挖掘、人工智能技术等。第四为整合性的分析,也即依托于现有数据的呈现、预测,以及对问题的识别与判断,加以整合分析出最佳的解决方式或发展路径。按照以上4种分析类型,不难构建出大数据背景下,从数据治理角度出发,对档案管理的技术的应用。

在具体的应用技术层面,由于区块链本身的特征属性,对于档案管理的真实性、留痕可追溯性、多方维护、公开透明等要求具有较高的匹配度,因此区块链技术是应用于档案管理的较为常见的技术。美国、英国等国家都逐步搭建了档案管理引入区块链技术研究的项目,同时国内也形成了鼓励发展的政策环境,我国学者也积极展开了相关的科研工作,涉及了技术研发、理论构建等内容,无论是对区块链技术本身的概念拓展、还是对具体适用场景的探索,均形成了一定的科技成果[8]。围绕区块链技术在档案管理中的应用,调研发现,中国石化[9]作为国有企业先行探索,从2017年开始就区块链技术与业务结合可行性进行探索研究,2018年主要基于Fabric的联盟链技术,在企业内部选取了多家节点完成私有链的搭建,在电子档案的真实性保障层面体现了较高的优势,也由此衍生出了诸如具有身份认证及合同签约、全流程上链、信息不可篡改、可公开验证等特点的区块链电子合同等应用,使得档案管理不仅实现了传统功能,更通过技术的引进,在应用的层面上形成了动态的治理优化。除此之外,可以发现,随着人工智能技术的发展,智能化平台的搭建,以及构建“智能+档案”成为了数字科学领域发展的关键,我国在档案管理智能化的发展实际上也取得了一定的进展,例如2019年研制成功的档案智能运维机器人、智能芯片、档案库房智能化管理等[9],均为高效、智能管理提供了技术保障,也充实了档案管理的內涵。

2.3 法律法规标准规制层面

正如前文提及数据治理概念面向的客体为数据资源,国际数据管理协会(DAMA)也指出这种行为属于权力和控制的范畴[10]。但是对于档案管理而言,在大数据背景下,其更在于权力的下放,而非形成“数据霸权”。首先,在数据治理视域下的档案管理首先应达到数据的标准化级别,以及构建完善的体系。在我国的基层组织中,数据管理的“孤岛”现象是较常见的[11],在一方面反映出了数据标准化级别尚需要提高,一方面也反映出基层工作者所面临的巨大的挑战。数据标准化的构建需要通过国家档案部门进一步规范国家标准。例如,我国国家档案局在2019年发布的《电子档案管理系统基本功能规定》以及相关标准文件,同时地方、机构也可依据现有资源逐步完善体系的构建。其次,从法律法规的角度,应格外注意到档案管理客体丰富的同时,其可能引入的敏感信息所带来的隐私问题、数据安全问题及数据伦理问题。可以发现在信息技术较为发达的现代社会,通过多种渠道提取个人信息已不再是难事,一张照片也可能包含海量的信息,这就提示了档案管理者甄别重点数据对于保障数据安全和避免隐私风险是较为重要的,如除了传统档案数据可能涉及的个人身份信息、行程信息等个人隐私信息之外,尤其需要注意生物识别信息的处理,声音、面容等信息也可以通过技术手段实现个人信息穿透,进而泄露隐私。最后,就数据治理视域下的档案管理,往往会涉及一定程度的公开共享、挖掘分析,那么就涉及数据开放共享的相关方与个人的权益,那么某些档案数据的开放共享的范围、对象及背后的合理性就需要得到具有一个合法合理的依据,这种合理性分析在某种程度上也可保证数据开放的合伦理性,对于档案管理而言是需要进行不断完善的。

4 数据治理视角下的档案管理模式挑战及策略探索

4.1 档案数据本身的特性

正如前文所述,档案数据也是构成“大数据”的重要组成成分,实际上,档案数据的增长速率也不容小觑,目前,尽管已经逐步形成了电子档案数据的“单套制”,但是由于我国地区发展不均衡,仍存在大量依赖人工进行纸质档案向电子档案转化的情形,这种背景使得数字化档案的转化效率较低,同时也较易产生错误、遗漏等准确性方面的失误[12],对于大数据背景下的档案管理而言,准确性程度的降低,容易造成较严重的判断、预测等分析偏差。同时,随着技术的发展与普及,半结构化、非结构化的数据量较大,且通常以多种组合方式与结构化的数据进行融合,数据的标准难以统一。

面对这种挑战,构建统一的标准是解决方式之一,但是在短期内难以实现全国广泛范围内的普及,较为折中的方式是跨区域内、分段式达成标准规范协作共识,达成面向区域内受众的功能实现。其次,也应当逐步推动借助智能化的手段,提升电子数据转化的质量,引入自动机器人进行初步工作,人工后期介入检验复核是具有一定可及性的。与此同时,由于我国的档案数字化发展并不成熟,许多基层地区仍存在显著的“数据孤岛”现状,鼓励基层对理论和实践的不断探索,提高工作者的数据素养也是较为重要的,如何从心态上转变传统的工作思路,再到实践中积极学习先进技术知识并加以应用,是提升我国整体档案管理水平的关键。

4.2 技术的成熟度及被接纳度尚待提高

尽管区块链等高精尖技术的引入,为档案管理模式的优化带来了新的契机,但是技术从诞生到完善往往需要较长时间的测试、融合阶段,以区块链技术[13]为例,其优势之一即为不可篡改,但是并不是绝对意义上的不可篡改,技术始终是存在漏洞的,例如公链平台的双花攻击,这种攻击方式可能会通过状态机不一致执行等方式完成,智能合约平台也会因此在网络中形成分叉,造成技术层面的损失和无法估计的不良后果。同时,随着技术的不断更迭,新技术的诞生可能会对旧技术带来颠覆性的改变,人机交互与智能化的发展速度是较快的,未来技术的变革也需要在前期做好基础准备,这无疑是对技术层面的必然要求。但是目前我国的档案机构对于第三方技术的合作维度仍需提高,跨界合作是迎接未来新技术的关键环节,如何提高自身水平识别判断第三方档案科技企业的产品和促成合作,值得档案管理者探索。

对于新兴技术产业而言,从实践中不断积累,研发不同的策略应对技术上存在的漏洞,并针对不同的风险制定等级制度、备份计划提供更完善的服务方式,有利于自身的成长和提高档案管理部门或机构的信赖和接纳程度。而对于档案管理部门或机构而言,引入人才、重视交叉学科人才的培养及对档案管理新模式的积极探索,才能够满足国家对于档案事业发展的需求,实现内部机构与外部企业及智能化档案管理受众等的合作多赢。

4.3 档案相关政策法规制度有待完善

实际上,我国对于数据安全、网络安全个人信息保护等领域均已逐步完成了顶层设计的立法工作,基于相关法律和政策可以发现我国对于数据资源的重视程度是较高的,但是档案相关的政策法规制度仍有待完善。尽管就档案而言,从领域上仍可划分为学生教育档案、病人档案(病案)、社会保障档案等多种形式,且不同分类皆具有其特点,数据标准难以统一,制定政策具有一定难度,但是档案数据的政策法规制度也应在实践中逐步完善与宣讲,无论是按照领域还是按照年龄,抑或是按照个人全生命周期的管理,促进制度的完善对于基层的档案管理模式的转型与科学深化发展是尤为重要的,也将有利于实现我国档案管理事业的更好、更快发展。

参考文献

[1] 王谦,付晓东.数据要素赋能经济增长机制探究[J].上海经济研究,2021(4):55-66.

[2] 锁利铭,冯小东.数据驱动的城市精细化治理:特征、要素与系统耦合[J].公共管理学报,2018,15(4):17-26.

[3] 刘业政,孙见山,姜元春,等.大数据的价值发现:4C模型[J].管理世界,2020,36(2):129-138.

[4] 金波,杨鹏.大数据时代档案数据治理研究[J].档案学研究,2020(4):29-37.

[5] 俞可平.全球治理引论[J].马克思主义与现实,2002(1):20-32.

[6] 陈艳.我国省级档案数据治理体系框架构建研究--基于浙江省实践的研究[D].济南:山东大学,2020.

[7] RIAHI Y . Big Data and Big Data Analytics: Concepts, Types and Technologies[J].Marwah Infotech,2018(9):524-528.

[8] 刘越男,张一锋,吴云鹏,等.区块链技术与文件档案管理:技术和管理的双向思考[J].档案学通讯,2020(1):4-12.

[9] 史江,罗紫菡.“智能+”时代档案管理方法创新探讨[J].档案学研究,2021(2):54-59.

[10] 雷浩伟,廖秀健.数据治理视阈下数据权力与数据权利研究:存续逻辑、冲突悖论与完善进路[J].科技与法律,2021(5):22-33.

[11] 吳黎明.大连市民生档案数据整合利用问题研究[D].大连:大连理工大学,2020.

[12] 周林兴,林凯.大数据时代档案数据质量控制:现状、机制与优化路径[J].档案与建设,2022(2):4-8.

[13] 李春艳,乔超.区块链技术在大型企业集团电子文件管理中的应用——以中国石化为例[J]. 档案学通讯,2020(1):13-20.

猜你喜欢

数据治理挑战大数据
基于本体的企业运营数据治理
云端数据治理初探
叽咕乐挑战
叽咕乐挑战
基于大数据背景下的智慧城市建设研究
大数据治理模型与治理成熟度评估研究
叽咕乐挑战
大数据时代城市治理:数据异化与数据治理
第52Q 迈向新挑战