国内外档案数据治理研究综述
2022-04-21周林兴谢林蓉
周林兴 谢林蓉
摘 要:通过文本内容分析法对档案数据治理主体、质量治理、安全治理、开发治理、共享治理、治理体系、治理策略等7个主题进行解析,归纳国内外档案数据治理研究现状和进展。总结发现国内外档案数据治理研究总体处于起步阶段,因此从研究方向、研究视角、研究对象、研究框架、研究性能等方面对各主题薄弱之处提出完善思路,做出深化档案数据治理研究内容、丰富档案数据治理研究方法以及强化档案数据治理对实践的指导性等未来研究展望,以期为档案数据治理研究成果和实践发展提供借鉴。
关键词:档案;档案数据;档案数据治理
分类号:G270.7
A Review of Archival Data Governance at Home and Abroad
Zhou Linxing, Xie Linrong
( School of Cultural Heritage and Information Management of Shanghai University, Shanghai 200444 )
Abstract: Through text content analysis, this paper analyzes the seven subjects of archival data governance, including the main body of archival data governance, quality governance, security governance, development governance, shared governance, governance system and governance strategy, and summarizes the research status and progress of archival data governance at home and abroad. It is concluded that research on archival data governance at home and abroad is generally in its infancy. Therefore, suggestions are put forward to improve the weaknesses of each subject from the aspects of research direction, research perspective, research object, research framework and research performance. In order to provide reference for research results and practice development of archival data governance, the paper puts forward future research prospects such as deepening the research content, enriching research methods and strengthening the guidance of archival data governance to practice.
Keywords: Archive; Archival Data; Archival Data Governance
1 引 言
數字信息技术发展日新月异,数据价值愈加凸显,为充分释放数据价值,各国陆续展开数据治理行动。档案事业作为国家治理体系的重要组成部分,必须顺应这一趋势,做出新的布局规划,以档案数据治理全面推动档案治理体系、资源体系、利用体系和安全体系的建设。[1]
为更全面地了解国内外档案数据治理研究情况,采用 SU=((“档案数据”+“治理”)OR(“档案数据治理”))OR FT=(“档案数据治理”)、主题:((“档案数据”)and(“治理”))or(“档案数据治理”)(万方),并将“file data”或“record data”或“archiv* data”与“governance”组合,作为主题词或标题词,对中国知网全文数据库(CNKI)、万方数据知识服务平台、Web of Science、Springer LINK、Wiley 等数据库进行网络资源调查。起始时间不限,截至2021年11月10日,共获得50篇有效中文文献,32篇外文文献。所获文献主要集中在主体、质量、安全、开发、共享、体系、策略等7个方面,因此文章选取这些主题进行分析,以总结档案数据治理经验。
2 档案数据治理研究主题分析
2.1 档案数据治理主体
该主题研究重点关注治理主体的权责重构和各类档案数据主体的协调治理举措。在互联网用户拥有沟通和决策参与权、海量数据冲击以及治理格局形成的情境下,主体多元化特征凸显。[2]档案部门承担统一领导和协调分权的职责,[3]应该分权、赋权,主动建立数据治理格局中多主体协同关系。[4]各数据治理主体之间应强化协调效应,通过现象驱动方法构建主体数据访问关系,[5]聚焦核心主体,协调其在采集、评估和研究过程中的职责关系,[6]统筹决策者、管理者、使用者和志愿者的数据需求,[7]建立区域联盟发展模式,[8]努力强化践行共同体理念。[9]
可见,档案治理主体正在积极顺应数字化和数据化的主流发展趋势,不断将档案治理纳入国家治理大格局、大体系和大框架之中,明确各方参与主体,树立多元协同理念,并从决策、管理、实施、协调、利用等层面入手,进行了主体权力责任和职能的分工。
2.2 档案数据质量治理
该主题研究主要涉及治理内容、各维度治理建议与各类档案数据治理重点。在治理内容方面,提出了真实全面、安全可靠、系统可用等性能指标以及从生成到利用的过程质量。[10]在治理层次方面,上层建筑维度亟待建立能够包容多源异构档案数据的工作机制,制定相关制度规范,确立评估标准,设定技术保障系统;[11]基础设施维度需要融合人工智能,运用模式识别、机器学习、自然语言处理等技术,[12]把控过程质量。[13]在各类档案数据治理重点方面,针对电子健康档案数据,将完整性、正确性、一致性、合理性、时效性[14]、可获得性、合理性[15]纳入了评估框架;针对企业档案数据可能存在的冗余等问题,[16]提出需构建整体性检测框架,进行阶段性分析和管控。[17]
可见,档案数据质量治理依然基于传统宏观视角,以制度、机制、规范和技术等为切入点。未来可以从政府、企业、医疗、教育领域汲取经验,综合考虑机构、平台和用户需求,划定系统全面的质量评价标准,选定智能技术并建立数据试验模型。
2.3 档案数据安全治理
该主题研究主要围绕概念界定、现代技术应用、重点工作环节以及各类档案数据安全治理实践。在概念解读方面,档案数据安全治理是指档案机构对档案数据实施专业管控,维护其静态和动态安全,有效实现档案数据价值。[18]在新技术融合方面,智能技术和手段的应用存在数据获取缺乏身份认证和监审等问题,[19]为此可以设计加密系统,做好用户审计和追踪,简化和精确元信息导入,利用密文检索和调阅等技术。[20]在重点工作环节方面,有学者提出要改善备份机构的层级设立,深化备份业务;[21]还可以引入能力成熟度模型,不断提升档案数据安全治理标准和能力。[22]在各类档案数据安全治理实践方面,有学者研究电子邮件档案数据账户行为模型和挖掘分析系统;[23]还有学者研究制造数据读取器的测试结果,利用波长技术重组数据集,创造安全加密、数据压缩和简单恢复功能等。[24]
可见,汲取计算机等相关学科经验,有针对性地设计研究方案和模型,对于改善档案数据安全治理成效具有很大价值。未来研究需继续紧跟数字化和智能化研究导向,并逐步提高与实践项目的联系紧密性和治理战略的普适性。
2.4 档案数据开发治理
该主题研究主要涉及意义、理念方向、开发模式和方案制定。在开发意义方面,研究指出档案数据开发能够帮助国家和组织应对信息技术革命对政治、经济、文化和社会等各方面带来的影响。[25]在理念方向上,指出必须树立主动输出档案数据的开放理念、注重挖掘整合的档案理念以及关注价值开发的服务理念。[26]明确创新驱动、个性开发治理方向,强化队伍、馆藏、建筑和技术的开发利用。[27]在开发模式方面,提出需要探索新型模式,建立开发者之间的协同信任,创造多元治理结构,并强化利益平衡和成果融合。[28]在开发方案上,提出应结合文档检索和分类方法、[29]企业模式和技术创新[30]等领域研究成果,更进一步实现开发价值和效益。
可见,现有研究对档案数据开发意义的揭示更多停留在信息社会大背景层面,尚未能细化开发价值,同时开发模型的建立缺乏与新技术的深度融合。
2.5 档案数据共享治理
该主题研究主要基于数字记忆、区块链技术和实践经验三个视角,认为档案数据是数字化形态的新型档案资源,[31]既参与功能记忆的构建,又是存储记忆的构成。[32]意识到区块链技术的去中心化、共识机制、多链配合等功能契合档案数据共享需求,[33]能有效应用于公共服务领域档案治理。[34]此外,有学者以英国NHS健康档案数据为例解析了政府行政档案数据共享中的信任平衡抽象系统,指出了公众信任建立方法,[35]从需求导向、技术采纳和群体合作三方面构建了共享实施方案。[36]
可见,档案数据共享治理研究既涉及学科前沿理论视域,又兼顾国家和社会有关实践探索。但各视角下的文献数量较少,内容比较单一,需加强现有研究深度,结合相关学科理论,寻找共享治理新视域。
2.6 档案数据治理体系
该主题研究主要涵盖治理体系建设的必要性、能力体系的构建和全局思维的培养。在体系建立必要性方面,提出有利于协调治理要素,明确目标导向、标准规范、范式机制和服务模式。[37]在能力体系构建方面,提出可以分解治理能力因素,构建宏观和微观能力结构体系,提升统筹协调、制度建设、组织管理以及开放处置等治理能力。[38]在全局思维培养方面,提出需统筹兼顾国家数据资源体系构建和文化强国建设需求。[39]同时,档案数据治理应构建“生态层-基础层-数据层-应用层”体系,[40]设计存档收集、[41]聚合评估[42]等系统框架,形成完整的治理体系。
可见,档案数据治理体系研究逻辑清晰,从上层机制出发,逐步聚焦数据处理流程。但普適架构研究数量较少,研究方向较为局限。未来可从数据源管控和数据长期保管需求出发,进一步深化理论探索。
2.7 档案数据治理策略
该主题研究主要从加强法治化、制度化、科学化、专业化与协同化五个方向出发提出对应策略。首先,要强化法治建设。做好战略规划和布局,制定法律法规,及时补充、更新、细化有关规范标准和工作实施条例。[43]其次,要建立制度模式。规制清单制度,序化职能制度。[44]再次,要优化环节治理。利用人工智能技术记录和识别数据并应用于服务模块和接口。[45]此外,要创新平台设计。以提高工作效率,降低协作难度,增强风险保障、提升用户体验为目标,突出重要节点,制定数据结构模板,选择适用技术。[46]最后,要重视建设治理队伍。明确治理人员梯队及其职能分工,形成协同规范的档案数据治理组织格局。[47]
可见,档案数据治理策略研究内容较为集中,大多以顶层-中层-基层为线索分析可行路径。未来有必要继续以相关主体和全局过程为对象进行策略研究,形成高包容性、高借鉴性和高规范性的研究成果。
3 研究展望
3.1 深化档案数据治理研究内容
档案数据治理研究起步时间较晚,成果并不成熟,需要进一步深化研究内容。同时,提升理论研究层次,融合国内外治理战略和实践特色,准确阐释内涵、目标、价值、特征等基础概念,深化体制机制和模式体系的制定和设计研究。此外,还要在适度借鉴国外经验的基础上,结合自身国家制度和治理实践的特征需求,平衡研究方向。
3.2 丰富档案数据治理研究方法
现有成果所用研究方法比较单一,需要丰富和加强研究方法的选择和运用。首先,定性研究需明晰治理体制、治理模式、实现机制、建设体系和提升路径间的关系,建立完整的档案数据治理框架。其次,需增加定量研究方法的使用,提高研究成果的可靠性和科学性。最后,需扩展运用比较研究法。对比分析不同国家、不同领域档案数据治理现状,总结优势和经验,充实研究成果。
3.3 强化档案数据治理研究指导性
档案数据治理研究的重要目标之一是服务档案数据治理实践,因此必须强化研究对实践的指导作用。首先,要充分发挥实证案例的经验价值。研究相关机构和地区的档案数据目录、数据中心、数据共享利用系统平台建设情况,实现实践经验成果化。其次,要契合国家治理理念和社会经济发展需求。进一步做好顶层设计研究,规范法律法规和政策制度,制定合理科学的组织方案。最后,要突破新型基础设施和技术的应用瓶颈。密切关注新技术的变革,寻找其与档案数据治理的契合点,使研究成果可以更好地转变为技术应用,以提升档案数据开发、共享和利用水平。
*本文系国家社科基金一般项目“国家大数据战略背景下档案数据质量优化控制研究”(项目编号:21BTQ016)阶段性研究成果。
注释与参考文献
[1]中华人民共和国国家档案局.中办国办印发《“十四五”全国档案事业发展规划》[EB/OL].[2021-06-09].https:// www.saac.gov.cn/daj/toutiao/202106/ecca2de5bce44a0eb5 5c890762868683.shtml.
[2]张卫东,张乐莹,赵红颖.我国档案治理研究内容与特征识别[J].情报科学,2021,39(08):60-66+85.
[3]何玉颜.档案部门参与政府大数据治理的路径研究[J].浙江档案,2018(08):23-25.
[4]刘越男.数据治理:大数据时代档案管理的新视角和新职能[J].档案学研究,2020(05):50-57.
[5]Cotteleer,M J,Wan,X.Does the Starting Point Matter The Literature-Driven and the Phenomenon-Driven Approaches of Using Corporate Archival Data in Academic Research[J]. Journal of Business Logistics,2016(37):26-33.
[6]Luckey,J W,Broughton,A,Sorensen,J E.Archival data in program evaluation and policy analysis[J].Evaluation and program planning,1982(05):319-26.
[7]战英.高校档案治理体系与治理能力建设困境和提升途径研究[J].山东档案,2020(04):10-12+60.
[8]李振华,陈梦玲.高校档案数据治理的区域联盟发展模式研究[J].档案管理,2021(02):44-45.
[9]张玉昭.新冠疫情防控背景下档案数据治理效能提升策略研究[J].山东档案,2021(03):10-13.
[10][37]金波,杨鹏.大数据时代档案数据治理研究[J].档案学研究,2020(04):29-37.
[11]龙飞斐.多源异构的城建档案数据质量管理的探讨[J].城建档案,2017(07):13-14.
[12]陈慧,罗慧玉,陈晖.档案数据质量要素识别及智能化保障探究——以昆柳龙直流工程项目档案为例[J].档案学通讯,2021(05):49-57.
[13]陈慧,罗慧玉,张凯,等.AI赋能档案:AI技术在档案管理中的赋能模式探究[J].山西档案,2020(4):76-83+131.
[14]Weiskopf N G, Weng C.Methods and dimensions of electronic health record data quality assessment:enabling reuse for clinical research[J].Journal of the American Medical Informatics Association,2013,20(1):144-151.
[15]Chan K S, Fowles J B, Weiner J P.Review:Electronic Health Records and the Reliabilityand Validity of Quality Measures:A Review of the Literature[J].Medical Care Research and Review,2010,67(5):503-527.
[16]張宁.主数据驱动视角下的企业档案数据资产管理[J].档案学研究,2019(06):47-52.
[17]杨晶晶.企业档案数据质量管理若干要务[J].浙江档案,2021(01):60-61.
[18]金波,杨鹏.大数据时代档案数据安全治理策略探析[J].情报科学,2020,38(09):30-35.
[19]李洪湖.档案数据安全存储及智慧监管平台建设实践分析[J].浙江档案,2017(02):58.
[20]刘娜.档案数据加密信息安全系统设计与实现[J].微型电脑应用,2021,37(06):136-138+142.
[21]许桂清.电子档案异地异质备份现状及应对[J].档案学研究,2018(01):82-88.
[22]周林兴,韩永继.档案数据安全治理能力成熟度模型构建研究[J].中国档案,2020(12):79.
[23]Stolfo,S J,Hershkop,S,Wang,K,Nimeskern,O,Hu,CW.A behavior-based approach to securing email systems[C]. Lecture Notes in Computer Science,2003(2776):57-81.
[24]Solomon,R J,Buchman,M,Rosenthal,E.Test Data Reader for Write Once, Read Forever(WORF)Interference Spectra Archival Media[C].13th Annual IS&T Archiving Conference 2016,2016:61-65.
[25]阎晓峰.大数据与档案资源开发利用[J].中国档案,2015(11):16-19.
[26]陈研.基于大数据时代的档案价值及其开发利用[J].兰台世界,2018(06):84-86.
[27]曹筠慧,管先海,孙洋洋.基于大数据时代的档案价值及其开发利用探究[J].档案管理,2017(01):27-29.
[28]展倩慧.协同治理视域下档案数据开发模式探究[J].档案与建设,2020(04):33-37.
[29]Woodward,N J,Xu,W J,Norsworthy,K.On Automatically Tagging Web Documents from Examples[C].35th ACM SIGIR Annual International Conference on Research and Development in Information Retrieval,2012:1111-1112.
[30]Kaulio,M,Thoren,K,Rohrbeck,R.Double ambidexterity:How a Telco incumbent used business-model and technology innovations to successfully respond to three major disruptions[J].Creativity and Innovation Mangement,2017(26):339-352.
[31]倪代川,金波.数字记忆视域下档案数据治理探析[J].档案管理,2021(01):41-44.
[32]冯惠玲.数字记忆:文化记忆的数字宫殿[J].中国图书馆学报,2020(03):4-16.
[33]杨鹏.基于区块链技术的档案数据共享策略探究[J].山西档案,2020(04):105-112.
[34]Swan M.Blockchain:blueprint for a new economy[M]. USA:O’Reilly Media Inc,2015:35.
[35]罗亚利.国外政府行政档案数据共享中的信任平衡研究——以英国NHS健康数据为例[J].兰台世界,2021(08):47-50+54.
[36]张东营.美国国家档案与文件署的数据资源整合与共享的经验与启示[D].湘潭大学,2020:11-12.
[38]常大伟,潘娜.档案数据治理能力的结构体系与建设路径[J].浙江档案,2020(02):27-29.
[39]朱建邦,王巧玲,谢永宪.国家治理时代我国档案资源整体治理体系构建研究[J].档案学研究,2021(02):20-25.
[40]陈艳.我国省级档案数据治理体系框架构建研究[D].山东大学,2020:49-50.
[41]Smith,B L,Venkatanarayana,R.Usage analysis of firstgeneration intelligent transportation systems data archive-Lessons learned in development of novel information technology application[C].85th Annual Meeting of the Transportation-ResearchBoard,2006(1972):54-59.
[42]Smith,B L,Babiceanu,S.Investigation of extraction,transformation,and loading techniques for traffic data warehouses[C].83rd Annual Meeting of the Transportation-ResearchBoard,2004(1879):9-16.
[43]刘璐瑶,曹航.电子健康档案数据治理发展方向分析[J].北京档案,2021(06):14-19.
[44]王鑫.基于MVC模式下全生命周期中的企业档案数据治理研究[J].黑龙江档案,2020(05):104.
[45]Intaek, Kim, An, Dae Jin, Rieh, Hae-young. Intelligent Records and Archives Management That Applies Artificial Intelligence[J].Journal of Korean Society of Archives and Records Management,2017(17):225-250.
[46]方嘉昕.数字化转型企业的固定资产投资项目档案数据治理策略研究[J].机电兵船档案,2021(01):59-61.
[47]付博.開放大学数字图书馆数据治理探析[J].广西广播电视大学学报.2019(1):81-85.