APP下载

数据态档案管理模式概念、特征与挑战

2024-10-22钱毅

北京档案 2024年9期

摘要:在档案资源对象发展演化的过程中,数据态档案作为新型资源对象,具有信号和语义双重离散的本质特征。因此,有必要对已有档案管理理念和实践进行重塑,建立能够解除语义离散带来的高阶逻辑依赖的数据态档案管理模式。本文在档案资源连续空间演化图景的指导下,明确数据态档案管理模式的概念及功能定位,阐明其区别于其他形态档案资源管理模式的特征,并对模式构建所面临的主要挑战进行分析。研究认为数据态档案管理模式以体系性、连续性、可理解性和专业性为主要特征,在空间管控、证用价值维系、管理机制协同与技术能力建设等方面面临挑战。

关键词:数据态档案 数据态档案管理模式 概念内涵

Abstract: In the development and evolution of archival resource objects, data-state archives as a new type of resource objects has the essen? tial characteristics of signal and semantic double discrete.Therefore it is necessary to reshape the existing archival management theory and practic? es, and establish a management model for datastate archives that can relieve the higher-order logical dependence brought about by semantic discrete. Guided by a scenario of continuous space evolution of archival resources, this paper clarifies the concept and function of the manage? ment model for data- state archives, elucidates its characteristics that distinguish it from other forms of management models, and analyses the main challenges faced in the construction of the model. The study concludes that the manage? ment model for data-state archives is character? ized by systematicity, continuity, comprehensibili? ty and professionalism, and that it faces challeng? es in terms of space control, maintenance of the value of evidence and utilization, coordination of management mechanisms and development of technical capacity.

Keywords:Data- state archives;Manage? ment model for data- state archives;Concept connotation

数据作为新型生产要素,正伴随着数字中国战略的深入实施成为数字化、网络化、智能化的基础,深刻改变着生产生活方式和社会治理方式。由中国人民大学主办的2023年“中国电子文件管理论坛”的主题为“面向数字中国战略的档案数据创新与发展”,精准抓住了数据时代档案管理的核心主题。数据是档案资源体系的重要组成部分,数据态档案是档案资源对象演化在数据时代的新形态,具有信号和语义双重离散的核心特征。在国家政策肯定、信息技术赋能和业务数据驱动的多重动力之下,数据态档案在业已形成的数据环境中产生并培育。数据态档案体量指数级增长、类型不断丰富,为档案事业提供新发展机遇的同时,也对前一阶段逐渐探索完善的电子文件归档和电子档案管理模式提出挑战。不同于实体档案对象的序化载体管理、数字档案对象的可信内容管理,数据态档案对象面对的是数据理解与复用、业务逻辑与规则表达、语义整合与复现等新问题,需要与之匹配的数据态档案管理模式提供新的解决方案。基于此背景,本文从管理模式的维度对数据态档案的管理与维护展开探索,以充分挖掘并发挥数据态档案在数智时代的多元价值,构筑起凝结过去、基于当下、面向将来的档案信息化完整发展空间。

一、研究背景

数据态档案是在新一代信息技术条件下以数据形式存在的新型档案形态,具有信号和语义双重离散的核心特征。相较于纸质档案管理所强调的载体管理、电子档案管理所强调的文件管控,数据态档案管理在归档、管理和长期保存等核心业务环节都表现出极大的差异性。这种档案资源形态演变所呈现出的新样态,同样反映在政策法规的规制与理论研究的探索方面。

档案领域相关政策法规以积极融入国家大数据战略为导向,开始重点探索数据与档案协同以及数据归档等问题。《“十四五”全国档案事业发展规划》要求“实现对国家和社会具有长久保存价值的数据归口各级各类档案馆集中管理”以及“大力推动科学数据与科研档案协同管理”。地方档案部门如浙江省档案局形成了《政务服务网电子文件归档数据规范》,对政务服务网电子文件归档过程中存档信息包的数据结构、命名规则和材料形成整理要求等进行了规定,嘉兴市档案馆更是探索形成了《嘉兴市市级机关政务业务系统数据归档暂行标准》。

理论研究在法规政策引导、档案部门响应、学界研究推动下,其研究已初具规模。笔者在2018年率先提出了包括模拟态、数字态和数据态的“三态”演化的观点,明确用“数据态”指代数据档案空间。此后代表学者如赵生辉认为档案与数据分属信息世界和机器世界,二者存在着相互依赖的双轨共生关系[1];陈永生强调由电子数据条目构成的电子档案是真正意义上的原生性电子档案,其信息内容富语义化和价值增强,但也易于失去解析情境[2];金波认为档案数据颗粒度细化,开发方式属于内容控制,其数据价值是档案在数据时代的价值新发现[3];刘越男指出数据治理是大数据时代档案管理的新职能,档案管理分担历史性业务数据和文化记忆数据的治理,以文档和内容管理为立足点[4];赵跃提出档案科学介入数据资源管理的档案化模式,变控制为干预,实现数据资源的档案化认同和数据资源管理过程的“档案化”转变[5]。可见,数据态档案研究在概念认知、核心内容、业务与规则等方面均取得了一定进展。

但档案学研究的“数据热”中,缺少针对普遍问题与困境展开的通用管理体系构建,对数据态档案管理模式的系统研究基本空白,这种只见树木不见森林的研究态势容易导致对这一新生对象的探讨流于片面,不利于从整体对数据态档案本质进行把握,从而阻碍空间整体管理能力形成。为有效管理数据态档案,充分挖掘并发挥数据态档案在数智时代的多元价值,亟须探索适应数据态环境的档案管理新模式。

二、数据态档案管理模式概念内涵

数据态档案管理模式的研究尚处于起步阶段,但可以确定的是其相关研究必须坚持以数据态对象本质特征为核心,应包含从全局角度对数据态档案对象管理的理论重塑,以及对这一新型档案对象核心业务的实践重构。

(一)数据态档案管理模式是基于数据本质的理论重塑

笔者在前序研究使用档案管理对象空间概念来涵盖特定态别档案资源特质及其相应技术体系、管理环境、适用规范等要素[6],并在2023年“中国电子文件管理论坛”中以“档案资源连续空间演化图景分析”为主题,对管理空间的概念进行了较为完整的阐释。不同态别资源空间之间存在发展的连续性和动态的转换关系,数据态在连续空间中既是模拟态和数字态空间转换的结果,也是知识态和价值态空间演化的基础,具有承上启下的枢纽作用。但资源管理对象空间概念偏重于宏观与整体表达,旨在汲取空间立体性、综合性、动态性和连续性的精义,其相对抽象的表述不能与诸要素组成的管理情境直接联系。因而本文提出将相应态别的档案管理模式作为空间表达的具体化形式,在与具体工作衔接时更能体现出特定态别对象的管理程序、方法、结构等核心内容。

数据态档案管理模式是数据态空间在管理环境中的具象化,是该空间范畴内相关理论、规范和业务规则的综合。数据态档案管理模式立足于档案对象信号与语义双离散的特点,从理论层面回应如何重构离散数据语义的核心问题。数据态档案对象离散的特点为信息对象的连续理解带来困难,但其离散的颗粒度形式同时也为多视角、多维度、多层次的数据叙事和数据价值开发提供了崭新的空间。为此,数据态档案管理模式应开展细致的理论重塑工作,要对维系数据语义连续、管控数据之间关联与结构的方法进行研究,并在此基础上对受其影响而发生变化的业务流程和规范进行更新再造。例如,在将关系数据库转换为XML文件进行归档保存时,利用XML处理工具或编程语言,根据数据库中的外键约束,将数据模型中的对象进行关联,建立表与表之间、表与主键之间的关联关系,或者将存储过程与相关的表进行关联。这种关联使得XML文档能够清晰地反映数据库中的结构和关系,为后续的数据存储、查询和处理提供便利。数据态管理模式需要将此类关联方法抽象为数据关联的恢复和固化,并将其嵌入业务流程和管理系统中。[7]

(二)数据态档案管理模式是面向业务环节的实践重构

数据态档案管理模式不是虚化的理念,也不是实际模型,是介于二者之间的兼有理论导向与实践指导功能的层级。该模式确定了对于数据态档案这一特殊对象管理的基本理念和实践方向,在抽象层级上与具体的管理方法仍有区隔,是指导管理方法形成的基础,具有丰富的实践内涵。

数据态档案管理模式需要在资源管理的各业务环节实践中解决由于双重离散带来的矛盾,这种叠加管理需求直接导致大量业务环节需要进行实践重构,典型的如归档、保存、鉴定、编研、开发利用等。此外,处于连续空间枢纽环节的数据态,还产生了不少业务增量,如数据档案化、数据语义化等新型业务形态。这些存量与增量业务都需要根据数据态档案的对象特征进行针对性的业务创新。归档方面,王强初步研究了业务系统中数据态对象的识别与归档策略,结合石油行业业务场景,将业务系统分为生产运行类系统、连续监测类系统、经营管理类系统、综合管理类系统四类。[8]档案数据化方面,杨建梁等提出包含转录识别、描述增强、图谱构建和矢量处理在内的开发流程。[9]保存方面,笔者提出了包括态势感知、环境构建、语义表达、反馈前端在内的数据态长期保存基本策略。[10]语义化与开发方面,夏天等提出档案数据语义化重组模型[11];房小可与段荣婷则研究了在档案著录工具基础上增强语义分析等手段,建立了将档案描述数据融入语义网的桥梁[12-13]。

三、数据态档案管理模式的基本特征

数据态档案管理模式在将抽象的档案数据对象管理空间与具体实践场景结合的过程中,总体上呈现出体系性、连续性、可理解性、专业性的典型特征。

(一)体系性

数据态档案管理模式的体系性特征,本质上是由数据态对象的双重离散特点激发的。因为离散,之前许多统一于载体管理、内容管理的问题化整为零地出现,这些问题涉及不同要素的统筹,如技术、组织、领导力等,需要一个有组织、有结构的整体框架来确保数据安全、数据质量和合规性。此外,档案数据本身的构成情况也相当复杂,包含大量的数据源、数据类型和数据使用场景,来自不同系统、部门的数据关联着各种业务流程和操作,只有体系性的数据态档案管理模式才能够驾驭数据原生环境的业务背景,使得数据在全生命周期中得到协同管理。而且在环境的持续变动和不确定性之中,新兴的技术、业务需求和法规标准可能影响甚至改变数据态档案管理的方式,体系性的数据态档案管理模式能够更灵活地应对变化、识别和防范风险,保证档案管理体系的稳定性和可持续性,在管理上体现聚合的能力。

数据态档案管理模式涉及不同层级管理要素的叠加与统筹。模拟态和数字态对象信息颗粒度粗,整体表现力强,如载体与信息统一的白纸黑字和语义与语法统一的非结构化文件,而离散程度最高的数据态空间,需要完备程度更高的管理框架进行管控,自然要求管理模式具有体系性,需要综合考察前端复杂的业务背景、全生命周期涉及的各类系统与平台要求、涵盖数据合规与安全管理的各项数据治理规范,以及需要解决两个离散带来的长期保存问题等。这些都要求数据态管理模式要具备体系性,统筹考虑各类管理要素,从而使数据态对象在全生命周期中得到协同管理。国家数据局局长刘烈宏对《“数据要素×”三年行动计划(2024—2026年)》[14]进行解读时强调加快形成数据基础制度体系和数字治理体系,明确了从体系层面进行思考和布局的必要性,与数据态档案管理模式的体系性特征高度契合,可见对数据对象的体系性管理已成为政策和战略层面的共识。

(二)连续性

笔者提出的用于表达档案资源形态与语义关系的U型曲线理论直观地反映了档案资源演化的连续性特征。[15]在该曲线中,数据态处于奇点枢纽位置,是计算活性最强的资源态别,发挥着承上启下的作用。一方面,数据态是模拟态和数字态档案资源持续向下破析,不断计算增强的结果;另一方面,数据态也是朝着知识态、价值态进行语义增强的起点。数据态档案管理模式也继承了资源空间的连续性特征,与纸质档案管理模式、电子文件管理模式前后相续,共同塑造了档案资源形态演化的连续谱系。良好的连续性特征使得数据态能够在多个空间中实现衔接,充分发挥数据态在U型曲线的枢纽通衢作用。如数据档案化、档案数据化就是数据态与数字态之间的双向转换,语义化则使得数据态档案很自然地面向知识态和价值态空间进行数据增值和语义增强。

不单资源形态具有连续性,从资源模型角度看,数据态与周边态别空间都存在模型内在的连续性,根据笔者的研究,模拟态的序化模型、数字态的实体联系模型、知识态的本体模型都与数据态的关联模型存在较强的连续性,这使得多态空间资源的大批量转换成为可能,为资源空间的有序和规范迁移提供了保障。[16]

(三)可理解性

可理解性实质是表达了可见、可读、可理解在内的“三可”要求。从资源连续迭代的角度看,数据态档案管理模式需要满足“三可”要求,使得载体可见、文件可读、数据可理解。“三可”要求反映了档案对象在不同态别空间的应然状态,即从物理上的存续、计算机系统的读取再到人类用户的理解。可见是指数据的存在可以被识别和观察到,对应的工作包括对物理空间和各类型载体实体的管理工作。可读是指数字文件按照某种模式或协议进行组织,保证能够被计算机正确地读取和处理,对应的工作包括数字资源的长期保存,如格式管理、迁移仿真、备份恢复等。可理解是指数据以人类能够理解的方式呈现,是数据态档案管理模式的重点与难点。元数据是通向可理解性的桥梁,基本数据属性、背景元数据、过程元数据动静结合刻画出数据发展变化过程,重新接续断裂的语义,建立起机器与人的初步链接。数据可视化是可理解性的直观表现,通过使用图表、时间轴等多种手段展示数据的模式和关系。数据管理强调数据生产要素价值的发挥,用户无需理解数据也可以享受数据开发利用的成果,但档案的可理解性需要面向社会全体,且要在档案保存期限之内持续维护可理解性。

进一步细究,从依赖关系看,模拟态管理模式需要通过“八防”手段应对载体的物理保存问题,从而解决载体依赖。数字态需要解决以软硬件依赖性为核心的低阶逻辑依赖,应对信号离散带来的保存问题。数据态需要解决以语义关联为核心的高阶逻辑依赖,管控诸如算法、规则、约束、模型等可解释性要素。“三可”要求需要解决的依赖关系可以简单表达为物理依赖(载体可见)-低阶逻辑依赖(语法可读)-高阶逻辑依赖(语义可理解),从这个递进关系也能看出可理解性是“三可”要求的最高点,是建立在可见和可读基础上的。

(四)专业性

专业性主要是指特定数据态对象语义复现需要相应的专业知识提供支撑,专业性特征可视为对可理解性的回应,着眼于解决语义离散这一核心矛盾。以数据形态存在的档案资源,在机器理解方面,需要专业计算机人员进行模式设计、流程预置与操作;在用户理解方面,需要与业务内容直接相关的行业专家进行数据解读、降维与呈现,具有明显的专业性特征,对管理主体的知识水平和业务能力提出了较高的要求。一般来讲,信号离散需要应对软硬件系统依赖性,其解决方案通常是进行持续的系统运维,面对的是具有一定的普适性的、共同性的问题,如硬件、软件、格式的升级换代和版本更迭,抓住这几个关键点,就奠定了维护可读性的基础条件。而语义离散通常需要专业组织维持,从某种意义上讲,语义离散的问题相对小众,通常依附于特定的专业技术领域,因而需要针对不同类型的数据态对象进行专门研究,具有较强的专业性。如LOTAR(Long Term Archiving and Retrieval)[17],是国际航空工业合作项目发布和维护一系列用于3D CAD/CAM和PDM数据长期保存和检索的标准,包括基础部分、通用流程和特定领域部分,其中特定领域就包括基于PMI的3D CAD机械信息、产品结构信息、混合设计及先进制造、电线束、基于模型的系统工程、工程分析和仿真,体现了该领域特定的专业性。类似的如数据库领域用于简化关系数据库存档的SIARD规范[18]和用于定义和记录数据库模式和结构的DBML开源语言[19],再如用于网络资源归档保存的WARC存储格式标准[20],都体现了各自数据态对象管理的专业性。

四、数据态档案管理模式构建面临的主要挑战

现有档案管理模式与以体系性、连续性、可理解性和专业性为主要特征的数据态档案管理模式之间仍存在差距,在空间管控、证用价值维系、管理机制协同与技术能力建设等方面都面临巨大挑战。

(一)需要建设保障“三可”特征的管控体系

数据态档案管理模式构建的直接挑战就是搭建维系数据态档案“三可”特征的相对完备的管控体系,“三可”的叠加要求使得数据态管理模式需要有效集成在模拟态、数字态积累的各核心要素。从依赖性角度看,一个相对完备的数据态管控体系应包含对各类型依赖的应对措施,包括物理依赖、语法依赖和语义依赖等。总体上,模拟态以物理依赖的研究已臻于成熟,集中体现在对载体、字迹、材料三要素以及环境控制的“八防”要求上;数字态以软硬件依赖为代表的低阶依赖的研究也一直在持续,可以说数字保存就是专门针对降低电子档案软硬件依赖性的研究领域。数据态档案管理模式明确提出可理解性要求,需要直面语义离散带来的语义依赖问题,对规则、模型、算法等语义关联要素进行管控。在档案资源形态的演化过程中,较之于模拟态和数字态低态别对象,适应高态别对象特征的管理模式对于所涉及的管理要素的完备性要求更高。例如,作为数字态环境中单套制管理的综合性标准的《电子档案单套管理一般要求》(DA/T 92-2022),是一个类似单套制准入清单的综合标准,明确涉及的参照标准或要求多达28项,可行性评估指标包括前置性条件和26个指标,如果任何一个前置条件暂不具备,则评估结果直接为“未通过”。后续在构建更为复杂的数据态管理模式时,同样需要拓展管理要素,满足与数据细小颗粒度特征相适应的精细化管理要求。

(二)需要探索兼顾证用价值的实现路径

档案学基础理论揭示了档案具有凭证价值与信息价值,在系统中通常表现为存证与利用服务,而不同资源态别的证用价值实现路径存在较大差异。数据态在U型曲线中处于承上启下的奇点位置,可计算性最高但语义含量最低,档案出证或提供利用时都需要经历语义恢复的长链处理过程,过程中需要基于规则与模型从数据体中对于原件进行显性化,对技术和语义依赖层层解离。

因而,数据态管理模式应实现以数据态对象为中心的兼顾证用价值的长链管理,探索包括数据档案化(数据态→数字态→模拟态)、数据故事化(数据态→知识态→价值态)在内的实现路径。《最高人民法院关于民事诉讼证据的若干规定》提到“以档案管理方式保管的”电子数据,人民法院可以确认其真实性。由此可见,在价值定位上,档案的证据价值得到了证据法相关法律法规的确认和认可。而在实际操作中数据档案化通常需要按照事先约定的证明模板将离散的数据整合成语义连续且被认可的原件形式,如成绩数据库生成的成绩单、银行系统开具的存款证明等。知识化和故事化的利用服务则需要层级丰富的档案数据基础设施与专业分化的协同支持才能实现。

(三)需要协同数据管理与档案管理

数据态对象是业务前端技术环境变迁的直接结果,大量数据驱动类系统和应用最大限度地提升了业务数据的共享集成水平,也在相当程度上模糊了传统前端与后端的边界。与此同时,伴随而来的技术复杂度也导致原先集中在特定物理空间(如办公室)中的文档管理职能在数字空间中的延展和离散,这都使得“文档一体化”之类的协同理念在数据态环境中面临巨大挑战。协同不是简单的交互和接口,追求的是各要素的整体性和柔性效果。如数字态环境下提倡的“文档一体化”与此处论述的数档协同在理念上是一致的,但在协同精细度上二者存在明显差异。传统的“文档一体化”协同对象是非结构化的文件与档案,实现方式依靠规范的元数据接口、协调的收发设置、通用的文件格式等相对硬性的协同手段;数据态管理模式协同对象是颗粒度趋于最小化的各类数据,要进行数据质量、数据标准、数据权限等治理层面的要素全方位对接,需要更多润物细无声的规则与操作。

由于涉及治理层面,数据管理和档案管理之间需要在管理主体、方法、理论等多方面加强协同,这是当前乃至今后一段时间数据态档案管理模式的难点与重点。譬如,深化数据与档案的概念协同,梳理数档协同管理的多元路径,探索数据态管理相关主体间的协同模式,实现包括档案部门、数据管理机构、第三方服务平台、云服务商、业务部门、信息部门等在内的跨领域跨部门协同。

(四)需要弥合两个离散的技术能级

数据态是所有资源空间中离散程度最高的态别,即信号离散(第一离散)与语义离散(第二离散),在面向人进行证用服务时需要相应的解除依赖能力。由于离散性质不同,可以将所需要的技术范畴分别视为两大技术能级。其中,解决第一离散问题的技术能级包括传统的数字保存手段和较为完善的软硬件运维能力等;解决第二离散问题的技术能级则是基于特定数据态对象的语义解析和弥合能力,通过搭建语义台阶弥合离散数据,使档案资源对象跃迁为可理解的知识对象和价值表现,包括本体建设、关联数据、知识融合等具体技术。因此,数据态所依托的语义基础设施客观上需要能够更精确地表达依赖关系,需要运用更为专业的工具和方法。

显然,数据态档案管理模式需要相对厚实的技术能力作为支撑,要求具备弥合两个离散的技术能级,尤其要满足数据态对象脱离原生环境后用户可理解性的要求,构建相关行业专家深度合作形成的专业小生态,包括档案专家指导数据归档及长期保存、数据管理专家指导数据质量维护与数据利用开发、业务专家指导数据解读与语义呈现,满足特定数据态对象全生命周期管理的各类技术需要。对于数据态档案管理模式而言,其技术能力的挑战并不来自是否能及时把握技术前沿或者攻克技术难关,而是对于技术的了解是否能够支持客观审慎的评估的形成,在面对供应商的方案时是否有能力进行独立判断,形成平衡安全、收效、成本的选型决策。另外,在促进数据态档案对象向知识态等高级态别跃迁的过程中,可能会涉及潜在的安全与隐私问题,即使数据体本身不涉密、不包含隐私信息,但是在知识融合推理形成新的数据洞察之后,可能就会产生预料之外的隐私问题,这使得数据安全和隐私保护的难度再度提升。

在深化档案信息化战略转型、推动档案工作走向现代化的背景下,档案部门需要以“空间观”的战略视野把握资源形态演变趋势,洞察数据态新档案对象双重离散本质及其带来的业务流程与规则变化,在现实管理环境中进行理论重塑和实践重构,形成以体系性、连续性、可理解性和专业性为特征的数据态档案管理模式,应对维系“三可”特征、兼顾证用价值、协同数档管理、搭建技术能级的挑战,最终解除离散语义带来的高阶逻辑依赖,在档案对象管理空间中恢复数据的连续语义,为档案数据资源开发利用奠定良好基础。

*本文系国家社会科学基金项目“数据态环境下档案管理模式创新研究”(23BTQ108)的阶段性研究成果。

注释及参考文献:

[1]赵生辉,胡莹,黄依涵.数据、档案及其共生演化的微观机理解析[J].档案学通讯,2022(2):4-12.

[2]陈永生,杨茜茜,王沐晖,等.基于互联网政务服务平台的文件归档与管理:记录观[J].档案学研究,2019(3):16-23.

[3]金波,添志鹏.档案数据的内涵与特征探析[J].档案学通讯,2020(3):4-11.

[4]刘越男.数据治理:大数据时代档案管理的新视角和新职能[J].档案学研究,2020(5):50-57.

[5]赵跃,孙晶琼,段先娥.档案化:档案科学介入数据资源管理的理性思考[J].档案学研究,2020(5):83-91.

[6]钱毅.技术变迁环境下档案对象管理空间演化初探[J].档案学通讯,2018(2):10-14.

[7]钱毅,刘力超.数据库电子文件归档与长期保存技术路径研究[J].档案学研究,2017(4):67-72.

[8]王强,高强.业务系统数据归档研究——以中国石油业务系统数据归档实践为例[J].浙江档案,2019(12):36-39.

[9]杨建梁,刘越男,祁天娇.文档数据化:概念、框架与方法[J].中国图书馆学报,2022,48(3):63-78.

[10]钱毅.数据态环境中数字档案对象保存问题与策略分析[J].档案学通讯,2019(4):40-47.

[11]夏天,钱毅.面向知识服务的档案数据语义化重组[J].档案学研究,2021(2):36-44.

[12]房小可,王巧玲.档案著录、知识关联与社会记忆重构[J].档案学通讯,2021(03):27-33.

[13]段荣婷,夏子涵,王昊.档案著录关联数据化实现研究[J].档案学研究,2021(04):100-110.

[14]新京报.刘烈宏:释放数据要素价值,是把握发展机遇的重点[EB/OL].(2024-01-07)[2024-03-24].https://baijiahao. baidu.com/s?id=1787433965437256213&wfr=spider&for=pc.

[15]钱毅.破析与融合——析档案资源形态与语义表现相互作用的U型曲线现象[J].档案学研究,2022(04):108-115.

[16]钱毅,潘洁敏.基于模型视角的档案对象连续空间演化路径[J].档案学通讯,2024(2):4-12.

[17]LOTAR(Long Term Archiving and Retrieval).LO? TAR standards[EB/OL].[2024- 03- 24].https://lotar- interna? tional.org/lotar-standard/.

[18]Digital Information LifeCycle Interoperability Stan? dards.SIARD(SoftwareIndependentArchivingofRelationalData? bases)[EB/OL].[2024-03-24].https://dilcis.eu/content-types/ siard.

[19]Holistics.DBML- Database Markup Language[EB/ OL].[2024-03-24].https://dbml.dbdiagram.io/home/#intro.

[20]曾萨,黄新荣.WARC标准推广策略研究[J].图书馆,2019(6):81-87.

作者单位:1.中国人民大学信息资源管理学院2.中国人民大学电子文件管理研究中心3.多模态档案保护与开发国家档案局重点实验室