APP下载

关于档案数据要素若干基本问题的思考

2024-07-29赵跃李琪王月

档案与建设 2024年5期

摘 要:档案数据能否及如何成为生产要素是数字经济时代亟待回应的理论与现实问题。文章以马克思主义政治经济学为支撑,首先,提出了档案数据要素的认识逻辑,即重释档案数据,把握其在数字经济语境下的泛指意涵;认清本质要求,遵循生产要素的内在规律认识档案数据要素;把握必要条件,从主客体条件出发认识档案数据要素化。其次,从价值和使用价值两方面论证档案数据成为生产要素的可能性,并从主体参与档案数据要素化的意愿和能力以及档案数据客体的内容、形式与规模两个层面分析了档案数据要素化的必要条件。最后,阐明了档案数据要素化的三个环节,即资源化、产品化和资本化,并分析了档案数据要素区别于一般数据要素所具有的可信度高、历史性突出的特性。

关键词:档案数据;档案数据要素;档案数据价值;数据要素;要素化

分类号:G270;G273.5

Reflections on Some Basic Issues Regarding Archival Data Factors

Zhao Yue, Li Qi, Wang Yue

( School of Public Administration, Sichuan University, Chengdu, Sichuan 610065 )

Abstract: Whether and how archival data can become a factor of production is a theoretical and practical question that urgently needs to be responded to in the era of digital economy. Supported by Marxist political economy, this paper firstly puts forward the cognitive logic of archival data factorization, i.e., reinterpreting archival data and grasping its generalized connotation in the context of digital economy; recognizing the essential requirements and following the intrinsic law of factors of production to recognize archival data factorization; and grasping the necessary conditions and recognizing archival data factorization in terms of the conditions of the subject and the object. Secondly, it argues the possibility of archival data becoming a factor of production from the aspects of value and use value, and analyzes the necessary conditions for archival data factorization from the dimensions of the subject’s willingness and ability to participate in the factorization of archival data, as well as the content, form and scale of archival data objects. Finally, it clarifies the three links of archival data factorization, namely, resourceization, productization and capitalization, and analyzes the characteristics of archival data factors that are different from those of general data factors, namely, high credibility and outstanding historicity.

Keywords: Archival Data; Archival Data Factor; Archival Data Value; Data Factor; Factorization

自党的十九届四中全会将“数据”列为生产要素以来,党和国家相继发布《关于构建数据基础制度更好发挥数据要素作用的意见》《关于促进数据安全产业发展的指导意见》《“数据要素×”三年行动计划(2024—2026年)》等政策,擘画出数据资源大循环、数据要素价值充分实现以及全体人民共享数字经济发展红利的宏伟蓝图。档案数据能否成为生产要素,如何激活其要素潜能并发挥乘数效应,以赋能档案事业转型升级,助力数字经济高质量发展,成为亟待回应的现实问题。

然而,与数据要素热闹非凡的讨论对比鲜明的是,档案界对数据要素的不甚关心。部分研究虽提到“档案数据要素”的概念,如“激活档案数据要素的引擎作用”[1]“确立档案数据要素地位”[2]等,但缺乏对档案数据能否成为或如何成为生产要素的论证。也有学者提出并阐述了档案的数据要素价值[3],且进一步展望了数据要素化背景下档案数字转型的行动空间[4],但档案数据是否具有要素价值,能否成为新型生产要素融入社会大生产循环体系,仍需更进一步地思考与回应。为此,笔者将基于数据要素领域的一些基本认识逻辑结合档案数据的特征,对档案数据成为生产要素涉及的几个基本问题进行一点肤浅的探索,以求教于有关同仁和专家。

1 档案数据要素的认识逻辑

从静态视角来看,档案数据要素从词素上可拆解为“档案数据”和“(生产)要素”;在概念上,由于档案数据是数据的子类,所以可将档案数据要素视为数据(生产)要素的子类。因此,从“档案数据”和“生产要素”两个角度来认识档案数据要素合乎逻辑。从动态视角来看,“档案数据要素形成”是“档案数据要素”这一概念成立的应然前提,而档案数据要素的形成又是一个动态化的过程,对其认识则更应聚焦于这一要素化过程及其条件。由此,笔者提出如下认识档案数据要素的逻辑:

1.1 重释档案数据,把握其在数字经济语境下的泛指意涵

档案数据作为大数据时代档案信息资源的新形态和档案管理的新场域[5],其内涵仍在不断发展。早期,有学者认为档案数据是经过鉴定归档并保存在档案机构的数据[6]或档案机构收集保存的所有原始数据[7],此观点后被进一步阐释为具备档案属性的数据[8]或具备档案性质的数据记录[9]。随着认识的深入,有学者强调档案数据应是数据化的档案信息或应包括档案数据化成果[10-11],抑或数据形态的档案[12]。但总体上看,多数学者认同从上述两个角度理解档案数据[13],冯惠玲[14]更是尝试给出了一个兼具上述两个角度的界定:档案数据包括各种环境中生成的多种模态的具有档案属性的数据。可见,档案数据是一个尚处于探讨中的情境化概念,在数字经济背景下理应重新认识其概念内涵。

首先,从分布情况来看,档案数据应是一个泛指概念,广泛分布于社会各类组织,甚至个人手中,不再局限于档案部门或档案机构。突显出档案数据的泛在性、与其他生产要素结合的依附性及衍生性,且重点聚焦档案数据的开发利用,从而探究档案数据对社会生产及服务发挥作用的可能性。其次,从类属关系来看,在数字经济时代,档案数据理应被视为数据的子类,这有利于从政策逻辑及现实逻辑出发为档案数据要素的形成提供支撑,并进一步探究档案数据和数据要素的共性。最后,从内在属性来看,档案数据是数据中较为特殊的一类,成为生产要素有其特性所在。档案属性是档案数据区别于其他数据的根本所在,而这种档案属性与档案相关,但档案数据的档案属性并不等同于档案本身客观呈现出来的原始记录性,而更应是基于社会各界长期以来对档案这个客体的主观认识衍生出来的属性,即一种“社会印象”,例如真实性、客观性、历史性等。

总之,本文所探讨的档案数据一方面隶属于数据大类,是一类具有历史性的数据(从数据的时间维度上来看),也可能是一类IT界所谓的“冷数据”(从数据的利用频率以及价值释放程度来看);另一方面档案数据是基于档案产生的数据。这里的档案既包括模拟载体档案也包括数字档案;既包括非结构化形式存在的档案数据,也包括结构化形式存在的档案数据;既包括基于档案内容产生的数据,也包括基于档案背景、档案载体等生产的数据。笔者认为,在探究档案及档案工作积极融入数据要素化进程的初期,更应该关注档案数据成为生产要素所须具备的条件并尽力创造条件助推其要素化进程,而非在最初定义时就从主观层面抹杀某一领域或者某一类档案数据成为生产要素的可能性,因此,笔者圈定的档案数据范畴较为宽泛。

1.2 认清本质要求,遵循生产要素的内在规律认识档案数据要素

生产要素(Factors of Production)是经济学的一个基本范畴,包括人的要素、物的要素及其结合因素。它是人们进行社会生产活动时所必需的一切资源、环境和条件。[15]从生产要素的发展历程来看,任何一个新生产要素的引入必然遵循社会矛盾运动的客观规律。[16]例如:农业经济时代,“土地为财富之母,而劳动则为财富之父和能动的要素”,土地和劳动是关键生产要素;工业经济时代,大机器代替手工劳动掩盖了劳动在生产活动中的关键作用,资本成为关键生产要素,并且技术、知识、管理的作用日益凸显;21世纪以来,在新一轮信息革命的推动下,数据兼备劳动资料和劳动对象的双重身份并广泛用于生产之中,已成为数字经济时代社会生产力发展的决定性力量,并对其背后所蕴含的社会生产关系也带来了革命性影响。根据马克思主义政治经济学的基本观点,结合学界和业界对生产要素的定义,不同时期的生产要素虽具有不同的形态,但本质上都具备使用价值和价值、参与生产和服务并产生效益(包括经济效益和社会效益等)。综上,笔者认为档案数据要成为生产要素应满足以下生产要素的本质要求:

首先,成为生产要素须具备使用价值,即客体对于主体的有用性,这是参与生产和服务的前提。数据能够成为生产要素,也是因为其对内具有推动业务系统运转的一次价值和支撑智慧决策的二次价值,对外具有流通赋能的三次价值。[17]

其次,成为生产要素还须具备价值,即无差别的人类劳动,区别于一般意义上的积极性和有用性。无论是土地、劳动、资本、技术还是数据,都无法自己进行生产,归根到底还是需要人(劳动者)的参与和劳动的投入。数据的原始形式表现为客观事物未经处理和简化的直接记录,使用价值不高。由于这些数据并不是严格意义上由生产劳动所创造,因而也不具有价值。原始数据由劳动者经过采集、聚合、加工等处理流程后,其使用价值大幅提升,并且由于非物质形式的数字劳动的参与而创造出了价值[18],这些新的数据才具备了成为生产要素的条件。

最后,参与生产和服务并产生效益也是成为生产要素的本质要求之一。从生产过程来看,生产要素作为生产过程中的投入品,它本身就是上一生产阶段或生产过程的产品,要素与产品二者间没有截然的区别,完全取决于是否进入下一个生产过程。[19]从价值创造的角度来看,生产要素不仅需要具备价值创造潜力,而且需要与生产资料相结合,即生产要素的价值实现或提升需要投入生产过程。[20]要素在生产和服务中所产生的经济效益和社会效益是其价值实现和增值的表现,是主体选择和持续利用该要素的关键原因。企业与政府中静态存在的数据并不能产生规模效益,只有将其投入生产活动或服务,并联结其他生产要素,才能释放其要素价值。换言之,数据资源或数据产品只有在开放、共享或交易[21]的流通过程中才能转变为数据要素。

1.3 把握必要条件,从主客体条件出发认识档案数据要素化

清晰认识档案数据要素不能仅仅停留在理解“档案数据要素是什么”的层面,更需要探究“档案数据成为生产要素需要具备哪些条件”,即档案数据要素化过程的实现需要满足的条件。换言之,并非所有档案数据都能成为生产要素,档案数据要素化受到主客体条件的限制,且不同类型的档案数据成为生产要素的条件也各不相同。在档案数据要素化尚不明晰的初级阶段,笔者仅从主客体出发探讨档案数据要素形成的必要条件。

档案数据要素化需经历“资源化—产品化—资本化”过程,这一过程本身就是档案数据参与生产和服务的阶段化体现,且主体涉及档案数据提供方、利用方、中介、运营方、监管方等整个要素化链条中的参与者。从整体上看,主体参与要素化的意愿以及其能动性的发挥会直接决定档案数据要素化这一过程能否实现;档案数据要素化的客体即档案数据本身,其内容性质、数据形式以及数据规模也会极大影响档案数据要素化过程的推进。

2 档案数据成为要素的必要前提

基于前文所述,具备价值和使用价值是档案数据成为生产要素的前提,因此,笔者首先就“档案数据本身是否具备价值和使用价值”以及“具备怎样的价值和使用价值”进行分析和探究。

2.1 档案数据具有经过数字劳动凝结的价值

政治经济学中的价值即无差别的人类劳动,而在“数智”环境下,这种劳动具体表现为数字劳动,即劳动者在网络设备或终端设备上系统地表达或组织已有数据的劳动,如采集、治理、存储、整理、计算、分析、管理、挖掘等。[22]在当前的档案工作当中,无论是模拟态档案的数据化加工还是数据态档案的档案化加工,都涉及复杂且专业的数字劳动。例如,模拟态档案经数字化加工形成数字态档案后再经光学字符识别技术、图形矢量化技术、语音识别技术等进行数据化加工形成原始的、初级的数据态的档案数据;计算机系统中直接以数据态形式生成,并经过捕获、归档、保存等环节持续维护,转变形成各类原始的、初级的以结构化和非结构化形式存在的数据态的档案数据。通过这两种路径形成的档案数据因为数字劳动的付出已经具备一定的价值,但由于都是分散的数据或者说数据间的关联性较小,前期的加工处理主要还是为后期进行档案数据整合、关联、利用等创造条件,为档案数据的要素化奠定基础。

进一步而言,数字劳动过程涉及劳动者、劳动资料和劳动对象三要素。从劳动者来看,档案工作者、数据管理员、算法工程师等都是档案数据形成和管理活动中具有积极性和创造性的劳动主体;从劳动工具来看,数字劳动过程中运用的数字设备、计算程序均是由人类发明创造而来,不过是人类劳动工具在数字化时代的新形式,而档案数据的形成也需要依托此类数字劳动工具;[23]从劳动对象来看,处理档案数据的数字劳动本质上也是改造客观对象的过程,仍然是生产性劳动。因此,数字经济时代下,档案数据的价值由数据加工处理等非物质性数字劳动所创造,符合“劳动价值论”的规律。

2.2 档案数据具有“档案”与“数据”的双重使用价值

档案数据具有“档案”与“数据”的双重属性,既具有传统的档案价值形态,也具有“数智”环境下的数据价值形态。一方面,档案内容数据在元数据的支撑下仍然具有档案的凭证价值、情报价值、记忆价值等传统的档案价值形态,并且这些价值形态在“数智”环境中得以巩固和放大,例如档案数据独立地或与其他数据集成,通过数据分析挖掘,能够为利用者提供更加可靠、全面、深入的情报信息。另一方面,不同于文件、档案、档案信息可以独立发挥作用,档案数据的使用价值更体现在融合、复用和交叉关联的数据价值上,即通过数据技术处理、挖掘和应用获得的衍生价值。在数字经济语境下,档案数据“数据价值”的释放场域呈现出由主体内部向社会扩展的规律:一是档案数据与其他数据集合充分发挥提质增效功能,促进组织机构内部业务贯通;二是档案数据因其历史性、普遍性,可与实时数据相结合提供更加准确地预测信息,以助力各数字经济主体实现智慧决策;三是档案数据开放后通过与其他学科的数据进行关联、重组、融合后,在数字人文、量化历史等研究领域能够发挥更大学术价值,呈现多维度、跨领域的研究结果以助力科学研究;四是档案数据还可以在资源化后进入生产活动,提供数据产品和服务,实现对外流通赋能。有学者进一步指出,对单份或小规模的档案数据利用的意义不大,对绝对精准的追求不再是主要目标,数据的规模、完整性、多样性才是重点,甚至可以容许一定程度的错误与混杂,因为适当忽略微观层面上的精确度可以让我们在宏观层面拥有更好的洞察力。[24]

3 档案数据要素化的主客观条件

档案数据具有价值和使用价值是其能够成为生产要素的前提,而决定档案数据最终是否能够成为生产要素的关键在于其要素化过程能否实现。如前文所述,这一要素化过程的实现受到主客体的影响,因此,笔者从主客体出发探讨档案数据要素化所须满足的必要条件。由于档案数据要素化尚处于探索初期,因此,笔者在探讨影响因素以及必要条件时参考数据要素化进程及影响因素,同时结合档案数据自身特点认识其中的差异性。

3.1 主观条件:主体具有参与档案数据要素化的意愿且具备参与要素化的能力

数据要素化进程涉及多元主体,有学者从数据治理[25]、主体功能[26]、供需关系[27]等角度对数据要素市场主体进行了分类。按照数据要素市场主体的划分,档案数据要素化涉及的主体可以简要概括为档案数据提供方、档案数据需求方以及第三方机构:档案数据提供方包括档案数据的来源者、持有者、处理者这一类前端供给主体,档案数据需求方即档案数据的使用者这一类消费主体,第三方机构则包括档案数据交易机构、数据服务商这一类连接供给与消费的中介主体。对于档案数据要素化的各类主体而言,档案数据要素化这一过程可以抽象化为主体作用于客体的行为或实践,因此,从主体自身角度出发,这一行为能否实现与主体的意愿与能力紧密相关,主体的意愿揭示的是其意识层面“想不想”的问题,主体的能力则是阐释其实践层面“能不能”的问题。

从主体意愿进行分析,各类主体参与档案数据要素化的意愿如果较为正向且强烈,档案数据要素化的应然性也就相应提高。而决定各类主体产生参与要素化过程意愿的则是各主体对档案数据价值的认识,这里的价值即档案数据的“有用性”。档案数据这一“有用性”是针对主体而言的,但当各类主体无法有效认识到档案数据对自身的“有用性”时,这一种“价值关系”便无从谈起,需求也就无法产生,档案数据要素化这一过程自然无法实现。进一步而言,社会各主体对档案数据价值的认识与社会档案数据意识相关,各档案数据主体如果不关注和重视档案数据,其价值被发现、发掘的可能性就较小,由此从意识层面影响档案数据要素化的进程。这就要求各主体在确保安全的前提下有敢于突破体制机制的阻碍和开发挖掘档案作为数据要素的价值的意识,以及创新档案数据实践应用的理念。

从主体能力进行分析,主体推进档案数据要素化的能力越强,档案数据要素形成的可能性也就越大,如果主体不具备相应的要素化能力,档案数据要素化过程则无法达成。对于档案数据提供方而言,实现档案数据要素化的核心能力包括:数据提供能力,包括整合数据资源、发布数据和提供服务等能力;档案数据需求方需要具备一定的数据利用能力,具体体现为开发利用、场景构造等能力;第三方机构则需要具备档案数据运营能力,具体涉及档案数据确权、评估和开展智慧化档案数据流通服务等能力。[28]是否拥有以上能力将决定档案数据要素化能否实现,而其能力的大小影响的则是档案数据要素化的难易程度、质量与速度。

3.2 客观条件:档案数据内容脱敏、以数据集形式参与生产和服务且数据规模达到一定要求

基于主体维度的分析体现了档案数据要素化的主观必要条件,但档案数据要素化过程的实现还会受客体即档案数据本身某些条件的限制。在此,笔者仅从数据内容、数据形式、数据规模三个方面出发探究档案数据成为生产要素需要满足的必要条件。值得注意的是,要素化过程本就是一个动态性过程,对于档案数据成为生产要素所要满足的客体必要条件要动静结合来看,即档案数据先天就具备这一条件或者说档案数据后天在这一过程中能具备这一必要条件都应纳入讨论范畴。

内容脱敏是档案数据要素化的必要基础。从客体维度而言,档案数据是否能够被各主体获取取决于档案数据的内容性质。档案数据来源分散、门类复杂,不仅包括由文书档案、科技档案、专业档案[29]等传统门类加工生产的档案数据,而且还涉及公务电子邮件数据、网页数据、社交媒体数据、科学数据、监测数据等社会各领域产生的数据档案。其中并不是所有档案数据内容都允许被使用,档案数据能够被开放、利用、共享,在内容方面必须保证不涉及国家秘密、国家安全、社会公共利益、商业秘密和个人隐私等敏感信息。同时,档案数据内容可得是一项相对于主体而言的要求,即内容敏感针对的是特定主体以及与主体有利益牵扯的对象,同一类档案数据,针对不同主体所要进行脱敏处理的内容有所不同,“授权”获取内容自然也不相同,这一内容性质上的要求从根本上保证了档案数据在数据要素市场合法合规可获取以及流通。

数据集(data set)是档案数据要素化过程中必然经历的数据形式。一些档案数据可以被主体获取,但其数据形式却不适用于生产和服务。就这一点而言,《数据要素白皮书(2022年)》指出“投入于生产的原始数据集、标准化数据集、各类数据产品及以数据为基础产生的系统、信息和知识均可纳入数据要素讨论的范畴”[30]。数据集是指人类在不同社会活动中收集、整理和加工后的有一定范围、可形成完整描述的结构化数据集合[31],即一类专题数据的汇集,符合免费、机器可读、自动处理、可供重用等条件。鉴于此,档案数据的要素化过程应是以数据集形式参与生产和服务的过程。首先,单个、零散、碎片化的档案数据区别于价值密度较高的单份档案原件,往往是无意识之间产生的,其“价值”和“使用价值”较小。在数字经济语境下,只有经过数字劳动才能凝结其“价值”,同时放大其“使用价值”,而以档案为基础生产、加工、处理的档案数据往往最终以数据集合的形式存在。其次,从数据要素的形态与处理周期来看,数据要素主要分为原始数据集、标准化数据集以及数据产品[32],数据产品的生产前提是数据的汇集,这种汇集绝不是将零散的数据进行毫无规律的堆叠、打包,而是按照一定的主题加以分级分类,其间必定经历数据集这一数据形式。因此,档案数据只有按照一定专题被汇集在一起形成档案数据集,才能在此基础上进一步进行开发生产,进而产生效益。最后,零散的、不以专题形式构成的脱敏的档案数据或许也能在市场流通,但要发挥其作为数据要素的作用,则必定要在投入生产和服务之前对其进行各种形式的加工处理,其价值的发挥也必定针对某一领域和对象,因此也是在形成专题数据集的基础上再投入生产与服务。

档案数据要素化的实现对其数据规模有一定要求。生产要素是一个宏观性概念,是对某一时期经济发展中所需重要资源的科学抽象。[33]从提升社会生产力水平的理论逻辑来看,只有融入了人类劳动且能够发挥效益的大数据才能称之为数据要素。[34]由此可见,生产要素是在某一历史阶段对经济发展起重要作用或者决定性作用的资源,在生产力发展中占据重要地位并发挥规模效益。而产生这种规模效益必定需要投入一定规模的档案数据到生产服务中,且理论上存在两种途径:一种是档案数据的大规模聚集,另一种则是档案数据结合其他数据一起投入生产和服务。数据规模包含丰富的数据量、多元化的数据来源以及多样化的数据形态,获取的信息与知识越充分,数据分析的精确度会相应提高,数据的规模效益得到释放。[35]从这一点而言,档案数据要素化过程对于数据规模的要求不仅仅与数据量相关,还与数据来源、数据形态联系紧密。一方面,档案数据来源于社会各主体,这本就为档案数据被广泛应用于各类主体的生产服务活动奠定了基础。另一方面,基于单一档案产生的数据能否成为生产要素呢?以档案数字文创产品的开发为例,某一件档案文献遗产尽管在最初只有基于其内容的单一档案内容数据以及少量涉及其来源等的背景数据,但其用于文创开发以及数字创作形成的数据库、数字产品本就包含表格、文本、图像、声音、视频等多元形态的档案数据。这一类档案数据先天数据量较小,但在要素化过程中产生的多元数据形态使其数据量突破了先天局限。总而言之,档案数据成为生产要素要在整体上对生产和服务发挥规模效益,而对于数据量、数据来源、数据形态的要求本就包含在要素化过程中,重点不在于档案数据先天数据规模应该达到何种标准,而是在于在这一要素化过程中其数据规模最终应该达到一定要求。

4 档案数据要素化的三个环节

档案数据成为生产要素除了要满足相应的前提以及主客体条件之外,还必须经历要素化过程,即要素价值释放的过程。目前学界对数据要素化阶段有多种认识,例如,按照供应链可分解为数据供给、数据流通、数据应用、数据安全等阶段;按照数据价值链可分解为数据资源化、数据资产化、数据商品化和数据资本化等阶段[36],强调数据资产(产品)到数据资本的过程必须通过市场交换,即“数据商品”这一环节。由于数据流通有交易、共享和开放三种方式,“数据商品”不是数据产品化的唯一结果,“数据商品化”也不是数据要素化的必经环节。根据《数据价值化与数据要素市场发展报告(2021年)》[37]提出数据价值化的“三化”框架,可以将档案数据要素化划分为档案数据资源化、档案数据产品化和档案数据资本化三个环节(如图1)。

4.1 资源化是档案数据要素化的基础环节

档案数据资源化是指将原始的碎片化的档案数据汇集,形成有序的、价值更高的数据资源,通常以原始数据集或标准化数据集的形式存在。档案数据的形成是档案数据资源化的前端环节,值得注意的是,如前文所述,档案数据的形成包括模拟态档案的数据化加工以及数据态档案的档案化加工两种基本路径。档案数据资源化是档案数据参与生产和服务的基础,主要包括采集、存储、加工、整理等环节,最终实现档案数据价值的创造和使用价值的提升。当前档案数据急剧增长与有限收管之间的“剪刀差”问题愈发突出,大量具有保存价值的数据尚处于失散失存、失真失读状态[38],这更需要有关部门做好档案部门间、档案部门与信息部门和政府部门间、档案部门与社会间[39]的档案数据资源汇集这一基础性工作。

4.2 产品化是档案数据要素化的核心环节

档案数据产品化是指通过对自身所有或从外部获取的档案数据进行脱敏、分析挖掘、知识萃取等环节,独立或与其他数据相集成形成档案数据集、数据库、数据接口、系统平台、数据服务等具有潜在的市场价值或交易价值的档案数据产品。产品化是资本化前提,是档案数据实现价值的核心,档案数据只有从供给侧流通到更能激发其价值潜能的需求侧,档案数据资源才能释放其要素价值。[40]

4.3 资本化是档案数据要素化的高级环节

档案数据资本化是指档案数据产品化后流动到各个生产环节与应用场景,持续释放价值,实现价值增值的过程。[41]在这一过程中,不仅包括各种档案数据产品、数据服务的流通和应用,也涉及附着在档案数据上的所有权、使用权、收益权等数据权利的让渡。[42]档案数据从产品到资本的过程,实则是其助力预测和决策、提高管理和生产效率、优化资源配置、参与科学研究,在内部或外部产生经济效益和社会效益的过程。简言之,档案数据资本化就是利用市场交易、资本运营等手段将档案数据盘活,使其形态和价值不断变化而实现增值,本质上是利用市场化手段对档案数据进行投入产出管理。[43]从档案数据资源化到档案数据产品化再到档案数据资本化,是档案数据积聚、流通、应用的过程,是档案数据价值创造、实现、增值的过程,也是档案数据要素化程度不断加深的过程。

5 档案数据要素的特性

档案数据是数据的子类,其要素化过程既表现出所有数据要素共有的虚拟性、多元化、融合性等一般属性,又蕴含自身的独有特征。

5.1 档案数据要素是一类可信度较高的数据要素

档案数据相较于一般环境产生的各类数据而言更加真实、准确、客观,即可信度更高。可信度指档案数据的来源可靠和可信[44],一是因为档案数据来源于作为原始记录的档案,其数据源相较于一般数据更加真实。二是因为档案数据产生的业务环境相较于一般数据更加严谨,其生成过程及来源呈现出较强的可追溯性,具体体现为档案工作对维护原始记录这一档案本质特性的长期追求,形成了以来源原则为核心的历史主义方法。所以无论是档案,还是由其产生的档案数据,都将继承和延续真实、客观、准确等属性,同时也必然采取一些手段维护这些属性,确保其来源与生产过程可追溯。基于此,一方面,档案数据真实性、客观性、准确性是围绕来源及形成过程产生的,因此更涉及与主体相关的敏感信息,由此使得档案数据在投入生产和服务之前要耗费更多技术成本进行处理;另一方面,档案数据作为一类更加可信的数据,在被投入生产和服务时会因为这种高密度价值特征比同等规模的数据释放出更大的要素价值,在促进业务贯通、智慧决策、流通赋能等方面更加准确高效,作用领域也相较于广泛意义上的数据要素体现出更强的针对性和专业性。

5.2 档案数据要素是一类历史性突出的数据要素

档案具有“滞后性”的传统特征[45],档案数据虽然属于数据,但又是一类特殊的数据,与一般数据相比,是“业务性数据、原始性数据、历史性数据,区别于外购性、加工性、实时性的数据”[46]。档案数据作为历史性数据,一方面因为其更新速度较慢且时效性较差,无法单独用于了解事物当前状态以及预测未来趋势,因此其作为生产要素产生的效益多体现为评估事物发展的历史性特征以及局部问题;另一方面,档案数据这一历史性特征从侧面反映的是其形成的持久性以及内容的稳定性。档案数据内在沉淀了更多体系化的有效内容,但同时其价值具有“隐蔽性”[47],需要深度整合与分析,在此基础上各类主体能够总结客观规律与历史经验,回测策略的有效性,为当下及未来的生产服务改进提供借鉴。

6 结 语

“档案数据要素”这一概念的提出是档案及档案工作积极融入数据要素化实践的体现,但作为一个新兴概念以及档案工作的衍生领域,其概念、内涵、价值等基础性问题都有待进一步探究。本文从宏观的角度阐释了档案数据要素的认识逻辑并借助政治经济学相关知识对其进行了理论分析,是探究“档案数据要素”的一次初步尝试,囿于相关理论和实践尚处于萌芽阶段,本文对于档案数据要素化必要条件的认识尚不充分。相信,随着数据要素化进程的不断推进,有关档案数据要素的探究会更加具体和落地,“档案数据要素分级分类探讨应遵循怎样的框架”“档案数据在要素市场上的流通形式是否更偏向于开放与共享而非交易”“档案数据要素价值发挥的具体场景有哪些”等问题都会逐步纳入学界和业界视野,期待学界的讨论和实践的发展带来新景象。

作者贡献说明

赵跃:确定选题、核心观点与研究思路,设计大纲,论文修改与定稿;李琪:论文撰写与修改;王月,论文撰写与修改。

注释与参考文献

[1]周枫,吕姗姗,金波.高质量档案数据赋能政府治理研究[J/OL].情报科学,1-13[2024-03-06].http://kns.cnki.net/kcms/detail/22.1264. G2.20240126.1800.006.html.

[2][38]杨鹏,金波,孙尧.数智环境下档案工作面临的挑战与机遇[J/OL].图书情报工作,1-22[2024-03-06].http://kns.cnki.net/kcms/ detail/11.1541.G2.20240116.1311.002.html.

[3][29]冯惠玲,张辑哲.档案学概论[M].第3版.北京:中国人民大学出版社,2023:45-46,15-16.

[4]周文泓,王欣雨,刘鹏超.数据要素化背景下的档案数字转型行动空间展望[J].档案与建设,2024(2):38-45.

[5][18]金波,杨鹏,宋飞.档案数据化与数据档案化:档案数据内涵的双维透视[J].图书情报工作,2023,67(12):3-14.

[6][21]于英香.档案大数据研究热的冷思考[J].档案学通讯,2015(2):4-8.

[7][19]马海群.档案数据开放的发展路径及政策框架构建研究[J].档案学通讯,2017(3):50-56.

[8][45]于英香.从数据与信息关系演化看档案数据概念的发展[J].情报杂志,2018(11):150-155.

[9][13]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.

[10]赵跃,石郦冰,孙寒晗.“档案数据”一词的使用语境与学科内涵探析[J].档案学研究,2021(3):24-32.

[11]何思源,刘珂.档案与数据关系的多维解析——兼论档案数据的概念定位[J].档案学通讯,2024(1):37-44.

[12]杨茜茜.概念、内容与定位:我国档案数据治理研究的理论坐标[J].档案学研究,2021(6):28-34.

[14][41]冯惠玲.面向数字中国战略的档案数据产教融合[J].档案与建设,2023(10):4-6.

[15]梁继.数据生产要素的市场化配置研究[D].北京:北京邮电大学,2022.

[16][34]任保平,李婧瑜.数据成为新生产要素的政治经济学阐释[J].当代经济研究,2023(11):5-17.

[17][30][33][36]中国信息通信研究院.数据要素白皮书(2022年)[R].北京:中国信息通信研究院,2023.

[20]张昕蔚,蒋长流.数据的要素化过程及其与传统产业数字化的融合机制研究[J].上海经济研究,2021(3):60-69.

[22]白永秀,宋丽婷.数据商品及其二因素、劳动二重性的政治经济学分析[J].经济纵横,2022(2):27-34,2.

[23]邵彦敏,赵文瑄.论数字资本主义下的数字劳动、数字资本及其劳资关系[J].经济纵横,2024(3):15-22.

[24]郑金月.数据价值:大数据时代档案价值的新发现[J].浙江档案,2015(12):11-14.

[25]马费成,吴逸姝,卢慧质.数据要素价值实现路径研究[J].信息资源管理学报,2023(2):4-11.

[26]丁波涛.基于信息生态理论的数据要素市场研究[J].情报理论与实践,2022(12):36-41,59.

[27]王静云,吕本富.建设全国统一数据要素大市场的关键因素分析及政策建议[J].管理现代化,2022(6):146-152.

[28]阳巧英,夏义堃.我国数据要素价值形成机理、影响因素与实现路径——基于扎根理论的分析[J].图书与情报,2023(2):12-22.

[31]李龙飞,余厚强,尹梓涵,等.替代计量学视角下科学数据集价值的定量测度研究[J].情报理论与实践,2020(9):47-52.

[32]李佳轩,储节旺.数据流转抑或信用流转:数字赋能信用治理的架构与逻辑[J].情报理论与实践,2023(12):60-68.

[35]陆志鹏.数据要素三级市场经济性分析模型研究[J].大数据,2022(4):85-93.

[37]中国信息通信研究院政策与经济研究所.数据价值化与数据要素市场发展报告(2021年)[R].北京:中国信息通信研究院,2021.

[39]金波,杨鹏.大数据时代档案数据治理研究[J].档案学研究,2020(4):29-37.

[40]马涛,刘秉源.跨境数据流动、数据要素价值化与全球数字贸易治理[J/OL].国际经济评论,1-26[2024-03-13].http://kns.cnki.net/kcms/ detail/11.3799.F.20240108.1143.002.html.

[42]尹西明,林镇阳,陈劲,等.数据要素价值化动态过程机制研究[J].科学学研究,2022,40(2):220-229.

[43]杜庆昊.数据要素资本化的实现路径[J].中国金融,2020(22):34-36.

[44]魏丽维.大数据时代档案数据质量控制研究[J].兰台世界,2024(2):69-71+74.

[46]刘越男.数据治理:大数据时代档案管理的新视角和新职能[J].档案学研究,2020(5):50-57.

[47]谢康,张祎,吴瑶.数据要素如何产生即时价值:企业与用户互动视角[J].中国工业经济,2023(11):137-154.

(责任编辑:张 帆 李倩楠)