档案数据要素化的历史源流、关键问题与价值空间
2024-07-29许晓彤张嘉玮李照川
摘 要:新质生产力发展背景下,数据要素化为档案数据的价值激活与释放提供了新的视角与思路。文章在梳理档案数据要素化历史源流的基础上,先从理论层面厘清相关重要概念,从定位、属性、权属、时效与导向等角度明确了档案数据要素化的关键问题。进而对公共数据授权运营与数据交易平台展开调查,结合实践现状探讨了档案数据要素化的价值空间:持续保障高质量历史数据资源供给,着力探索基于场景的数据融合赋能,发挥专业优势助力数据型应用开发,积极开展文化类数字资产合作发行。
关键词:数据要素;档案数据;数据要素化;档案数据价值;数据资产化
分类号:G273.5
Historical Origins, Key Issues and Value Space of Archival Data Factorization
Xu Xiaotong1, Zhang Jiawei1, Li Zhaochuan2
( 1. School of History, Shandong University, Jinan, Shandong 250100; 2. Inspur Software Technology Co., Ltd., Jinan, Shandong 250101 )
Abstract: Under the background of new quality productive forces, data factorization provides new perspectives and ideas to activate and release the value of archival data. On the basis of sorting out the historical sources of archival data factorization, this paper first clarifies the relevant important concepts at the theoretical level, and clarifies the core issues of archival data factorization from the perspectives of positioning, attributes, ownership, timeliness and orientation. Then it investigates public data authorization operation and data trading platforms, and the value space of archival data factorization is discussed: continuing to ensure high quality historical data resources supply, focusing on empowerment via data fusion based on scenes, maximizing the strengths of data application development, carrying out cultural digital assets cooperative issuance actively.
Keywords: Data Elements; Archival Data; Data Factorization; Archival Data Value; Data Assetization
新质生产力的形成离不开劳动者、劳动工具、劳动对象的高效融合。在数字化快速发展的今天,数据作为一种新型的生产要素,已经融入生产、分配、流通、消费和社会服务管理等各个环节,成为重要的劳动对象,深刻改变着社会的生产方式、生活方式和社会治理方式。2019年,党的十九届四中全会首次将数据列为我国第五大生产要素,要求健全由市场评价贡献、按贡献决定报酬的机制,数据要素正式成为数字中国建设的动力引擎之一。2020年4月,《中共中央 国务院关于构建更加完善的要素市场化配置体制机制的意见》公布,强调要加快培育数据要素市场。2022年12月,《中共中央 国务院关于构建数据基础制度更好发挥数据要素作用的意见》(下文简称“数据二十条”)发布,强调了数据产权、流通交易、收益分配、安全治理等重点工作,以促进数据合规高效流通。2023年,国家数据局组建,负责推进数据基础制度建设,统筹数据资源整合共享和开发利用,并制定《“数据要素×”三年行动计划(2024—2026年)》。国家在数据要素方面的重大理论创新和政策安排,彰显出数据在国家发展中的重要战略地位,集中力量建设数据要素市场,发挥乘数效应、实现数据要素价值倍增是大势所趋。
数据要素化之于档案学研究是一个新兴视角,但渊源已久。数据要素的价值实现根植于数字经济的发展,而“资产观”早已受到学界的广泛关注与讨论,学者们从争论档案是否可以算作资产[1]到推演其作为资产的正当性并逐渐认可[2],继而从理论层面阐释档案资产的内涵[3],探究档案数据资产化治理、运营的方法与路径[4-5],促进档案(数据)资产保值增值。如今,我们已经不必重复档案能否算作资产的讨论,亦不必对档案的经济价值“三缄其口”,档案学者开始正视档案的数据要素价值内涵[6],关注其在数字经济创新与升级中的重要作用[7],从内涵扩充、多维参与流通交易、融入数据治理体系、推进实践试点等方面探索数据要素化背景下的档案数字转型行动空间[8],以充分释放档案生产力,赋能数字中国建设[9]。
在数据要素市场初步构建的历史阶段,面对加速推进数据要素市场化配置的时代机遇,档案数据作为社会事务的原始记录,是高质量的战略信息资源与历史文化遗产,具备丰厚的要素化资源禀赋,应在数据要素体系中发挥其应有的作用与价值。在这一背景下,本文首先结合生产要素论分析档案数据要素化的历史源流,以历时性视角梳理其面临的机遇与挑战;其次,明确档案数据要素化的相关概念,抓住核心问题,聚焦研究与实践的关切点与矛盾点;最后,基于前述论证,结合公共数据授权运营与数据交易平台调查结果,发散式探索档案数据要素化的价值空间与发展方向,以期抛砖引玉,激发学界、业界对这一话题的共同探讨。
1 档案作为生产要素的历史源流:基于生产要素论的视角
生产贯穿人类文明的发展史。从马克思对生产力与生产关系的论述可知,生产劳动必须依靠劳动(亦作有目的性的活动)、劳动资料和劳动对象这三个部分。从西方经济学发展的角度来看,自17世纪威廉·配第在《赋税论》中首次提出土地和劳动均创造财富价值的二元关系始,人们对生产要素认识逐步从二要素论、三要素论向六要素论发展,劳动、土地、资本、数据等相继上升为关键生产要素;同时,各类生产要素也以更合理的投入组合创造更大产能,推动生产力发展。为更细致地剖析档案在生产发展中的作用,本文基于生产要素理论,梳理其作为生产要素的历史源流。如图1所示[10],随着关键生产要素的演变,档案也以不同形态在其中扮演着不同角色,重要性日益凸显。
原始社会时期,生产以劳动要素为核心,档案“前身”开始支持生产分工。原始社会中,生产活动以采集和渔猎等为主,部落通过简单分配以维系基本生存,劳动是当时最主要的生产要素。在此过程中,档案的起源表现为口诀、歌谣、结绳、刻契等形式,记载并传递着人类在自然斗争中积累的经验,发挥着备忘、信约和凭证作用,支持部落获得稳定、丰厚的生存产品。[11]

农业社会时期,生产以土地要素为核心,档案信息服务封建经济发展。农业经济中,土地与经济收入直接关联,是最关键的生产要素。[12]这一时期,档案作为官方记录,围绕着主要的农产品生产与分配发挥辅助作用。以我国封建时期主要的档案类型为例,政务文书档案体现统治阶级的意志,成为资源分配和日常管理的依据,可以看作管理要素与档案信息联合起来发挥对于生产的间接作用;赋役档案内含赋税钱粮、人丁户口等大量信息,关系封建社会的经济命脉和统计基础,辅助劳动等要素实现资源配置;舆图档案记载土地资源情况,辅助土地要素实现资源配置,等等。总体而言,档案承载了大量服务统治、支持经济社会发展的重要内容,辅助劳动、管理等要素通过文书档案及各类专门档案的流转使用实现配置,共同施加于最核心的土地要素,支持生产分工并实现生产力创造,推动经济发展。
工业社会到信息社会时期,生产以资本要素为核心,知识与技术要素地位上升,在经济转型升级与产业结构调整中发挥愈发重ZiISOAoSX+slrAb/XRS9dg==要的作用,档案资源积累蓄能。进入工业社会后,经济活动变得复杂,生产、流通、分配、再生产的闭环渐渐形成。在资本要素的推动下,大量企业成为生产主体,档案不再是政府机构的专属品,企业在生产经营等业务活动中均形成、留存了大量档案。从领域看,除传统文书档案以外,科技档案、会计档案等数量急剧增长;从门类看,图纸、照片、音像等各类档案不断丰富,电子档案管理的重要性日渐凸显。谁拥有足够的信息,谁就在市场竞争中处于更多优势并获得更多收入。[13]同时,知识、技术等生产要素的作用比重日渐上升,档案作为其“载体”与社会生产发展的结合愈发紧密,对档案的认识也从“资源观”进一步向“资产观”升级转化,档案不能只“默默无闻地为经济建设服务”[14],将档案作为企业无形资产并进行估值的呼声亦日益高涨[15]。整体而言,在这一时期,以海量信息处理为使命的档案管理工作进入“黄金发展期”[16],但生产要素投入的目标主要是通过解放人的体力来提高生产率,资本、技术等要素发挥主要作用,对档案资源、档案资产的关注更多在于如何保存以使其保值、增值,使无形资产避免隐性流失,主要表现为“自用”以支持决策与经营等[17],其直接推动生产力提升的潜力尚未被充分挖掘。
数字社会时期,数据要素核心地位逐步上升,档案数据要素展现巨大潜力。信息技术的发展使得人们存储信息、传递信息的能力提升,带来了生产的大变革。早在1998年,黄泰岩就提出将信息作为生产要素纳入分配。[18]此后,随着以人工智能为核心的第四次科技革命取得突破性进展,从海量数据中精准提取价值成为可能,数据从各类生产要素中脱颖而出,成为关键驱动力。当前,发展新质生产力成为新目标。[19]数据要素通过与其他各生产要素协同配合,激发数据生产力,塑造发展新动能。在这一背景下,工业经济时期累积的大量档案资源、档案资产成为培育新质生产力的潜在优质资源,其语义化、数据化形成的档案数据具备机器可理解、可操作的特性,提升了档案自动化关联组织与提供利用的可能性。[20]档案价值在数据要素时代焕发新的生机,推进档案(数据)利用范式从以参考凭证为核心的“验证式”被动辅助走向以驱动业务为导向的“预测式”主动赋能成为新的课题,档案工作也迎来新的挑战与机遇。
2 档案数据要素化的关键问题:兼论相关概念
档案工作数字转型过程中,不乏对数字档案、档案数据等核心概念的讨论。当前,数据要素化为档案资源的价值激活与流通提供了新的视角,“档案数据要素”成为新热词。按照权益归属,数据要素可分为公共数据要素、企业数据要素、个人数据要素[21];按照应用领域,数据要素可分为商业数据要素、民生数据要素、政务数据要素、工业数据要素[22]等。如今谈档案数据要素,其命名逻辑与上述概念并不相同。档案数据要素的独特定位是什么?其学理内涵与实践范畴是什么?本节从概念辨析切入,进一步锚定档案数据要素化过程中亟待解决的几个关键问题。
2.1 档案数据要素化的资源依托:档案数据
档案数据是档案数据要素化的资源依托,亦即实施对象。当前,档案界对档案数据的概念尚无统一定论,不利于明确档案数据要素化的工作范畴和权责,并提供针对性方案。学界观点按照定义范围,可粗略划分为广义、狭义两类。一是侧重“数据”的广义观,认为档案数据的概念相比于电子档案等在时间、空间与状态方面均有所延拓[23],指具备档案性质、有长期保存价值的数据记录,即便其目前尚未被正式纳入档案部门保管[24];或采用更加广泛、直接的表述,认为数据即档案[25]。二是侧重“档案”的狭义观,细分语境,强调将档案数据限定在档案理论研究与实践范畴之内,如“关于档案的数据”[26]、以档案管理的方式加以提取和保管的数据[27],或仅指代经过数据化形成的档案成果[28]。实践领域对档案数据的认知体现于工作规划与部署。基于此,笔者考察了档案事业发展“十五”计划到“十四五”规划中涉及“数据”的表述,发现实践领域对档案数据关注始于数据库建设等具体工作,逐步融入国家大数据战略,朝着细粒度、宽领域、强技术的方向不断发展,部署了关键领域电子数据归档与已有档案数据开放与管理两个重点工作方向。由此可见,实践领域对“档案数据”的认知相对统一,其表述侧重“后端”档案部门掌握并管理的档案数据资源,倾向狭义观;对于“前端”政务、信用、交通、医疗等各领域产生的“电子数据”,则积极部署数据归档指导监督等工作,促进其转化为档案数据。
笔者认为,概念的交叉与演变是理论研究与实践工作阶段性发展的必然现象,不同的概念取向引导出多样化的研究视角,在不同层面锚定了工作重点。对于尚未正式归档的“具有档案属性的数据”,即“潜在电子档案”而言,各业务部门是各类业务性、实时性数据最直接的资源供给主体,档案部门可在前期的数据战略制定、数据形成与采集、数据分类分级、数据预处理、数据安全管控等治理性工作环节中,通过融入、参与、协同等多种机制贡献“管理视角”[29]的智慧,切实提升数据资源质量,增强数据可信、可追溯能力,从长远视角来看,其重要性不言而喻。对于“数据态档案资源”而言,档案部门可以充分发挥已有的资源优势和主导作用,通过要素化过程唤醒、激活“沉睡”馆藏档案资源的价值,推动其进入数据要素市场,尽快在数据要素化工作中明晰档案部门与档案数据要素的独特定位,进而逐步实现其角色、职能的拓展;同时,从数据要素市场建设、释放数据生产力的整体视角来看,一定规模的档案数据“进场”能够极大扩展数据要素池,提升数据整体质量,与当前以“热”“温”数据为主的数据要素形成合力,共同发挥历时性研判作用,实现价值倍增。
2.2 档案数据要素化的目标取向:数据要素
数据要素是档案数据要素化的最终成果与目标取向,具有报酬递增、低成本复用等特点,具备“新质生产力”典型特征。物质资料生产是社会赖以存在和发展的基础,其基本前提在于必须具备一定的有形或无形投入,这些必须投入的有形或无形因素与条件就是生产要素。[30]数据要素则是以电子形式存在的、通过计算方式参与生产经营活动并发挥重要价值的资源。[31]清华大学金融科技研究院院长廖理将数据要素的本质解读为“可机读+可流通”。其中“可机读”指机器可读,在档案学语境中可泛指数字态、数据态的信息;从自动关联激活价值、深度挖掘数据潜力的长远视角来看,数据态信息必将成为要素化的主流资源,与之相关的算法、算力等可与数据一同形成各类数据服务产品。“可流通”则有许多种形式,具体包括数据开放、数据交换与共享、数据交易等。
数据并非天然成为生产要素,须经过加工方可具有使用价值,这一过程即“要素化”。要素化过程中数据的价值释放依循数据价值链。2013年,吉尔伯特·米勒与彼得·莫克首次提出大数据价值链,定义了数据的发现、集成与探索三个阶段,以及收集与标注、准备、组织、整合、分析、可视化、决策七个具体环节。[32]马费成等从理论层面将数据要素价值的实现概括为数据采集、数据组织、数据流通、数据利用。[33]于施洋等则结合数据要素市场的具体实践,将数据价值链定义为原始数据、数据资源、数据产品、交易流通、合约交付、数据利用等环节[34],涉及数据的资源化、资产化与资本化三个递进的层次路径[35]。其中,数据资源化强调将原始数据进行采集、标注、清洗、标准化、结构化等一系列组织加工,经过“抽丝剥茧”产出高质量、有潜力的数据,最终形成具有使用价值的数据资源;数据资产化则更加关注数据与具体业务场景融合,即通过数据驱动业务变革彰显其经济价值,强调“向内赋能”,重点在于数据确权、评估与资产入表等;数据资本化表现为使数据具备金融属性,可用以交易流通,具体体现为股权化、证券化等,是数据价值的高阶升级与全面体现。[36-37]
2.3 档案数据要素化的实现前提:关键问题锚定与现实观察
如前所述,档案数据要素既需要满足数据要素可机读、可流通、可确权、可计量等要求,又应具有档案的特有属性,需要符合档案管理工作逻辑。因而在要素化过程中,首先需要对数据要素特性与档案数据属性的共通点加以延伸、转化,对其冲突点进行平衡、调适,立足档案数据与档案管理的优势与特色,吸收数据要素化新视角、新观点带来的经验启示。
第一,调和数据要素的外向流动性与档案数据的内向静态性。数据要素关注以用户为中心,从需求端出发对数据资源展开高效利用、复用[38],释放数据价值,打破数据的内部“圈禁”,使其在更广阔的时空范围内实现高效配置并发挥乘数效应,具有显著的外向性。档案工作一直以来强调制度化、整体化的管理体系,具有较强的保密属性与安全意识,多从供给端对档案数据进行可信管理以服务组织机构或系统内部的日常工作运转,体现出内向性的特征。这在一定程度上保障了档案数据的集约化管理,使其成为可靠的凭证记录,但也赋予了档案数据及其管理工作相对封闭的特征。以“可信”视角为例,数据要素的可信重在打造以隐私计算、联邦学习、区块链等技术为依托的可信数据空间基础设施,以支持数据实现“原始数据不出域,数据可用不可见,用途可控可计量”的动态开发利用;档案可信则在于通过过程性管理与固化手段实现“四性”管控,目标在于提供静态的、可参考的凭证。从这一角度来说,档案数据要素化应建立在有组织开放审核的基础上,综合考虑如何在保留其内向性带来的安全、真实优势的同时,在理念、技术与方法等层面实现与数据要素可信流通体系的衔接与融合,推动档案数据从“静态凭证”向“善治证据”的转变。
第二,协调数据要素的经济属性与档案数据的公益属性。数据要素需要在合规流通使用中激活价值,既包括通过消减生产经营风险、提升公共服务效率等实现降本增效,也包括通过资产化运营、合规交易等方式实现经济属性价值的充分释放。据统计,2022年,深圳市的数据要素支出已达千亿规模。[39]数据要素的价值释放涉及资产化过程,会计学角度指数据资源价值计量并作为资产入表。[40]对于档案工作而言,档案利用服务的公益属性深入人心,重点在于机构内部工作参考或其社会效益、文化效益,作为辅助的经济效益则较少被提及。[41]在数据要素化背景下,“应破除‘档案部门和档案工作与数字经济和数据要素没关系’的落后理念,将档案工作主动融入和服务数字经济的创新与升级”[42],积极探索档案数据的价值计量,推动其作为无形资产入表。相关标准的制定及其内容的调整也反映了对档案数据资产价值的深入认识:2010年,财政部《固定资产分类与代码》(GB/T 14885-2010)将“电子档案”定义为固定资产,强调“光盘”等载体,而2022年《固定资产等资产基础分类与代码》(GB/T 14885-2022)修订时则已删除此项;《无形资产分类与代码》(GB/T 35419-2017)新设置了“信息数据类”无形资产,关注其蕴含内容带来经济利益的潜力,档案数据应入此类。同时,档案数据如何估值尚存在较大的挑战空间,传统方法在数据估值中局限性明显,如成本法难以描摹档案数据的未来增值情况、收益法难以确定摊销方案及使用年限、市场法则缺乏成熟稳定的可比物等;[43]档案数据质量、数据规模、社会需求等一系列细化估值指标也有待进一步研究与实践。
第三,认识数据要素确权的明晰性与档案数据权属的复杂性。数据要素权属确认问题驳杂,数据资产化、要素化的过程必然伴随着数据权属边界的逐步清晰确定,这也是流通的“第一道门槛”。“数据二十条”明确了数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的规定,充分考量了数据资源的依法持有流转、授权合规加工与合理处分收益,其逻辑也与数据价值链从获取到利用的过程相契合,可通过数据登记存证实现权利的确认。档案数据以集合形式管理,需在合理区分公共、企业与个人的数据的基础上,梳理各自的权利重心。个人层面,档案数据来源广泛并以原始形态存在,隐私、伦理等人格权应率先规制。如英国国家档案馆规定,对出于公共利益存档的数据应保留数据主体权利束中的访问权、可携带权、更正权等,减少对个人权利的干预。[44]企业、机构层面,财产权、知识产权等应受到重点关注,但对于档案数据而言,存在档案形成主体单位的撤销、合并等原因不复存在的情况,需要单独界定此种情形下相关处分、收益等权属的分配情况及权益落实的具体形式;另外,如遇档案数据销毁,其衍生数据产品的相关权利分配问题也应作出更加细致的规定。国家层面,应关注档案数据的主权与安全等问题,严格实行分级管理并规制其跨境流动。
第四,兼顾数据要素的时效性与档案数据的时滞性。即时性是数据要素在数字经济时代的特征[45],强调对当下的生产经营活动具有价值[46],如交通运输实时定位、工业生产实时决策等。对于这些实时性数据,一旦超过特定的时间节点并未能持续更新,其价值便可能“断崖式”下降。相较于已形成一定流通规模的“热”“温”数据,档案数据相对而言具有滞后性,多属于“冷”数据。对于数据要素市场整体建设而言,需要释放的不仅是实时数据的动能,更需要充分激活历史数据的价值,使“历史”和“当下”形成对照与映射;同时,档案数据所蕴含的背景与结构数据有助于更好地开展模型训练、算法验证与规律探寻,是高质量数据,具有长远的、不应忽视的价值。
第五,平衡数据要素的加工处理导向与档案数据的原始记录传统。数据要素与数据最根本的区别在于是否经过加工,前述数据价值链描述了数据通过加工、融合利用逐步实现价值释放的过程。于施洋等按照数据要素的加工程度将数据划分为原始数据、脱敏数据、模型化数据、人工智能化数据四阶段[47],阶段层级越高,数据越脱离原始形态,加注的算法与算力成分越多,所提供的数据服务就越多样。在此基础上,数据的集成、聚合能够实现高质量数据的价值叠加、倍增。如浪潮集团研发的“泉城商业选址”[48]即通过济南公共数据开放网中企业登记注册数据、济南市电影院名录数据、济南市零售药店数据等21类开放数据的汇聚,实现对政策、人口密度、客源分布、同行位置、交通信息等情况的综合研判,以支持实体店铺的精准选址。对于档案数据而言,作为“一手资料”,档案资源最突出的特性即不加修饰的原始记录性,这也使得档案在社会民生领域多以用户提出需求、档案馆出具证明的形式提供利用服务。而数据要素化则为档案数据价值的释放提供了思路与机遇,即积极响应现实需求,主动发掘应用场景,发挥档案数据对生产经营与民生服务等活动的支撑与驱动作用。
3 档案数据要素化的价值空间分析——基于公共数据授权运营与数据交易平台的调查
冯惠玲指出,档案数据具有原生性、完整性、普遍性与关联性的突出特点,在数据资源家族中具有不可或缺的地位[49],具备要素化天然资源禀赋。如果说,资产观视角将档案视为战略资产,重在强调档案资源的价值保值与增值,辅助成本节约与效率提升[50];那么要素观则关注档案数据价值的转化创新为用户带来的收益,更凸显其价值释放、倍增的导向。根据数据性质的不同,国家“十四五”规划与“数据二十条”将公共数据授权运营与数据交易作为激活数据要素价值、营造良好数字生态的重要路径。据此,本文对公共数据授权运营与数据交易平台展开调查,梳理数据公开、交易等基本流通情况,从“产出端”现状向前回溯,为档案数据要素化价值空间的探索提供线索。
3.1 调查设计与初步结果分析
档案数据来源广泛,既蕴含属于公共数据的部分,也包括大量企业、个人数据。一方面,本文结合大数据技术标准推进委员会《公共数据授权运营案例集(2023)》[51]、中国软件评测中心等《公共数据运营模式研究报告》及相关研究提及的公共数据授权运营典型案例[52-53],选取北京、上海、浙江、贵阳、福建、济南、成都、湖州、青岛、温州10个代表性省市的公共数据公开(运营服务)平台,调研档案部门数据供给、档案数据产品与服务开发的现状。另一方面,数据交易场所作为数据经纪业务以及数据流通交易可信互通、集约高效的核心枢纽[54],集中反映了我国当前数据交易市场的现状与需求,据此,本文对“2023全国十佳数据交易平台”名单列举的北京、广州、贵阳、浙江、深圳、上海、郑州、山东、海南、重庆(西部数据交易中心)的数据交易平台展开调查[55],重点对与档案数据相关的交易标的进行深入分析。需要特别说明的是,在部分省市,以上两类平台的调研结果有重合之处,本文将结合论述语境具体处理。
对公共数据授权运营典型地区的调研发现,当前,被调查各地的档案部门均已成为政府数据公开的成员单位,其公开的数据类型主要有目录类、业务类与参考类。目录类主要指开放档案目录、民生档案目录、历史档案专题目录等;业务类包括档案查阅数据、档案执法检查数据、档案馆科研数据、档案馆留言数据等;参考类主要有档案馆指南、档案政策法规、档案馆行政权力清单等。上述公开数据的利用方式均为提供数据集下载与数据接口;在已公布所用数据的数据服务与应用中,明确声称使用了档案数据的尚不多见。此外,其他部门如住建、民政、人社、交通、教育、卫生、自然资源、生态环境等部门的档案馆(室)也公开了其所保管的档案数据,如招工档案数据、流动人员人事档案借阅情况数据、婚姻档案数据、城建档案审批数据,社会团体档案信息、空气站点档案信息表等。总体而言,相比于其他已公布的数据集和发布的数据产品,公开的档案数据整体规模有限且以目录数据、过程性数据为主,尚存较大的开发空间。
对十佳数据交易平台的调研发现,档案数据产品主要可分为数据资源、数据服务与数据能力三类(详见表1)。其中,数据资源类集中在测绘与医疗领域,多为数据集与数据接口;数据服务类融合了多类档案数据,综合提供报告、查询、知识库等服务;数据能力类主要提供支持数据管理的产品与服务,如各类档案管理系统、档案数据治理方案等,涉及档案管理的相关知识与技术,更多表现为数据要素与技术要素的协同作用。
3.2 档案数据要素化的价值空间思考
由调查结果可知,档案数据在公开与交易方面均有了一定探索,但整体要素化尚不充分,有待进一步挖掘潜力,进而发挥档案数据要素的乘数效应及其对社会经济发展的内在驱动力。
(1)持续保障高质量历史数据资源供给
尽管学界、业界对档案数据的具体定义尚存争论,但对于其高质量、具有长久保存价值等特征早已达成共识。《信息技术 数据质量评价指标》(GB/ T 36344-2018)列举了数据质量评价的规范性、完整性、准确性、一致性、时效性与可访问性标准,来源可靠、程序规范、要素合规且经过“四性”管控的档案数据无疑成为高质量的数据要素基础“原料”。一方面,档案部门应加速数据归档与开放审核工作步伐,实施业务数据的档案化规范管理,逐步推进档案资源的数据化与有序开放,把控好档案数据要素的“源”与“流”。另一方面,各类档案机构应充分挖掘并发挥历史档案资源优势,充分结合当下需求,按照专题整理、加工形成数据集,与实时数据集形成映射关联,或支持研究学习与模型训练。如北京公共数据开放平台专设“静态数据专栏”,提供了3989条数据目录及接口,为档案数据要素的价值激活提供了可行参考路径。[56]此外,档案部门还可基于可信管理、全程管理的工作传统与能力优势,探索担任数据要素质量的评估者、数据要素可信的验证者、数据交易过程的记录者与监督者等路径,保障数据要素的可信、可溯。
(2)着力探索基于场景的数据融合赋能

数据要素的非均质性导致数据的价值因使用对象、适用场景而异。《“数据要素×”三年行动计划(2024—2026年)》指出,要聚焦重点行业和领域,挖掘高价值数据要素应用场景。因此,档案数据要素价值的充分激活,需要结合现实需求,选定并匹配场景,进而基于场景汇聚多源档案数据,发挥价值聚合的倍增效应,实现1+1>2的效果,促进数字场景与实体场景融合发展,使数据要素赋能千行百业。由前述调查可知,当前各部门已实现了多类民生档案数据的开放,如在企业征信场景中,对社保、经营、工商等各类数据的聚合可以实现对信用的综合研判,从而支持决策。档案部门在这一方面也开展了探索性实践,嵊州市档案馆统筹了来自浙江公共数据平台与个人相关的数据和来自档案馆的婚姻档案、学籍档案等9大类档案数据,建设高质量的个人全生命周期数据档案资源库,开发“惠民办事”“出生智治”“基层治理”“居民健康”“共同富裕”等场景,提供了档案数据赋能智慧治理的典型案例。[57]
(3)发挥专业优势助力数据型应用开发
加工是数据要素化的必经环节,相较于原始数据,数据服务与应用更加凸显出深层开发、需求导向的特征。对数据交易平台的调查结果也显示,围绕档案数据形成的多项服务与数据产品具有市场价值。档案机构作为档案数据的供给方与管理方,应充分发挥其资源优势与专业管理经验,在数据资源、算法模型、数据能力层面助力数据服务与应用开发。其一,数据资源层面,摸清档案数据资源底数,有选择地推进数据安全管控与资源供给工作;对于敏感性较强的数据,可在分类分级的基础上,有条件开放部分元数据。如贵州省测绘资料档案馆已注册成为数据商,并在贵阳大数据交易所挂牌了12组关于水准点、三角点、影像、数据模型等的元数据,能够支持地理空间、交通运输、城建住房等场景的学术研究与实践利用。[58]其二,算法模型层面,结合现实需求实现档案数据的模型化开发,在支持基础查询、提供接口等功能的基础上,探索数据校核、数据画像、数据报告、数据分析与可视化等多样化功能的实现路径;同时可依托公共数据授权运营模式或作为数据交易的“需求发布方”,借助第三方平台的技术力量实现档案数据产品的规模化生产。其三,能力层面,可充分发挥档案管理专业知识,支持各业务领域档案数据治理方案、系统的开发,并为数据要素流转、交易全过程文档、数据的归档管理提供档案化管理策略。
(4)积极开展文化类数字资产合作发行
2022年,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,将文化数字化提升为国家战略,指出要发展数字化文化消费新场景、加快文化产业数字化布局,文化数据资产化受到高度关注。文化数字资产是具有资产权属、经济价值和文化属性的可计量文化数据[59],包括数字艺术(非遗、文艺著作、音乐、戏剧、舞蹈等)、数字知识产权,以及数字文创(数字IP、数字人、数字藏品)等多个类型[60]。此次调研发现,北京国际大数据交易所设置了“数字资产”专区,发行了数字文创、数字出版、数字纪念品等多种数字资产。在档案领域,王小云将档案文化产品喻作档案资产价值运动的“先驱”[61],学者们也普遍关注档案文创产品的开发。各档案数据持有方可在充分挖掘馆藏文化内容、创作文化产品的基础上,依托专业平台或与具有资质的发行方合作,推动具有档案文化元素的数字资产上链发行。如中国人民大学信息资源管理学院、数字人文研究中心等基于对清代冰嬉项目的研究成果,与中国数字文化集团联合发行了数字出版物“冰嘻嘻”[62],共计发行8000件并已售罄,可看作是档案文化数字藏品发行的有益探索。
4 结 语
从时代背景变迁的视角看,档案的价值定位经历了资源观、资产观等视域下的内涵扩充,正在经历生产要素观的新浪潮。档案数据具有要素化的存量优势与资源禀赋,应发挥高质量可信数据供给的优势,密切结合现实需求场景,实现数据资源的聚合与服务化、应用化、资产化开发,推动档案数据要素“进场”,充分实现价值释放与倍增。同时,档案部门与档案工作也应在新的机遇与视野下,积极探索与数据治理的协同,融入、参与数据管理的形成、鉴定、预处理等关键环节,成为数据要素质量提升、可信可溯的评估者、监督者,贡献专业力量。
*感谢山东大学历史学院卢亚龙同学在本文写作过程中给予作者的建议。
作者贡献说明
许晓彤:选题,数据调查,论文撰写与修改;张嘉玮:数据调查,参与本文第一部分的撰写;李照川:校对、修改论文。
注释与参考文献
[1]王小云.档案资产论的历史脉络、认知转型及发展态势[J].档案与建设,2016(7):9-16.
[2]陈建,谢鹏鑫.档案资产理论核心概念转变的原因阐释及现实启示[J].档案学研究,2022(1):36-42.
[3]王运彬,王小云.资产客体的扩张脉络与档案资产的理论审视[J].档案学研究,2018(2):44-49.
[4]张宁.主数据驱动视角下的企业档案数据资产管理[J].档案学研究,2019(6):47-52.
[5]邓文霞.从“资源”到“资产”:档案数据资产治理模型初探[J].浙江档案,2022(7): 33-36.
[6][49]冯惠玲.档案学概论 第三版 [M].北京:中国人民大学出版社,2023:45-47.
[7][42]章燕华.以数智化驱动引领档案事业现代化的发展进程与实施路径[J].档案学通讯,2023(6):4-13.
[8]周文泓,王欣雨,刘鹏超.数据要素化背景下的档案数字转型行动空间展望[J].档案与建设,2024(2):38-45.
[9]金波,杨鹏,周枫.档案数据高质量发展:历史进程、演进逻辑与战略布局[J/OL].情报科学,2024:1-15[2024-03-25].http://kns.cnki.net/ kcms/detail/22.1264.G2.20240126.1857.020.html.
[10]本图的绘制受到下文的思路启发:白永秀,李嘉雯,王泽润.数据要素:特征、作用机理与高质量发展[J].电子政务,2022(6):23-36.
[11]周雪恒.中国档案事业史[M].北京:中国人民大学出版社,1994:1-4.
[12]戴双兴.数据要素:主要特征、推动效应及发展路径[J].马克思主义与现实,2020(6):171-177.
[13][18]黄泰岩.论按生产要素分配[J].中国经济问题,1998(6):1-9.
[14]韩茹,王立君,于志海.科技档案与无形资产刍议[J].中国档案,1996(3):23-24.
[15]王世金,袁从仕.要树立企业档案资产观念[J].中国档案,1994(2):12-13.
[16][34][47]于施洋,王健冬,黄倩倩.论数据要素市场[M].北京:人民出版社,2023:33,42-44.
[17][40]朱扬勇.数据自治[M].北京:人民邮电出版社,2020:12,20.
[19]看《政府工作报告》里的向“新”力![EB/ OL].[2024-03-20].https://www.gov.cn/zhengce/ jiedu/tujie/202403/content_6937716.htm.
[20]祁天娇,冯惠玲.档案数据化过程中语义组织的内涵、特点与原理解析[J].图书情报工作,2021(9):3-15.
[21]中国信息通信研究院.数据要素白皮书(2 0 2 3年)[EB/OL].[2 0 2 4-0 3-2 0]. http://www.caict.ac.cn/kxyj/qwfb/bps/202309/ P020230926495254355530.pdf.
[22]赛迪顾问.2023民生数据要素应用研究报告[EB/OL].[2024-03-20].https://www.digitalelite. cn/h-nd-7538.html.
[23]于英香.从数据与信息关系演化看档案数据概念的发展[J].情报杂志,2018(11):150-155.
[24]金波,添志鹏.档案数据内涵与特征探析[J].档案学通讯,2020(3):4-11.
[25]吴哲,丁海斌.“数据”概念史考略及“档案数据”概念解析[J].档案与建设,2023(1):11-16.
[26]赵跃,石郦冰,孙寒晗.“档案数据”一词的使用语境与学科内涵探析[J].档案学研究,2021(3):24-32.
[27]谭必勇,邵亚伟,李跃.谭必勇老师谈档案数据治理与电子证据——2020年“国际档案周学者谈”第五期[J].中国档案研究,2020(2):269-279.
[28]何思源,刘珂.档案与数据关系的多维解析——兼论档案数据的概念定位[J].档案学通讯,2024(1):37-44.
[29]杨茜茜.概念、内容与定位:我国档案数据治理研究的理论坐标[J].档案学研究,2021(6):28-34.
[30]于刃刚,戴宏伟.生产要素论[M].北京:中国物价出版社,1999:1-2.
[31]清华大学金融科技研究院.数据要素化100问:可控可计量与流通交易[M].北京:人民日报出版社,2023:3.
[32]Miller H G, Mork P. From data to decisions:a value chain for big data[J].It Professional, 2013,15(1):57-59.
[33]马费成,吴逸姝,卢慧质.数据要素价值实现路径研究[J].信息资源管理学报,2023(2):4-11.
[35]梅宏.数据如何要素化:资源化、资产化、资本化[J].施工企业管理,2022(12):42.
[36]孙静,王建冬.多级市场体系下形成数据要素资源化、资产化、资本化政策闭环的总体设想[J].电子政务,2024(2):12-20.
[37]奉国和,肖雅婧.数据要素价值释放研究进展[J/OL].图书馆论坛:2024:1-11[2024-03-15].http://kns.cnki.net/kcms/detail/44.1306. G2.20230817.1641.006.html.
[38]夏义堃.数据要素市场化配置与深化政府数据治理方式变革[J].图书与情报,2020(3):14-16.
[39]刘琼.深圳数据要素支出规模已达千亿级[N].深圳商报,2023-02-03(A01).
[41][61]王小云.基于价值实现和权利保障的档案资产论建构研究[M].北京:社会科学文献出版社,2018:5,158-166.
[43]欧阳日辉,杜青青.数据估值定价的方法与评估指标[J].数字图书馆论坛,2022(10):21-27.
[44]王玉,许晓彤.英国档案数据治理现状与启示[J].档案与建设,2023(8):70-75.
[45]蔡跃洲,马文君.数据要素对高质量发展影响与数据流动制约[J].数量经济技术经济研究,2021(3):64-83.
[46]王伟玲,王蕤,贾子君,等.数据要素市场——全球数字经济竞争新蓝海[M].北京:电子工业出版社,2023:26.
[48]泉城商业选址[EB/OL].[2024-03-20]. http://data.jinan.gov.cn/jinan/application/1f9b597a1e5f4 0c08477e04aeaced863.
[50]王小云.档案资产论[J].档案学通讯,2016(4):80-83.
[51]公共数据运营模式研究报告[EB/OL].[2024-03-20].https://dsj.guizhou.gov.cn/xwzx/ gnyw/202205/t20220530_74436679.html.
[52]张会平,薛玉玉.公共数据授权运营产权运行机制的理论建构与实施路径[J].电子政务,2023(11):2-13.
[53] 龚芳颖,郭森宇,马亮,等.公共数据授权运营的功能定位与实现机制——基于福建省案例的研究[J].电子政务,2023(11):28-41.
[54]窦悦,郭明军,张琳颖,等.全国一体化数据交易场所体系的总体布局及推进路径研究[J].电子政务,2024(2):2-11.
[55]海南省数据产品超市入选“2023全国十佳数据交易平台”[EB/OL].[2024-03-20]. https://db.hainan.gov.cn/zdlyxxgk/cgal/202402/ t20240204_3589179.html.
[56]静态数据专栏[EB/OL].[2024-03-20]. https://data.beijing.gov.cn/zyml/lssj/index.htm.
[57]汪伟民,丁云.县域公共数据档案化治理的理论与实践探索——以嵊州市“个人全生命周期档案”综合智治应用建设为例[J].浙江档案,2023(4):11-13.
[58]贵州省测绘资料档案馆(贵州省基础地理信息中心)[EB/OL].[2024-03-20].https://www. gzdex.com.cn/facilitator/merchant/1502.
[59]金巍:文化数据资产将成为未来最重要的文化资产之一[EB/OL].[2024-03-20].http://www. ce.cn/culture/gd/202008/27/t20200827_35614022.shtml.
[60]叶美灵,陈静丽,巨涵.打造数字资产,让文化“活”起来[J].通信企业管理,2023(9):41-43.
[62]数字藏品推介|北京记忆系列之“冰嘻嘻”[EB/OL].[2024-03-20].https://cdcub.com/news/ detail/21.html.
(责任编辑:张 帆 李倩楠)