APP下载

刍议数据要素化下的档案事业发展

2024-09-20周文泓丁家友祁天娇王宁宋懿

档案与建设 2024年7期

主持人语:数据要素化是我国数智转型和数字中国建设的焦点内容。在此背景下强调积极对接融入数据战略的档案事业也迎来更多的转型升级挑战与更为广阔的发展空间,也对档案学科的理论与方法扩充提供了丰富场景。档案与数据要素化是怎样的关系、数据要素化是否以及如何对档案领域产生影响、数据要素化导向下的档案事业和档案理论方法如何加以适应、面向数据要素化档案实践的可能的创新空间与发展路径是什么、档案学科应当如何积极应对数据要素化带来的机遇和挑战等问题越发凸显。对谈成果并非标准答案,而是在于一方面发现这一主题的关注点以及对有关概念的差异化认知,另一方面明确这些问题可能的切入点,由此对接数据要素化,从而帮助建构档案领域中更加严谨和系统的研究框架。(周文泓,中国人民大学信息资源管理学院)

关键词:数据要素;档案数据;数据要素化;档案理论;档案方法;档案管理;档案工作

▍周文泓:

在讨论档案与数据要素化这一大主题时,通过不同的学术报告、论文,可以看出学者们对数据要素的认知具有一定差异。在差异化的认知下研究档案领域和数据要素化有怎样的关系、档案领域如何融入数据要素化则有更不同的认识。面向数据要素化这样一个于实践中极具战略与复杂性、在理论上充满未解之题的事物,档案领域或许不着急下定论或是确定问题的答案,可能需要先做的是发现问题,即便是伪问题,也有它确认的价值。因而探讨数据要素化导向下,有怎样的关键议题值得学界关注和推进并映射于业界,是笔者的出发点。

理论方法层面,关键的是创新扩展。一是概念问题,比如数据要素化的政治经济学内涵,如何扩充档案的界定以及有关档案数据要素价值的诠释?数据要素讲场景,那是否不同领域的档案、不同生命周期阶段的档案的界定以及价值的阐述就需要各不相同的解读?例如,企业档案和综合档案馆的档案的市场化可能性与路径应该是不同的,从数据要素化的角度来说,这两类档案的定义就需要各自界定。二是理论问题。数据要素化导向下已有档案基础理论会有怎样的变化,有可能提出新的理论吗?比如,数据要素强调流通利用,它会不会对我们的“来源”产生影响,如果“来源”发生变化,那么文件连续体理论、文件生命周期理论、档案鉴定理论等又有哪些变化?三是方法层面,面对数据的资源化、市场化和治理化,档案方法是否也有相应扩展创新之处?例如,市场化会否颠覆部分数字档案资源开发利用的原则、理念、模式等?

实践路径层面,档案实践应怎样和数据要素化充分融合?一是档案事业如何同数据要素化战略有效对接?比如,档案事业“十五五”规划是否会有体现“数据要素×”的版块或是明确档案探索数据要素化的优先领域或场景?二是档案机构在数据要素化之中可以扮演怎样的角色?是从档案事业扩展向数据事业的监管和指导,还是以档案做数据要素化的探索先锋,抑或是凸显哪些新的职能和业务?三是数据要素化目前已有相对达成共识的行动模式,如公共数据授权运营、数据交易、数据开放等,不同模式对不同档案主体、对象、环境等有怎样的适应性,档案领域如何采用不同模式、如何优化调整?

学科层面,则着重于科研共同体和教育的问题。例如,当前在新文科导向下强调档案学科的“数字+”、跨学科、交叉学科等视角,如提出建立中国自主的计算档案学,数据要素化可以提供丰富的试验场景,但有哪些关键的学科要展开联动,前提则是我们要知道从档案主导的视角出发,确定边界以及可利用的其他学科的内容与方法,这些都如何实现?再如,如果我们要做产学研用的体系化建设,哪些行业更适合档案参与,又如何构建适用且可行的档案场景?

总的来说,面向数据要素化,一方面,档案领域要深刻洞察并充分理解数据要素化是什么,在此基础上才有可能去讨论档案与数据要素化应有的作用点、探索空间和融合路径;另一方面,数据要素化始终处于发展进程中,档案领域应有主动参与并贡献其中的意识,在寻获答案之前不如先探寻关键议题。此外,理论与实践总不093b19700ddd373becef59adf71f5a2d24a09f8e545f09c958e8e30e2f1a346c是完全同步的,有关数据要素化的档案研究倒也不应完全限制在实践层面,学理性的研究应当尽早布局。

▍丁家友:

笔者关注的问题是数据要素视角下的档案跨界合作问题。当前研究中,“档案的跨界合作”概念中重要的部分在于什么是“界”,以及档案相关机构在合作中的目的是什么。关于“界”的判定,主要呈现出三种观点,即以“档案行业”为界,以“档案服务”为界,以“档案所在文化机构”为界。就“目的”而言,现有文献对其描述较为模糊,其一是给出如红廉档案数字编研、档案文创产品等具体的目的,另一则是通过宏观且多元的描述将多项档案工作作为目的描述。就档案跨界合作模式来说,其主要分为四种:一是与图、博等为代表的公共文化机构合作;二是与媒体行业合作,包括与报纸、电视、广播等传统媒体和微博、抖音等新媒体跨界合作两种形式;三是与社会公众合作;四是与其他机构合作。

档案跨界合作概念定义的核心问题在于以何为界,以何为目的。前者划清理论界限,后者指明实践导向。从数据要素的视角阐述这一定义,档案跨界合作应是以档案服务为界,通过与其他行业互补人才、资金、知名度、数据资源等方式完成包括档案收集、保存、处理、利用等一系列档案工作,最终目的在于发挥档案数据的要素价值与潜力。由数据要素的视角出发,档案跨界合作的模式可理解为与数据端、开发端和资本端的合作,最终可划归到数据要素的资源化、资产化和资本化的合作。在资源化阶段,档案行业通过与以民间团体为代表的数据端合作,以众包、UGC等协同方式,提供高质量的档案数据资源;在资产化阶段,档案行业负责提供可用的档案数据资源;在资本化阶段,为档案数据赋予金融属性得以最终完成档案数据的要素化过程。

档案的跨界合作离不开客观条件的助推与支持。具体而言,档案学科的衍变为其提供了理论基础,并在很大程度上证明了档案跨界合作的必然趋势;新兴数字技术的发展不仅拓宽了档案跨界合作的可能,而且有助于实现档案成果的多元应用和价值拓展;“局馆分设”的档案机构改革更加明确了档案跨界合作的分工。三者共同创造了档案跨界合作的机遇。

从宏观上来看,档案跨界合作以档案数据要素化为根本目的,在顶层设计上应当依照“引进来”和“走出去”的原则进行相关活动。其一是“引进来”,涉及多元化数据、相关技术等多方面档案领域所不具备的外界资源,具体体现在档案数据要素资源化及资产化的过程之中;其二是“走出去”涉及档案数据要素创造社会效益并最终具备有价性、增值性、收益性等资本化特点,需要借助外部手段进行合作开发与流通运营。具体体现在档案数据要素资产化及资本化的过程之中。通过资源化、资产化和资本化三阶段,不断获取可用、可信的高质量档案数据资源,进而利用档案数据所展现出的金融属性,实现拓宽数据价值的目标。

▍祁天娇:

数据要素视角下的档案数据化及资源组织,关乎三个研究问题。一是数据要素化视角下档案与数据的关系是什么,或者说档案领域如何去审视数据要素这样一个经济学概念,并在这一概念影响下如何反思档案自身概念的变化。二是面向数据要素化,档案数据化工作的核心任务是什么,或者说数据要素化对传统档案管理提出了哪些新命题。三是如何通过档案资源组织来实现档案数据化、数据要素化,或者说档案管理领域面向数据要素化要开展哪些具体工作。

数据要素是数字中国建设尤其是数字经济发展过程中出现的一个经济领域概念,强调的是从数据到数据要素的一种生产关系的变化。数据泛指对客观事物的数量、属性、位置及其相互关系进行抽象表示,以适合在这个领域中用人工或自然的方式进行保存、传递和处理。数据要素是指那些以电子形式存在的、通过计算的方式参与到生产经营活动并发挥重要价值的数据资源。这两者的核心区别在于数据能否作为生产要素参与到生产经营活动中,即价值层面的区别。换句话说,数据要素化的核心意义在于为数据增值。从档案视角来看,我们往往会把利用土地、人力、能源等传统生产要素开展生产的业务过程中产生的各类数据称之为业务数据,而把业务数据中具有凭证性价值和参考性价值、应长期保存的数据进行归档留存,这部分数据即成为档案。归档过程中我们对数据价值的鉴定本身也成为数据要素化的一个重要基础。如若对这部分档案再进行增值开发,使其赋能生产经营的各项业务,那么从数据到档案、从档案到数据要素、从数据要素再到新的业务数据产生,就会形成档案参与下的数据要素化闭环。

其中,我们将从已归档数据即档案,经过资源开发、业务融合和流通利用转化为数据要素赋能业务生产的过程称为档案数据化。档案数据化的核心任务是要基于一定的数据标准,显现化、量化处理档案的内容、结构、背景与管理过程数据,使之能够为机器可理解、可操作,并通过人机互动挖掘档案关系、规则与模式,为用户提供档案知识服务。为完成这一任务,档案数据化需要经过档案整序、档案利用、档案融通、档案流通等基本流程。其中档案整序是面向档案管理者开展的一种资源组织行为,旨在通过对档案的描述、分类、主题揭示来建构档案的秩序;档案利用是一种面向档案信息利用者开展的组织行为,旨在通过对档案的意义描述、多元分类、主题抽取来形成可供检索的档案数据库并提供数据利用服务;档案融通是一种面向机构资产协同管理开展的资源组织行为,旨在通过档案与业务的关联、档案与数据的关联、多模态档案的关联等,实现档案跨库、跨系统、跨业务、跨领域的汇聚融通,形成机构档案资产;档案流通则是最终面向市场交易者开展的资源组织行为。

在探讨数据要素化之前,档案资源组织的单元主要集中在三个层级,分别是:集合单元,即以一个档案汇集作为资源组织的对象,例如一个全宗、一个类或一个专题等;文本单元,即以一个具有明晰的、可判别范围的主题的文本,作为一个资源组织对象,例如一份文件;数据单元,即以一个具有明确语义的数据作为资源组织对象,一般表现为一个概念、一个知识单元或一个实体。数据要素化的核心主旨是为数据增值,因此在面向数据要素化的档案数据化过程中,还应关注一种新的资源组织单位——价值单元,即以一个可开放、可流通、可交易的价值体作为一个资源组织单元,可表现为一个数据单元或多个数据单元的汇集。

基于明确的资源组织对象,面向数据要素化的档案资源组织过程就更为清晰。由于数据要素是经过标识的数据,因此要对档案进行标识标注的基本描述;由于数据要素是经过分级分类的数据,因此要根据档案的精准描述对档案开展分级分类;由于数据要素是具有经济价值的数据,因此要将档案与业务生产关联起来,挖掘其中的数据价值;由于数据要素是经过确权的数据,因此要基于档案描述、档案与业务的关系对档案开展溯源;由于数据要素是要在市场上流通的数据,因此要进一步强化档案的开放、共享、融通和交易。

总的来讲,数据要素化提出通过档案数据化实现档案增值的核心命题,而要解决这一命题,档案数据化过程中的诸多档案组织工作还需要长期的数据化改革与转型。

▍王 宁:

数字政府建设视域下的档案数据价值实现涉及三个问题。首先是数字政府建设背景下的数据治理特征。数字政府建设已是一个持续多年的命题,我国数字政府转型的推进程度也日益加深,2023年发布的《数字中国建设整体布局规划》更是将发展高效协同的数字政务作为推进“五位一体”的重要构成。其中数字政务发展的核心要求是数据赋能,一是数据汇聚融合,二是数据共享开放,三是数据开发利用,在此过程中贯穿全程的是数据的依法有序流动,也是跟数据要素化最切合相关的一项工作。基于数据赋能的治理工作,实现的是对数字政府建设的两大目标的支撑,一是推进政府的科学决策,二是推进管理服务效率的提升。那么在数字政府建设下的数据治理要求是什么?在这一场景下,开放数据赋能的目的主要是配合数字政府发展所体现的技术驱动的整体性治理、精准化驱动的决策服务和多主体协同的治理合力等核心特征,需要立足于公共数据的开放共享、政务信息化基础设施的共享共用和规模性数据价值的充分释放。基于这样的核心要求,数字政府领域的数据治理仍面临着数据治理体系不完善、数据权属不明晰、数据标准不完善、数据共享障碍和开放性不足等现实问题。结合我国国家数据局初建的阶段,可以得出一个认知,即我国数字政府领域的数据治理仍处于发展阶段,数据治理机制的各方各面均待完善。那么在这样一个建设性阶段,档案数据,或说档案部门的积极入场,恰逢其时。一方面,档案数据作为数据治理的重要资源可以也应该积极融入数字政府建设;另一方面,政府领域数据治理的现存问题也能够帮助我们照见自己,反思档案数据资源建设和治理的关键问题,以寻求优化和发展的空间。

其次是档案数据在数字政府建设中的价值特征。结合数字政府建设对数据汇聚融合、数据共享开放和数据开发利用的核心要求,档案数据的主要优势和不足分别如何体现?当然,我们取得广泛共识的是,档案数据资源是参与数字政府建设的资源宝藏,包括档案数据所蕴含的丰富的规范化管理的政务活动背景信息、对业务活动进行可信管理的数据信息及长期保存的重要数据信息,等等。概要而言,档案数据具有可靠性强、综合度高和价值丰富等核心优势,尤其是综合度高的优势非常重要。当前大部分数据挖掘、数据分析都是基于规模性、即时性的数据在开展,然而面向档案数据这样的跨时性、跨机构的数据成果,将可以进行更为全面和深入的场景开发,实现其重要的历史重现和信息重用价值。这部分数据既包括档案馆长期馆藏保存的档案数据,也包括各政府机构归档和待归档的重要电子文件数据,其跨时性和丰富性非常凸显。这些具有独特性,能够体现我们职能价值、功能优势的数据资源,在数字政府建设进程中有着非常重要的价值实现空间。基于政策的相关调研也发现,当前我国电子文件和电子档案在数字政府领域的价值实现场景,也正在从社保、税务、婚姻登记等民生服务领域向资政决策、科技开发、文化教育、企业建设、信用服务等更广泛的范畴拓展。与此同时,档案数据存在的问题主要体现在档案数据的流动性弱、滞后性强和追求“固化”的传统管理方法等方面。流动性弱源于长期存在的“重藏轻用”的理念和追求“高安全”的职业思维,在一定程度上限制了档案数据与其他公共数据的流通共享;滞后性强重点体现于“后端意识”主导,参与业务活动的主动性不足,此外还包括档案数据价值的应用场景认知不清晰,服务意识不足等问题;档案管理的特殊方法决定了档案数据的非结构化程度普遍较高,细颗粒度的数据开发有限。整体上,档案数据在数字政府建设中的存在感较弱,核心职能优势亟待挖掘。

最后,数据要素化思维对档案数据赋能数字政府建设的启发。数据要素化的本质建设思路是市场化配置,即由市场评价贡献、按贡献决定报酬,要求数据要素需要具备“可量化(计算)、权属明晰、可控制、可交换”等指标特征,这也为档案数据价值的实现提供了相对明确的指标思路参考。在“数据要素化”的路径中,档案数据的价值实现需要从档案数据的产权制度、档案数据产品加工的深化、档案数据的可信流通保障和档案部门参与数据要素战略等层面着手,逐步推进档案数据在要素化背景下的价值实现。一是档案数据产权制度的确立。长期以来,档案的开放性不足除了理念问题之外,与产权、授权制度的不明晰、不完善也有直接关系。“数据二十条”已明确提出公共数据授权制度的重要性,那么我们需要着重思考包括行政管理档案数据、公共档案数据和个人档案数据等在内的档案数据资源的确权和利用问题。二是在数据价值链理论的启发下,深化推进从档案数据的资源化向资产化阶段的发展。资源化是当前档案数据资源建设的重点关注阶段,而资产化则需要形成更加丰富有力的能够支持决策和公共服务的各类档案知识产品,不再仅仅依据档案的“原始面貌”来发挥作用。此外还应推进档案数据资产的登记工作,和其他类别数据资产一样来衡量其价值,尤其是基于“向内赋能”的思路,进行档案数据资产的登记工作。三是结合档案部门的“可信管理”职能,在数字政府建设背景下实现档案数据要素的流通和合理配置,重点解决数据来源可信、交易可信、用户可信、审计可信等问题,扫除信任机制导致的数据要素价值实现障碍,实现档案数据要素的共享和价值共创。最后,档案部门应承担起作为公共数据管理机构之一的重要职责,积极参与到建设可信数字政府、发展高效数字政务的进程中,在数据质量管控、技术标准建设和可信流通治理等方面主动贡献自己的能量。

▍宋 懿:

在档案事业领域,伴随“档案数据化”与“数据档案化”双向融合趋势的快速发展,全国各地涌现大量档案数据治理实践,档案数据基础理论与知识体系建设迫在眉睫。目前,研究者对“档案数据”的概念界定尚未统一,学界对档案数据治理的理论研究仍处起步阶段。对此,笔者认为在学术探讨中应有效区分“档案数据”在“开发与计算语境”和“保存与开放语境”中的双重意涵,并逐步厘清要素化背景下档案数据要素的属性特征、权属界定和流动方向等关键问题。为此,笔者立足“要素价值论”视角,引入法学领域数据权属问题的相关研究成果,在考察我国授权运营背景下公共数据权属界定实践现状的基础上,探讨与公共数据属性相似的档案数据在权属界定及治理方面的未来发展。

权属是一个法律概念。在我国传统财产权制度体系中,“权属”一般指向狭义的“财产所有权”,关注法律范围内所有者对财产使用、收益和处分的权利。“数据权属界定”的难点在于:(1)数据利用的非排他性等特征,与所有权绝对性等特征间的矛盾冲突;(2)前数据时代的法律主体制度框架的核心内容,与数据运作底层逻辑关键构成要素间的矛盾冲突;(3)全生命周期中数据属性特征对场景的高度依赖性,与法律规范相对静态性间的矛盾冲突。由此可知,数据权属界定的关键在于:确定哪些利益需要保护,构建科学的数据权利体系,形成不同利益主体间的激励相容。

公共数据是指各级行政机关以及具有公共管理和服务职能的事业单位,在依法履行职责过程中获得的各类数据资源;授权运营是有权机关代表政府,授权具有专业化运营能力机构对公共数据进行加工处理,开发形成数据产品和服务,并向社会和市场提供的行为。作为我国数据要素化探索的前沿实践之一,公共数据授权运营在数据权属与授权制度等方面的经验,对我国档案数据要素价值实现和数据治理理论发展具有一定的适用性和可借鉴性。在吉林大学法学院齐英程副教授与笔者开展的合作研究中,经对现行公共数据授权运营政策文本(截至2024年5月底)和数据管理专家访谈的内容分析,我们将当前我国公共数据权属中的授权现状特征归纳为:(1)授权主体行政资质不定,且授权流程模糊;(2)授权运营方式不一,且运营风险突出;(3)授权规则制度不明,且监管机制匮乏。摸底调查表明,在中央层面尚未明晰公共数据授权运营制度法律定位的前提下,公共数据的权属界定面临着“国有和民营企业授权平等”“营利与公益目标平衡”“政策与规范动态平稳”等风险与挑战。

数据要素化背景下,推动档案数据管理实践和治理理论的进一步发展,亟须辨明档案数据属性、阐释价值生成机理、协调多元主体关系。结合授权运营背景下公共数据权属调研结果,笔者认为应在未来制定相互协调的系统化档案数据治理制度,以确保档案数据的合理利用。首先,需挖掘典型场景中档案数据的属性特征、进行分级分类,明确其在法律、经济和社会层面的基本定位,为档案数据全生命周期有效管理提供清晰的指导原则。其次,应深入阐释档案数据的价值生成机理,包括档案数据如何转化为经济、社会、文化价值,以及如何驱动知识创新和决策支持。再者,协调档案数据价值实现过程中多元主体间关系至关重要。授权运营框架下,如何保护政府、企业、公众和科研机构等多元主体权益,需构建有效沟通机制和协商平台。最后,未来政策应着重明确档案数据授权流程、规范运营方式,建立健全监督机制,推动档案数据的高效利用和创新价值实现。

(责任编辑:张 帆)