面向政府数据治理的数据资产价值系统仿真评估
2021-07-01段尧清
朱 泽,段尧清,何 丹
0 引言
当前,各个行业都在探索数据治理所带来的数据价值再造,我国许多政府机关部门也在积极尝试。数据治理的意义在于将数据作为资产进行一系列权力控制,以实现其价值最大化[1]。因此,如何评估数据的价值和有效性,是关系到数据治理方向和治理质量的重要环节。我国政府数据治理尚处于发展期,由于其数据资产具有区别于其他主体的特征和复杂性,在以往的相关研究中,较少将政府数据资源作为资产进行价值管理和挖掘。本文分析政府数据资产的特征,并按照数据治理各个环节在数据资产中的价值体现进行相应评估,从而明确政府数据治理中的价值构成,以帮助政府更好地对数据资产进行价值开发和管理。
1 研究综述
当数据治理业务逐步向政府主体拓展时,政府数据资产概念成为重要论题。在数字治理研究中,有学者提出数据治理目标是“在管理数据资产的过程中,确保数据的相关决策的正确有效,确保数据管理活动的有序可控,确保数据资产得到正确有效的管理,并最终实现数据资产价值的最大化”[2],认为数据治理的前提是将数据整合成为数据资产。但是,政府数据资产有别于社会企业或其他社会单位的数据资产。
首先,政府数据资产具有典型的多元异构特征,数据量庞大、结构复杂,这是由政府的社会监管者职能所决定的。其数据来源涉及社会生活的方方面面,表现形式多种多样,如图1所示。
图1 政府数据资产来源
其次,政府数据资产的价值难以量化。不同于企业以营利为主要目的资产价值表达,政府数据资产大部分都是公益性的,其价值具有潜在性,即使产生了价值增值也很难进行量化研究。经济学中对于资产的价值评估主要有3种方法:市场法、成本法和收益法[3],其中市场法和收益法都需要一定的价值参照,即市场同类资产价格或资产的未来预期收益,而政府数据资产通常不具备这些参照。
最后,政府数据资产的价值效用形式多样。政府数据资产的核心功用并不是创造商业价值,而是支持政府运行和服务人民群众。因此,在评估政府数据资产的价值创造能力时,将与其价值评估面临同样的问题,即缺乏明确的经济标尺,一些间接受益和外部效益难以准确衡量[4]。
政府数据资产的特征也为其资产的价值评估带来了一些困难。以往的研究认为,数据资产具有3个基本特性:可控制、可计量和可变现。因此,众多政府数据资产评估案例都从这3个特性出发进行价值提炼,从而实现评估。“可控制”代表政府数据资产的管理特征,涉及存储、调度、分配、保管等过程,相关研究多为存储机能、安全保护相关制度和措施的评估[5-7]。“可计量”代表数据资产的数量特性,良好的数据资产必定是可量化的,可量化的前提是数据标准的制定和结构的分类,部分研究针对数据的各项计量标准化问题展开评估。这类研究元数据标准、数据分析、存储标准等角度,对特定政府部门的数据进行评估[8-9]。“可变现”能力是政府数据作为资产最具代表性的特征。以往针对政府数据价值的研究,大致分为两类:一类是借鉴企业资产管理的经济视角进行评估,如数据资产价值评估[10]、数据经济质量评估[11];另一类是从政府数据的绩效角度进行评估,如政府信息共享能力评估[12]、政府数据开放度评估[13]、平台建设及利用情况评估[14]。
上述3个基本特征是政府数据价值体现及评估研究的普遍切入点。政府数据资产的特殊性使其市场价值和使用价值难以统一,生产价值和使用价值分离。目前大多数政府数据资产评估都采取了构架指标体系的评分制。这类指标体系可以在一定程度上反映政府数据资产的部分抽象价值,但缺乏具象的经济价值载体,在数据治理活动中,难以形成一套统一有效的价值衡量标准,无法满足数据治理背景下数据资产价值发现的要求。因此,当数据治理活动的主体由企业转向政府后,政府数据资产能否形成更全面、更立体的数据资产价值发现和评价体系,将成为政府数据治理的重要一环。
2 政府数据资产价值结构系统分析
2.1 政府数据资产价值系统边界
当政府数据由资源向资产转化,由管理向治理转变时,政府数据资产的价值衡量就需要更加流程化的方案。从经济学的角度看,资产的价值被认为是其基础价值和使用后产生的增值的集合。基础价值是资料生产为其带来的客观价值,取决于数据资产收集和管理过程中的资源投入、数据资产规范程度以及生命周期等。这些价值是生产过程中其他资源的价值投入转化而成的,是其最基本的价值属性。而数据资产的生产资料属性也会在其利用和共享后带来一定的经济效益,形成一种综合价值;这种价值体现在数据资产使用后产生的经济增长或社会效用的提升。
但是,政府数据资产的公共属性决定了其缺乏完整的商业供应链条,依赖于收益、市场要素、竞争环境等因素的传统价值评估方式将难以应用。同时,没有完整的商业供应链也使政府数据资产客观价值和价值增值二者间缺乏明确的事实关联,成为政府数据资产价值判断的一个难点。因此,在以往的研究中,对于政府数据资产价值的来源判断通常有两个方法:一是从产品视角,将政府数据资产作为生产成果进行产品价值鉴定,包括资产的成本构成分析、产品生产线分析、数据质量代替评测等;二是从应用视角,依据政府数据资产的应用场景和受众对象,对其使用过程中产生的社会效益和用户反馈进行评估,包括开放程度、平台使用情况、数据活性、用户评价反馈等。这两种价值来源基本决定了政府数据资产价值的系统边界。在政府数据资产价值研究中,可能有更多元化的价值组成形式和差异化的实际情况,但在系统界定中,还是需要以上述边界为主,去除一些可能的个体性情况。
2.2 价值结构的因果分析
政府数据资产的产生初期是政府信息部门根据相关需求,依靠政府各相关部门对部门内部或相应社会领域产生的重要数据进行采集,并通过一定的成本投入进行数据转化、筛选、存储,因此来源部门的数量、涉及的领域数量与政府数据资产的数量呈正相关关系。而成本的构成主要包括投入的人员成本和软硬件成本,成本的投入与数据资产的数量和质量也呈正相关关系。数据资产数量的增加一方面会影响到数据的质量;另一方面也会影响到数据使用所产生的附加价值。为此,数据资产利用阶段所产生的价值可以从两个维度来评价,即数据的质量和数据的使用活性。数据质量中对数据资产价值有直接影响的变量包括:元数据标准缺失率、新鲜度、数据容量、价值密度等;而数据使用活性主要来源于用户视角的行为体现,包括数据浏览量、数据集下载量、用户反馈率、数据可替代系数等。另外,用户的反馈又能反作用于数据资产的再生产,拥有优质反馈的数据资产说明其使用价值较高,因此在数据的再生产中会获得较高的优先级别。
政府数据资产的价值形成具有动态性和反馈性。在技术实施和数据收集过程中,从数据行为到资产转换中耗费的人力与物理成本、固定投入,再到数据资产的质量和生命周期,以及面向用户的数据流通率、独占性等,都使政府数据资产的价值形成一个多变量、高阶次、多回路、非线性的复杂系统。由此来看,政府数据资产的动态评估依赖于对这一复杂系统的认识和量化。因此,本文尝试利用Vensim Dss软件开展政府数据资产价值评估。本研究依据相关分析,建立因果关系回路图,如图2所示。
图2 政府数据资产价值系统因果关系回路图
3 流量存量图及方程构建
3.1 流量存量图构建
政府数据资产的价值体现在从收集治理的产生到提供社会使用的全过程。政府数据资产价值构成系统动力学流程图,则是对政府数据资产产品的生产-利用-再生产过程及其价值结构的分析描述。系统结构分析包括边界确定、变量及其相互间作用性质的因果关系分析。在对政府数据资产价值进行结构分析的基础上,可绘制相应的系统流程图。数据资产的可利用量、政府数据资产的数量、数据资产评估价值为存量;生成率、涉密和私有数据比率、获取率、再生率等为流量;人员成本、软硬件投入、数据集浏览量等为常量,数据集数量、数据资产可替代系数、等为辅助变量。对于数据资产评估价值,价值增量为其流率,主要由预期数据使用溢价和用户反馈率组成,详见图3。
图3 政府数据资产价值系统流量存量图
(1)成本投入(人员成本、软硬件投入)——数据集数量——数据资产可利用量的正反馈回路。这条反馈回路反映了数据资产的价值一部分来源于政府在数据收集和生产阶段投入的人力与物质成本,其机制是成本投入增加,数据来源和类型更多元,从而提升了质量,整体表现为数据产量增加,进而可用的高质量数据也随之增加。
(2)数据资产数量——数据资产可替代系数——预期数据使用溢价的负反馈回路。这条反馈回路表明:数据资产数量和类型的增加,可供用户使用的数据类型随之增加,数据间的替代性增强,从而提升了数据间的竞争性。但是,数据资产可替代系数增加意味着数据资产的价值冗余也随之增加,因此会一定程度上降低数据资产的预期价值。
(3)数据集数量——数据集浏览量——数据集下载次数——再生率的正反馈回路。该反馈回路表明了用户行为模式对数据资产再生产的正面影响。其机制是用户的使用行为对数据资产的生产形成正反馈,即被大量利用的数据集将刺激再生产,从而增加这类数据的价值。
3.2 评估模型的数据设定与仿真
模型的数据设定与公式赋值需要参考相关案例[15-16],并对数据进行回归分析、相关预测等,部分数据还需依据具体单位的实际情况进行设计。本文的部分数据来自武汉市数据公开平台等,数据条目共4,590条。本文通过统计分析反映数据使用活性的浏览量、下载量等数据,对于部分无法获取数据的公式,则通过相关平台的协作者进行模拟取值。本模型的公式设定如表1所示。该模型通过Vensim Dss模型测试,构建表现合理。
表1 政府数据资产价值系统动力学模型参变量
对模型的运行,时间范围设定为1年,数据资产价值评估的变化曲线如图4所示。其中,前6个月的数据价值增值会比较缓慢,后期则集中增长,一定程度上符合成本价值稳定、使用价值增长存在的客观事实。同时,在仿真的过程中,如果涉密和私有数据比率超过45%,数据集的访问、下载和使用量会呈现负增长趋势。总体来看,模型的仿真效果比较符合实际情况。该模型表明,在成本价值和使用情况数据明确的前提下,政府数据资产价值的经济表现可用一个具体的评估数值来表达,且就资产增值能力而言,存在一个6~7个月的缓冲期。在具体的应用场景中,该模型能有效提供经济变化指标,从而为政府数据治理提供更明确的量化标准。
图4 政府数据资产价值评估曲线
4 结语
本文通过对以往政府数据资产价值相关研究的梳理,提出了传统政府数据资产评估中存在着的标准化问题。在当前政府治理的新形势下,政府对数据治理全过程的把控,需要有规范化的数据资产价值评估方案。为此,本研究提出了不同于传统政府数据资产价值评估的新模式,引进系统动力学方法,对政府数据资产采集、处理、管理、利用、再生产的全过程中可能存在的价值因素进行模拟,构建政府数据资产价值系统因果关系回路图和流量存量图,尝试为政府数据资产治理提供明确的价值导向和分析工具,并揭示政府数据资产全生命周期的内部规律和运转机制。总体而言,依靠系统论能够在一定程度上解决政府数据资产价值评估中缺乏市场量化工具和组成结构复杂的问题;但政府数据资产的重要性和敏感性,也为这类研究带来了困难和阻力。政府数据治理的研究还处在探索阶段,其中的数据价值评估既是重点也是难点。同时,各地政府部门的数据资产情况和内部环境各有差异,在实际的量化评估中还需要依据具体情况对模型进行修正和完善。