公共资源交易大数据流通共享的研究
2023-11-14付宏燕
付宏燕
(国家信息中心公共技术服务部,北京 100045)
0 引言
公共资源交易是要素市场化配置的重要内容,也是关联政府和市场的纽带,属于政务公开范畴[1]。公共资源交易大数据的流通共享是对我国政务数据资源共享开放的积极响应,与数据质量、数据规范、应用需求、软硬件等因素紧密相连,并和市场主体、市场环境等构成有机整体,是一个动态发展的体系。
国家公共资源交易服务平台已完成工程招投标、政府采购等五个领域地方数据的归集,推动相关数据资源化并全国流通急需纳入考虑。本文采用服务思维,从交易数据业务特征出发,结合应用需求,设计交易数据资源目录体系和流通服务框架,推动交易数据在全国范围的高效流通共享。
1 公共资源交易大数据的业务特征分析
一是交易领域渐增,数据海量实时更新。公共资源交易以项目交易进展为主线,围绕入场登记、招标、投标、评标、中标、合同的业务环节,形成链条式结构化数据[2];招标公告、中标公示均要求生成当天在规定媒介发布[3]。相对成熟的领域包括工程建设招投标、政府采购、土地使用权出让、矿业权出让、国有产权交易,数据量已超2亿条,年度成交项目数量超110万个。随着公共资源交易范围扩展,海洋资源交易、用能权交易等越来越多领域纳入电子化范围,数据量急剧增加。
二是市场主体角色多样,交易活动类型多样。市场主体是交易活动的发起者、组织者,也是交易行为的参与者、实现者。同一主体拥有多种交易角色,不同主体的类别性质不同。交易类型除招投标外,还有拍卖、挂牌、协议等多种形式。将链条式结构化数据重新组合为不同主题,可反映出交易市场的区域化融合程度,揭示交易行为隐含的资源配置规律。
三是数据多源质量参差,应用需求驱动流通。公共资源交易电子化数据产自全国1000 多个地方交易系统,数据源结构千差万别,数据正确性、完整性有待提高,大量的原始过程数据没有产生价值。按照运用大数据加强公共服务的战略,由需求驱动数据流通和共享,多源数据融合产生应用成效。
2 公共资源交易大数据的资源化现状
2.1 交易大数据初步资源化
数据变成资源是流通共享并发挥价值的前提条件。地方交易系统的海量数据,表结构不同、数据格式不同、数据采集时间点要求也不同[4],通过政务外网级联式归集到国家级平台政务云存储。国家级平台对所归集的数据打标签,识别所属领域、主体性质、交易类型、交易时间等业务特征,对疑似异常的大额中标值核查治理后,形成统一格式的库表和接口资源。
数据规范是交易大数据资源化的依据,是数据共享、交换和应用的基础。2018 年国家发展改革委联合财政部、自然资源部、国资委印发《公共资源交易平台系统数据规范(V2.0)》,覆盖五个交易领域的主要业务环节,约束了数据内容、来源平台和格式,为数据流通和溯源做了关键准备,也是数据生命周期质量控制的机制保障[5]。
2.2 资源尚未形成对外体系
目前,国家级平台形成140个基础库表,涉及3000 多个字段,生成了元数据及数据级联式汇聚与反馈机制,但库表之间业务依赖、包含关系并未形成统一对外的资源目录体系,难以高效支持交易数据资源的流通共享。再者,接口对政务部门开放服务,支持省级、地市级交易平台直接与国家级平台扁平式对接,40 多家政务单位呈分散的点状管理,尚未形成资源应用指标评价使用成效。
3 构建公共资源交易数据资源目录体系
3.1 交易大数据的资源目录体系
交易大数据的资源目录体系架构如图1 所示,以数据归集、资源化体系为基础,从不同业务角度对资源逻辑分类形成层次清晰的资源目录树,支撑从交易领域、流程环节、来源等任意搜索资源,并从交易业务层面定义资源属性等相关项,以及数据应用、资源监测指标。
图1 交易数据资源目录体系架构
3.2 构建交易数据资源目录树
3.2.1 数据资源目录树结构
以交易流程目录树构建为例,应遵循四个原则:第一结合交易流程重点环节、信息公开要求、业务需求划分大类,覆盖统计、分析和监管必需的交易首尾资源、信息公开资源;第二细分交易领域,标识子类;第三突出大类与子类的包含关系;第四各级节点均可扩展。因此,归集的库表资源可划分为入场登记信息、招标公告信息、成交公示信息、交易合同信息四大类;整合数据形成主体成交记录信息类。结合数据规范内容范围和约束,设计如图2所示的公共资源交易数据资源目录树。
图2 公共资源交易数据资源目录树
对于同笔交易,资源目录树的一级子节点纵向跨越交易时间主线,从入场登记到交易合同,表达出一个交易周期;二级子节点、三级叶节点之间为业务层面的包含关系;三级子节点和四级叶节点为1 对N包含关系,代表1 个招标项目包含多个标段。接口资源围绕主体成交记录,分解为三个子接口,内容粒度纵向细化。
表1 交易数据资源指标
3.2.2 编辑目录树节点属性
首先标识资源节点的基本属性和约束。资源节点基本属性对外公开,包括资源名称、资源描述、更新频率、资源容量、是否敏感等。资源节点约束含数据字典和共享条件设置,数据字典说明数据项名称、类型、非空/必填、主键、联合主键、索引、关联关系等;共享条件设置有条件和无条件共享,有条件共享需资源提供方审批并同意。
其次串联同笔交易的节点资源。将同一项目的不同叶结点资源,按时间顺序衔接并串联项目编码,即组合为一笔交易。例如,工程建设招投标领域的标段(包),往前可串联标段所属的招标项目,往后可串联标段的招标公告和资格预审公告、中标结果公示及成交合同,为交易全流程监管做准备。
3.3 构建交易数据资源指标
数据资源指标包括数据应用指标和资源监测指标,见表1所示。数据应用指标映射国家政策对全国公共资源交易市场的影响,也是持续优化营商环境、提升交易服务效能的反馈,根据应用层需求确定,深度绑定交易业务,分领域交易趋势分析、主体成交行为分析、跨区域市场融合分析等;资源监测指标一方面评价资源提供方的服务能力和服务质量,另一方面反映资源使用方对资源的需求程度,及利用资源对业务的支撑程度。
4 公共资源交易大数据的流通共享体系
4.1 资源流通与服务框架
交易数据在政务系统内流通不存在货币媒介的交易,以辅助政务单位的履职为目的。国家电子政务外网承担着全国交易数据的归集,也必然地成为面向政务部门资源流通的主要渠道。国家级政务信息共享平台强化了资源提供方与需求方的有机连接,为数据交换、资源流通和跨部门协同提供了条件。同时,非结构化的交易公告公示,通过互联网面向社会和市场主体开放。资源需求方优质的场景需求产生优质的应用效果,优质的服务成效创造更优的需求,正向迭代推进,资源流通与服务框架如图3所示。
图3 资源流通与服务框架
交易数据跨部门、跨地域的共享和业务协同,体现了交易市场的区域化融合发展,破除省际间招投标的垄断分割,推动竞争有序的全国统一大市场的建设[6]。流通时间越短,流通效益越高[7]。目前流通到中央政务部门的数据资源,用于辅助行业市场项目监管,如住建部利用筛选出建筑类项目与住建工程项目比对,核查参建主体与中标主体的一致性、业绩真实性等;再如银行信易贷中小微企业融资信用评价,2022 年支撑全国邮储银行1 万多次。流通到地方的数据资源,多用于对招投标业务的简化,如南京简化投标人的标书制作和业绩录入;云南利用资源信息取代市场主体注册,降低人为登记的错误,提高办公效率。在全国类似需求强烈,资源共享服务急需扩展。
4.2 数据资源流通的难点
数据资源流通过程中,权属是难题。交易数据产生时,明确标识地方来源平台的数据所有权,但资源化过程中,数据持有权、加工权均无定义,所有权人无法控制或识别数据后续权属。流通过程中,同一数据资源历经不同机构、不同使用者的不同需求,相关使用权难以界定。鉴于此,应优先保护所有权人的权益,严格约束需求方对数据的使用边界,比如对高质量的资源所有权人进行激励、要求资源使用方书面承诺不得用于商业行为等。
5 结语
在大数据上升为国家战略的背景下,数据流通共享拥有政策和市场的双重机遇。公共资源交易数据资源目录体系与流通共享框架相辅相成,以服务主体为本,利于交易数据的价值变现,促进资源配置不断优化。目前区块链技术的应用也在研究中[4],若进一步推动全国主体信用信息、资质信息整合并流通,可极大地提升全国范围交易业务的招投评标效率,完善公共资源交易政务数据生态环境。