APP下载

公共信用信息数据分类“三维坐标法”探究

2021-09-27徐朗

现代营销·理论 2021年8期

徐朗

摘要:公共信用信息的使用是我国治理体系和治理能力现代化建设的重要组成部分,也是构建国家新型监管模式的重要核心。本文从社会信用体系建设工作实际经验出发,提出了“三维坐标法”的信用数据新的分类方式,以期在信用模型构建、政府机构行业信用监管等方面提供有效的数据分类参考。

关键词:公共信用信息;三维坐标法;强相关性;数据分类

一、我国公共信用信息发展概况

公共信用信息的采集(采信)、评价(评信)、使用(用信)是我国社会信用体系建设的基础性工程。2017年出台的《上海市社会信用条例》对信用信息做出了定义,是指可用以识别、分析、判断信息主体守法、履约状况的客观数据和资料。2018年出台的《北京市公共信用信息管理办法》对公共信用信息做出了具化说明,公共信用信息是指行政机关以及法律、法规授权的具有管理公共事务职能的组织,在依法履行职责过程中形成或者掌握的,能够反映法人和非法人组织以及18周岁以上的自然人信用状况的数据和资料,包括基本信息、良好信息和不良信息。由此,可以看出公共信用信息的核心是具有公共属性,强调信息正面和负面、违约和履约。

近年来,公共信用信息使用过程中面临诸多问题:第一,公共信用信息数据字段界定不清楚,造成数据采集过程中“泥沙俱下”,加大了评信、用信环节数据清洗、处理工作量。第二,信用模型制定时追求“大而全”,但评信时发现数据缺失严重,从而造成评信环节无法落地,信用模型最终被“束之高阁”。第三,信用评分方式不一,对关键数据字段认识不足,从而造成批量评估出现分值较大区间差异或较小区间差异的特殊现象,造成用信环节人员“千头万绪”。第四,公共信用信息提供单位对信用数据理解不一,对数据共享使用造成数据质量不高、数据处理程度较低、共享实施困难等。综上,公共信用信息使用的核心是进一步推动信用信息数据的标准化建设。

二、信用信息标准化建设概况

信用信息标准化建设即探索符合数据应用和现代化治理的新方式,也应当清楚认识到在大数据技术的推动下公共信用信息将重构企业信用评价体系。【1】我国在信用信息数据标准化建设方面取得了一定进展,2017年制定发布的《全国信用信息共享平台工程标准-公共信用信息分类与编码规范》中对数据字段采取编码制,从信息主体、性质、类型、地域、行业、时效、形态等做出了说明,其中信息性质上仅区分了正面、中性、负面三类。2020年上海市出台了《公共数据“三清单”管理规范》地方标准,该标准仅对政府机构数据清单做出了相关说明,数据规范化仍停留在采集端。相关标准的出台有利于实现公共信用信息的共享,推动公共信用信息的应用,但从具体数据共享后的使用、信用专业人员的培养、信用模型的搭建思路等方面仍存在较大的探索空间。

三、数据分类“三维坐标法”概念解析

(一)三维坐标法制定原则

三维坐标法是通过标签的方式综合公共信用信息数据信用相关性、数据获得性、充分必要性的分类方式,着重解决信用模型、信用评估、信用应用三方面建设、实践的实际问题。三维坐标法核心目的是解决当前信用理论研究与实践操作不适应、信用模型建设与信用数据采集不匹配、不同行业评信方向与信用数据繁杂不平衡的问题。

三维坐标法制定的原则是注重理论与实践相结合,但更强调公共信用信息的实践性,重在提高信用数据的使用效率,提高使用人员对信用数据的简易认知和理解。注重将企业作为有机整体进行剖析,力求在信用评价过程中完整性与开放性、易读性与合理性、普适性与科学性相协调,能够在有限条件下全面、有效开展企业信用评价工作。着力解决公共信用信息线下评分中主观判断向线上评分中客观判断平滑转变,以期能够加快线上信用评分模型的开发和落地,提高行业信用监管的智能化效率。

(二)三维坐标法指标定义与案例

信息分类是根据信息内容的属性或特征,将信息按一定的原则和方法进行区分和归类,这并建立起一定的分类体系和排列顺序。【2】三维坐标法是依据数据属性对公共信用信息进行标识和归类。

信用相关性是某一数据字段与信用核心的边际程度。通常标识为A+(具有较强相关性)、A(具有相关性)、A-(具有较弱相关性)。信用相关性是公共信用信息数据使用的核心,决定了评信过程中模型制定的方向和模型中不同模块的权重比例分配。

数据获得性是某一数据字段在采集过程中的数据完整程度。通常标识为A+(具有较强获得性)、A(具有获得性)、A-(具有较弱获得性)。数据获得性是公共信用信息数据使用的基础,数据的完整程度决定了信用评价、评估模型是否具有可实践性、合理性。

条件必要性是某一数据字段在评信环节必不可少,甚至起到决定性作用。通常标识为A+(具有较强必要性)、A(具有必要性)、A-(具有较弱必要性)。充分必要性是评信环节的重要考量因素,考虑信用相关性、数据获得性严重缺失时工作继续与否,也充分体现被评价对象信用情况的真实绩效。

通过三维坐标法对公共信用信息数据进行标识种类有27种排列组合,按照信用相关性、数据获得性、充分必要性顺序形成“XXX”的标识架构。在信用模型设计实践中充分考虑到“A+A+A+”的强关联比例,以保证信用模型的科学合理和落地使用的有效性。具体编类结构图如下:

以企业法人注册登记信息部分数据字段为例,对其数据属性进行分类:

由上表可以看出,企业登记状态、营业期限、经营地址等具有强关联效应,综合分析三项指标皆关系到企业是否合法合规经营。而针对注册资本、实缴资本、注册地址等指标,它们虽然与企业经营有一定关系,但在注册改革“认缴制”和“集中登记”制下其与企业诚信经营存在一定脱钩,因此在属性分类时进行了弱化。因此,仅针对企业注册信息进行评价时,可以适度向强相关指标倾斜,提高其权重、分值等。

综合分析当前政府机构在行业管理中信用评价方式方法,其评价体系也体现了三维坐标法的相关原则和思路。以《上海市在沪建筑企业信用评价标准(2020版)》为例,建筑企业信用评分总分100分,基础分为65分,加分项为35分。其中基础分多为不良信用信息扣分项,并明确了“扣完为止”工作原则,扣分项包括拖欠农民工工资或者工程款、项目负责人不到岗履责等。实际上,失信信息在整体评分中占据较大的权重比例,也凸显了违法违规数据的信用较强相关性。

在《上海市环境监测社会化服务机构信用评价指标体系(2020年版)》中,明确了基本情况、人员能力、备案信息管理等普适性评价条款,即充分考虑到不同规模机构间差异化,通过数据获得性调控评价模型可实践,以保证不同发展规模、不同发展阶段企业间都具有评价意义。在“诚信记录”评分模块中,针对不良记录累计扣分不设上限直至总分归零。

四、总结

本文提出的公共信用信息“三维坐标法”是相较以往“线”“面”数据分类的一种创新的混合分类方式,本质上以应用为导向,旨在加快对数据的结构分析、确保信用模型搭建过程中的实践性。尤其是在当前大数据技术条件下,为构建快速响应、可落地实践的行业信用监管模式提供了切实可行的思路和參考。

参考文献:

[1]楼裕胜. 公共信用信息环境下的企业信用评价研究[J]. 统计与信息论坛,2021,36(2):110-118. DOI:10.3969/j.issn.1007-3116.2021.02.011.

[2]李向华,江洲,周莉. 公共信用信息分类方法研究[J]. 标准科学,2018(12):113-116. DOI:10.3969/j.issn.1674-5698.2018.12.022.