统一社会信用代码数据服务研究
2025-02-20赵涛李卓睿
关键词:统一社会信用代码,大数据,数据应用,数据服务
DOI编码:10.3969/j.issn.1002-5944.2025.03.009
1 背景
统一社会信用代码是一组在全国范围内唯一且终身不变的18位法定身份识别码。2015年,按照《国务院机构改革和职能转变方案》《政府工作报告》(2015年)和《法人和其他组织统一社会信用代码制度建设总体方案》(国发〔2015〕33号)文件要求,以组织机构代码为基础的法人和其他组织统一社会信用代码(以下简称“统一代码”)制度正式确立。同年,强制性国家标准《法人和其他组织统一社会信用代码编码规则》正式实施[1],标志着统一代码正式全面推行。
截至2024年4月,全国统一代码基础数据库中的法人和其他组织统一代码数量已突破1.8亿,呈现出数量大、精度高等特点。统一代码数据作为各类涉企数据的基础数据底座,不仅能够推动各地区、部门间的信息共享,还可与社会、市场各方面信息相整合,形成数据要素市场不可或缺的大数据资源[2]。为响应党中央“充分发挥数据要素放大、叠加、倍增效应”的数据资源开发要求[3],统一代码数据将得到进一步推广,其在支持事中、事后监管,赋能科学决策,助力社会公共信用体系建设,提升政府服务质量与现代化治理能级,促进形成高标准治理体系等方面发挥着越来越重要的作用。
2 统一代码特点功能
统一社会信用代码制度[4]赋予了统一代码全覆盖性、唯一性和一致性(或“稳定性”)等特点,保障了统一代码数据的全面、精准与长期可追溯。
全覆盖性。统一代码制度全面覆盖境内的一切法人和其他组织。
唯一性。境内所有法人和其他组织拥有唯一的统一代码,每一组统一代码只对应一家法人和其他组织。
一致性。统一代码一经赋予,其对应的法人和其他组织无论发生迁移、变更或注销等信息变更,统一代码均不改变。
基于上述特征,统一代码初步实现了身份识别、信息关联和数据分析三大服务功能,具体如下:
身份识别功能。全覆盖性、唯一性和一致性确保了所有组织机构在注册登记后都获得唯一且终生不变的统一代码,统一代码成为精准识别法人和其他组织的“数字身份证”。
信息关联功能。唯一性和一致性确保统一代码作为关联条件,将始终匹配信息主体与统一代码相符的相关信息。
数据分析功能。唯一性确保统一代码作为数据表“主键”,可以围绕统一代码对关联数据进行计数、除重、归集与求和等统计分析。
3 统一代码数据服务
3.1 身份识别服务
基于统一代码的身份识别功能进行身份核验,开展代码主体验证服务;识别信息中的代码主体,跟踪代码主体动态消息,开展代码主体跟踪监测服务。
代码主体验证。根据输入的统一代码条件信息,锁定唯一代码主体对象,并返回所查询统一代码主体的验证结果,满足身份查询、证照核验和实名验证等工作需求。代码主体验证服务适用于审批、认证、监管和开户等工作场景。通过单一条件快速获取完整主体信息,能够提升工作效率、控制业务风险,间接促进代码主体维护良好信息记录。
代码主体跟踪监测。通过建立监测对象代码主体的统一代码表,周期性地批量检索表内代码主体的信息变更、舆情、奖惩和风险等关联信息,实现代码主体跟踪监测。跟踪检测服务可应用于初创企业培育、关注重点企业动向、外迁风险预警和企业舆情管理等工作中,利用统一代码实现大范围、大批量信息监测,可为市场监管、防范风险相关工作提供及时信息。
3.2 信息关联服务
基于统一代码的信息关联功能,对代码主体综合信息进行关联,依据要点进行代码主体画像;关联代码主体风险信息,通过统计建模测算代码主体风险程度,开展主体风险预警;关联产品服务信息,对代码主体进行产业、行业划分,并归入与之相符的产业链节点,构建产业链图谱。
代码主体画像。对代码主体综合信息(成立年限、所属行业、认缴资本、专利、产值和营收等)进行归集,基于均值、分位数等标准,筛选提炼关键信息,进行代码主体画像,将代码主体与同类典型、历史表现进行对比分析,量化代码主体发展水平[5]。基于优质代码主体画像,可对照挖掘具有同类特征的潜力型代码主体。
主体风险预警。围绕代码主体风险行为制定风险指标清单,搜集代码主体风险指标信息,建立风险指标评估模型,归纳风险特征,对触发风险的代码主体进行预警。通过制定风险预警代码主体清单,协助相关部门有序排查代码主体风险、锁定关键问题。
产业链图谱。利用统一代码关联代码主体名称、所在行业、产品服务、专利和标准等产业内容信息,对代码主体进行产业判别,并将其划入产业链图谱具体环节。通过汇集、统计各产业链环节代码主体的产值、税收和专利量等信息,显示产业链图谱中不同环节的强度、价值、潜力和短板,进一步丰富产业链图谱信息。基于统一代码关联信息描绘的产业链图谱能够精准展示产业链各环节和上下游之间的关系和影响,帮助透视产业全景,理解产业运行规律,指导“建链”“补链”“稳链”“强链”等相关工作。
3.3数据分析服务
基于统一代码的数据分析功能,归集统一代码数据,应用股权穿透分析、聚类分析、超前系数和层次分析等算法和模型,围绕经营主体及其活跃度展开统计分析服务。
经营主体分析。基于统一代码关联数据,对经营主体的注册登记、经营、管理和信用信息进行统计分析,如统计分析注册资本、地址、股东、经济行业和组织机构类型等注册登记信息,分析经营主体数量与资本在各区域、行业和内资、外资的分布与变化情况。针对招商引资工作,可对经营主体的地址变更记录和股东信息展开挖掘,了解新增经营主体落户偏好和背景优势;针对安商稳商工作,统计经营主体注销数量和就业人数,梳理注销、退出影响;针对优质企业投资,可对照上市、高新技术和规模以上企业名单,挖掘优质股东投资企业。通过经营主体分析,能够基于实时数据获知经营主体发展情况、重点产业结构变化及区域比较优势。
活跃度模型分析。活跃度模型是测算代码主体经营积极性的工具。从实际经营角度来看,合规经营(年报、经营异常、行政许可等)、生产投入(社保、公积金、融资借贷、用水用电等)和产出(营收、纳税等)三方面信息能够较全面反映经营活跃度水平。通过对市场监管、税务、人社、统计、供电、水务和银行等涉企服务部门业务数据进行归集,将异常名录、年报、税务登记、缴社保、营收、用水用电和银行开户等数据进行关联、统计和建模,确定活跃度指标权重,计算活跃度等级。在活跃度模型基础上,对经营主体的管理水平、盈利能力和资产水平深入分析,获取主体状态、发展潜力和竞争力等信息,摸清产业部门和国民经济发展趋势。
4 统一代码数据服务的问题
4.1 统一代码覆盖业务存在死角
以政府部门为例,随着治理水平不断提高,新政策、新业务和新需求层出不穷。受流程约束、信息缺失、设备系统老旧和职能局限等原因影响,一些部门未记录、关联和储存统一代码及相关数据,不利于开展信息共享、成果研究和调研回访等后续工作。
4.2 统一代码数据服务对象有待扩大
针对企业、居民等政府外部对象的统一代码数据服务有所不足。一方面,统一代码数据的政府管理模式决定了其必须具备安全、审慎的共享前提和内部优先性;另一方面,社会对统一代码数据的认识不足、专业人才的缺失和利益不一致等原因也不利于相关数据服务的进一步推广[6]。
4.3 统一代码国际化阻力大
受制于国内外法律法规、标准规范不对等,代码使用习惯与侧重点不一致等制度性、历史遗留性问题[7]。统一代码尚未与境外各地区机构标识码建立完整映射,不便于识别境外法人和组织机构。统一代码在境外知晓度不高,较少被境外主体所采用。
5 提高统一代码数据服务质量的建议
5.1 健全基础制度,推广统一代码数据
数据分析是实施现代化治理的核心要务之一[8],建议不断健全数据基础制度,提高数据流通效率和流通广度,促进统一代码数据价值最大化。一是健全数据基础安全制度。增加针对统一代码的数据安全法规解读与实施细则,对统一代码登记数据中的身份证、电话以及可关联的纳税、存款等隐私、敏感数据制定数据审查框架及执行方案,完善关键数据的安全与隐私立法。积极采用标准化战略,加快跨部门、跨领域的数据脱敏、数据合成和隐私计算等标准协议制定和实施,打通数据堵点。二是建立长期稳定的数据共享制度。明确统一代码及其可关联数据开放对象、内容和原则,建立监察与绩效评估机制,切实保障数据开放执行力度。探索“专数专用”“期限保密”“规模限制”“场景限制”等多样化、授权式的数据开放模式,形成标准化流程,提升数据共享效率。
5.2 提升数据应用水平,赋能行业生产力
为提升统一代码数据应用水平,推动数据要素市场融合发展,建议进一步开发统一代码数据服务,为数字产业化应用添砖加瓦。一是支持统一代码数据应用产业。支持推广数据可视化、流程控制、风险探测和代码主体监测等实践项目,探索统一代码数据授权运营机制,开发自监督、深度学习模型、跨模态和生成式等机器学习模型,提升数据挖掘、分析水平。宣贯推广《法人和其他组织统一社会信用代码信息应用指南》国家标准,培养公众数据思维,提高统一代码数据使用率,向社会释放数据红利。二是推动数据要素与产业相融合。推动统一代码数据服务方与电子商务、文体休闲、能源环境、医疗卫生和农业农村等领域建立交流合作机制,借助区块链、云计算等信息技术,强化跨层级、跨地域、跨部门和跨业务的数据汇聚、融合与共享,基于产业需求开发APP、小程序和Web应用等定制化数据应用。建立开放式监督评价机制,对可用性、及时性和准确性等质量维度进行打分评价,提升数据服务质量。三是研究统一代码数据在重点领域试点。优先向银行、保险和证券等与经营主体联系紧密的领域开放统一代码数据试点,鼓励相关研报采用统一代码数据,通过流程优化形成可复制、可推广的服务标准与协议。
5.3 对外接轨,推动统一代码国际化
我国始终致力于推动统一社会信用代码国际化。一是制定上位法律制度,强化统一代码法律地位。在发达国家,用于识别组织机构的代码形式大体分为两类:一类以瑞典、挪威和新加坡等国为代表,在企业注册登记时赋予企业用于身份识别的组织编码;另一类以美国(雇主识别号EIN)、欧盟(税务编码VAT)和澳大利亚(商业号码ABN)等国为代表,将企业在税务部门注册获取的税务登记号用于企业识别。综合对比,我国的统一代码在注册形式上与瑞典、挪威接近,在功能上兼具“五证合一”功能,具有创新性和领先性,宜采用法律文件载明统一代码法律性质,增强国际公信力。二是将统一代码与国外代表性组织机构标识码形成映射。当前国际范围内通行的组织机构身份识别码有由邓白氏公司创立、基于全球编码系统的邓氏编码(D-U-N-S Number);金融稳定委员会(FSB,由20国集团参与组建)制定的全球法人识别编码(LEI,ISO 17442-2019),两套编码均已在国内开展相关服务。我国人民银行、外汇局和证监会等金融机构正在建立全球法人识别编码与统一社会信用代码的映射及更新机制。建议加深对《信息技术组织和组织部分识别结构》(ISO/IEC 6523-1:2023)等代表性国际标准的研究,积极参与数据交换、监管互认和服务共享等国际合作,提升统一代码国际影响力。三是开展统一代码数据跨境应用试点,探索安全合规稳定方案。从数据量、浏览量和调用量等指标进行筛选,挑选统一代码数据系统建设水平较高的外向型城市开展试点,以《全球数据安全倡议》为原则,推进跨境数据基础设施建设,支持内外资企业参与数据安全、认证评估等标准规则制定。优先围绕跨境电商、供应链管理、服务外包等典型应用场景开展试点,支持统一代码数据参与跨境信用、投资关系和债务融资等信息咨询服务。深化跨境数据分类分级管理机制,健全多部门协调配合的数据跨境流动监管体系,推动建立跨境数据双边、多边互利互惠规则制度。
作者简介
赵涛,标准化高级工程师,商事登记与代码应用研究所所长,长期从事标准化、知识产权及统一社会信用代码的研究工作。
李卓睿,统计师,商事登记与代码应用研究所研究员,长期从事统一社会信用代码的数理统计、数据挖掘及数据服务工作。
(责任编辑:张佩玉)