福建省机构代码数据质量现状分析
2012-08-24陈振团
陈振团
(福建省标准化研究院,福建 福州 350013)
国家信息化、标准化事业的发展推动了代码应用范围的扩大,并且加大了应用力度和应用深度,在全国范围内有30多个政府职能部门应用统一代码标识及其相关信息,代码数据库已经成为国家基础信息数据库之一;在福建省,“数字福建”工程已采用统一代码标识。代码作为信息标准化的重要基础工作,其数据质量的准确、可靠、有效已成为代码数据库系统的生命线。按照国家代码中心代码数据质量保证的有关要求,对福建省代码数据质量现状作一个分析,以期达到进一步作好代码数据质量工作之目的。
1 有效数据、废置数据、沉淀数据的界定[1]
有效数据界定:在代码申请表t_jgdm中的数据,均为有效数据。
沉淀数据的界定:在代码申请表t_jgdm中,办证日期超过代码证书4年有效期的仍未换证或年检变更的记录,称之为沉淀数据。实际上沉淀数据是其有效性尚待确认的数据,仍然可以算是有效数据的组成部分。
废置数据界定:废置表t_fzdm中的记录都为废置数据。
经查询统计:有效数据总数为:561,905家,其中77,862家为沉淀数据;废置数据总数为:364,075家。
2 代码数据库更新概况
代码数据更新概况体现了代码数据的时效性。截止2012年08月31日,福建省累计办证数为925,890家,其中废置机构数据364,075家,有效机构数据561,905家。下表列出2008年之前累计及2008年之后每年代码更新(新办、换证、年检、变更)次数的统计:
从表1可以看出:(1)福建省企业法人数量相对稳定,12年来(代码管理系统从2000年开始保留代码数据变更历史记录),企业法人废置数据与有效数据之比为70.50%;企业非法人废置数据与有效数据之比则达到160.79%,说明福建省企业非法人生存周期更短、更不容易存活。(2)随着中国机构改革的深入发展,国家决定取消事业非法人机构类型,事业非法人机构明显正在逐步消亡;随着民政局对社团登记工作管理的加强,社团非法人的废置情况也相对较快。(3)随着社会体制改革和经济的发展,其他机构数量增长较快,废置数据与有效数据之比仅仅10.18%;民办非企业废置数据与有效数据之比为8.40%;个体户废置数据与有效数据之比为20.68%;工会法人机构最稳定,废置率仅仅为2.91%。另一方面,随着社会法人治理结构的调整,法人机构相对比较稳定,无论是企业法人,还是事业法人、社团法人和机关法人,废置数据与有效数据之比值,相对来说都比较低。这些情况都说明代码数据变化与福建省社会经济发展现状是比较吻合的。从表1还可以看出,12年来,企业机构平均更新率7次左右,事业法人、社团法人、机关法人机构平均更新率达到9次,所有机构平均更新率接近6次;事业非法人和社团非法人更新率高是因为国家对这类机构登记管理制度的改革使这类机构有效数据锐减引起的。从代码数据更新概况可以判定代码数据维护是及时、准确、可靠的。
2 数据质量情况[1、2]
2.1 代码唯一性
重名记录:在有效561,905条记录中,有31家重名,列表如下:
经核查,表2的31个重名数据中,有15家(带*号)重名机构符合批准机关登记管理条例,属正常合理的重名机构;有16家需要核查修改。不合理重名数据占全部有效数据的比率是0.003%;因为重名的数据涉及外省市相关单位,必须双边协调解决,目前正在逐步改正中。以上事实说明在采用全国联网代码管理系统BS版之后代码的重码重名问题已经得到严密的控制:重码数据可能性为零,重名数据的可能性降到了万分之零点三以下。
2.2 数据完整性
在代码数据库中,每个机构由48个基本信息项组成,其中26个信息项是必录项,22个信息项是非必录项。经过核查,有效数据561905个记录中,机构代码、机构名称、机构地址、机构类型、邮编、经济类型、经济行业、行政区划、法人代表姓名等26个必录项填报率达到99.70%,其中有一家职工人数为空值,经办人姓名和经办人手机空值446个记录,平均空值率0.30%。前几年比较常见的必录项空值现象基本上不见了。外资企业中外方投资国别代码空值率为0,注册号空值率为0;批准机构名称或注册机构名称空值率为0,必录项中企业法人机构注册资金空值率为0。22个非必录项填报率达到60%以上。非必录项中主管部门名称为空值的有401,079条,空值率达到71.38%,原因是目前许多机构无主管机构,另一个原因就是非必录项代码窗口录入人员也会相对宽松一些。经统计:经营地址、经营邮编、经营电话、开户银行、开户账号、经费来源等9个非必录项的空置率接近100%;主管代码、主管名称、主要产品代码等13个非必录项的平均空值率约为6%,综合起来计算,22个非必录项空值率小于40%。
从以上统计情况来看,代码数据必录项完整性很高,非必录项完整性有待提高。
2.3 数据准确性
2012年国家中心把代码数据的准确性提高到空前的认识,要求各省市以代码电子档案为准核对代码数据项。按照国家中心0.2%等距离随机抽样检查结果,福建省代码数据准确率达到95.23%;按照福建省自行1.5%随机抽样检查结果,福建省代码数据必录项准确率达到95.68%。需要说明的是随机抽样是在排除电子档案不规范的情况下得出的抽样检查结果,相对比较宽松一些,如果把电子档案准确性的因素也考虑进来,准确率达到90%,刚好达到国家中心的要求。这说明下一步福建省还要狠抓代码数据准确性的问题,并且要进一步加强电子档案规范管理工作,保证代码数据质量保持在全国前十名争取达到更靠前的位置。
2.4 年检、换证情况
根据四年来的年检、换证任务完成情况,每年换证、年检大多数县市都是超额完成省中心下达的指标。总体完成指标超过100%。
4 数据质量评价
福建省代码数据质量总体来说还是比较好的。不存在重码单位,31家重名单位15家是正常重名,对于16家不正常的重名机构,也都找到原因,正在协调处理中。重名的比例达到万分之零点三以下,是1993年开展代码工作以来最低的。有效数据必录项完整性达到99.70%。必录项数据准确性相对较高。非必录项完整性达到60%以上。累计赋码量达到925,890家。有效数据561,905条。废置数据364,075条。数据时效性明确,不存在乱码和数据混乱现象,数据可靠性高。代码数据唯一性、完整性、准确性、时效性得到空前的保证,为代码全面深入应用奠定了坚实的基础。
另一方面,关于沉淀数据问题,根据最新统计,代码有效数据库中仅有77,862家属于沉淀数据,沉淀数据与有效数据占比达到13.85%,与往年相比,数据沉淀率出现逐年下降的趋势,说明这几年代码应用全面铺开以及狠抓代码数据质量,代码数据时效性有了显著的提高。
5 存在问题分析
主要是数据时效性问题:沉淀数据77862家,占有效数据561,905家的13.85%。客观地说,出现沉淀数据是正常的,从上述沉淀数据总量来看,基本上反映了在市场经济条件下的企业生存规律,一部分企业停产、倒闭了,它的经济活动也就停止了,反映在代码数据库上就是超期不年审、不换证,因而产生沉淀数据。其次是代码应用部门的问题,应用部门强化、深入应用代码信息,是减少代码沉淀数据的一个重要手段。三是代码管理部门要充分发挥代码工作的政策优势,加大年审、换证力度,不断减少沉淀数据。
数据准确性保证工作有待进一步努力,根据国家中心的安排,下一步要对代码数据进行逐条与电子档案核对,经济行业分类标引录入也需要进一步精确化,提高代码数据在社会经济统计分析领域的应用效果。
6 下一步数据质量工作重点[1]
一是贯彻实施福建省代码管理中心制定的《福建省组织机构代码工作质量手册》,各级代码工作人员都要严格按照手册规范管理代码数据质量工作,把好数据采集质量关卡,建立代码数据质量内部审核管理制度,不断完善代码数据质量管理体系。
二是沉淀数据的处理:沉淀数据要有专人负责,福建省代码管理中心要把沉淀数据列入另库,通过工商、税务等部门把已经注销的企业从沉淀数据库中废置掉。
三是各级代码工作人员应该对本地数据库记录进行一次全面的核查,凡是必录项不准确的数据的都要通过修改窗口修改补录。
四是坚持每个月随机抽样检查通报制度,把抽样检查的样本与合格率水平公布在福建代码网站上,公开透明,代码工作人员也可以及时发现自己存在的问题,及时进行修改和纠正。
五是把电子档案核查工作与数据审核工作结合起来,预前把好数据质量审核关口,提高各县市上报数据的电子档案合格率。
7 结束语
代码数据质量工作是代码工作的基础,也是代码全面推广应用的前提。通过分析,希望全体代码工作同仁看到目前福建省代码数据质量的现状,增强代码工作的紧迫感和责任感。大家齐心协力,不断提升代码数据质量,推动代码信息应用向更深入更广阔的方向发展。
[1]顾迎建.组织机构代码系统工程[M].北京:中国计量出版社,2007.
[2]张冬青,顾迎建.组织机构代码登记手册[M].北京:中国计量出版社,2011.