用大数据更新维护基本单位名录库的设想
2017-02-04尤启忠
尤启忠
摘要:随着科学技术的进步和生产力水平的提升,在世界范围内,大规模生产、分享和应用数据的时代——大数据时代已经到来。大数据迅速发展对传统统计生产方式的影响,必将带来统计工作思维的大变革。基本单位名录库建设是国民经济统计的一项基础性工作,位列统计“四大工程”之首。如何利用大数据更新维护基本单位名录库,让基本单位名录库工作与大数据接轨,是当下必须要面对的问题。
关键词:大数据;基本单位名录库;维护
中图分类号:TP39 文献识别码:A 文章编号:1001-828X(2016)028-0000-02
一、基本单位名录库的概念及建设历程
(一)基本单位名录库的概念
基本单位是各类法人单位及其所属产业活动单位的总称,是构成整个社会经济活动最基本的单元,也是社会经济信息的主要来源和载体。基本单位的总体状况和结构反映了一个地区的社会经济发展水平和结构特点。基本单位名录库(以下简称“名录库”)是包含所有法人单位和产业活动单位基本情况的信息库。名录库是专门管理各种单位信息的独立的数据库,是政府管理和统计工作的基础信息库和管理工具,是交换单位信息的基础平台,具有重要作用。
(二)名录库的建设历程
名录库是在1996年、2001年二次全国基本单位普查和2004年、2008年、2013年三次全国经济普查的全面更新维护和历年来的部分更新维护建立起来的,已经形成了一个比较完备的体系,为我国的各类抽样调查和各种数据测算提供了基础数据。
二、名录库的工作模式及存在问题
(一)名录库的工作模式
名录库在普查年份是利用普查数据全面更新,在非普查年份进行部分更新维护。名录库的管理模式由原来的国家、省、地(市)、县“四级建库、逐级手工上报”现改为国家、省“两级建库、程序自动上报”。数据更新频率由半年更新改为季度更新。名录库在非普查年份更新维护的流程是各级名录库主管机构按制度要求从同级编制、民政、税务、工商等有关行政管理部门获取新增、变更、注(吊)销单位行政登记资料,地(市)级以上名录库主管机构按照单位活动属地原则,逐级分解反馈至县级名录库主管机构。县级名录库统计工作人员将数据进行整合、排重后进行实地核查,对新增和变更的单位填报法人单位基本情况表和产业活动单位基本情况表,进行整理、审核、录入、改错等工作,对注销单位在库中进行剔除。
(二)名录库存在问题
随着我国社会经济不断发展,单位数量井喷式增长,如2010年下半年西宁市省、市各部门提供的数据为2833条,2015年第四季度随着工商、税务等部门进行商事制度改革及社会经济的发展,省、市各部门提供的数据多达209760条。名录库更新维护工作时间短、难度高、工作量大,工作主要集中在区县统计局,区县统计局无专职名录库维护人员,在规定的时间内很难保质保量完成名录库更新、维护工作而只能委托街道和社区工作人员帮助实地查找。
根据《中华人民共和国城市居民委员会组织法》,西宁市民政局和西宁市市委组织部印发了《关于建立社区准入制度提升社区治理能力的指导意见》,《意见》规定了“权随责走,费随事转,事费配套”的原则,凡指导性目录以外需要委托社区居民委员会办理的有关服务事项,应当按照“平等协商,权随责走,费随事转,委托服务”的原则,实行购买服务。名录库更新维护工作无经费,现在无偿委托社区人员帮助实地查找不切实际。
随着我市主动适应经济发展新常态,紧紧围绕发展“12315”总体目标,全面推进稳增长、促改革、调结构、惠民生等各项工作,社会经济越来越繁荣,基本单位的新增、变更、注销将越来越频繁,再靠原有的工作模式来维护更新名录库,统计人员只能越来越疲惫且无法保质保量完成名录库更新维护工作。
三、大数据的发展和对名录库工作的设想
发达国家已经充分认识到大数据时代的发展趋势,并逐步在统计工作中应用大数据技术。谁能抓住机遇,取得突破,就能够适应时代的发展,把政府统计工作提升到一个新的发展水平。所以,积极掌握大数据技术,提高其在政府统计工作中应用的深度和广度,既是统计部门建设服务型统计的迫切需要和必然选择,也是中国政府统计适应时代潮流、使统计工作走在世界前列的一个战略机遇和客观要求。
(一)大数据发展对统计的影响
大数据的迅猛发展对统计学与政府统计具有划时代的意义。对统计学而言,大数据将突破通过样本推算总体的传统方法,直接对总体进行相关分析,并更加注重结论的相关性和实时性。对政府统计工作而言,大数据是采用多种数据收集方式、整合结构和非结构的数据,是采用现代信息技术和架构高速处理和挖掘、具有高度应用价值和决策支持功能的数据、方法及其技术集成。在大数据时代,无论是统计学还是政府统计都需要做出全面、适时地调整,这既包括重塑统计学方法论及其理论基础,也包括变革性地调整政府统计的管理体系和运作方式。无论哪种变革都需要我们具备创新性的思维、突破传统的勇气,以最积极的姿态融入到已经到来的大数据时代。
(二)名录库利用大数据的可行性
名录库是统计“四大工程”之首,是统计工作的基础,名录库建设的好坏直接关系到统计工作的成败。名录库建设的最终目标是建成一个全国统一完整、不重不漏、真实准确、及时更新的名录库。要实现这一目标,按照传统的维护更新方式,已不适应。利用大数据更新维护名录库,数据来源可分为两部分。一是各行政部门的行政记录数据,这部分数据的特征:第一数据类型基本上是结构化数据。第二数据质量相对有保证。第三遵循一定的标准。二是商业记录和网络数据(如淘宝数据等),这部分数据的特征:第一数据即时产生。第二涉及领域广阔、信息庞杂、数据量大。第三数据具有不稳定性和非标准化。第四数据易获取。
现阶段,用大数据维护更新名录库应主要利用第一部分数据,即各行政部门登记的行政记录数据,这部分数据的利用需要由国务院解决各部门之间指标的标准。在大数据时代各行政部门之间必须打破信息壁垒,进行信息共建共享,各部门之间的数据在交换时可直接应用,这样才能抢占大数据时代的制高点,赢得这场信息化革命的发展先机。直接利用各部门的数据导入名录库,第一能解决各部门之间数据的一致性,不再出现因时间结点、统计口径等因素造成各部门之间出现数据不一致的问题。第二能解决因单位数量井喷式增长,单位变动频繁,使得统计人员无法保质保量完成名录库更新维护工作,减轻基层统计人员的工作量。第三能提高名录库更新维护的效率和数据质量,避免因基层统计人员水平问题,对各指标理解不一致的现象。
我国从2016年10月1日起实行“五证合一、一证一码”新营业执照登记制度,全国将最终形成一个统一的企业数据库,由各部门共享使用。统计部门完全可以利用此契机建立统一的数据库。
(三)大数据在统计工作应用中的探索
现阶段部分专业统计工作中已经利用大数据来补充和完善统计数据。名录库中的数据还是以结构化的数据为主,但在第三次全国经济普查时,利用数据采集设备收集了企业的证照、地址等有关数据,这部分数据是非结构化数据,对单位的识别信息、属性信息等真实性的鉴定提供了补充。随着生产力和信息化技术水平的提高,今后的调查将会更多利用高科技的设备,除了采集结构化数据的同时,也将会采集更多非结构化的数据(如证照、企业外貌等图片、音频、视频等资料)。非结构化的数据所占的比重将会越来越多,政府统计部门应及时总结经验,推动大数据在统计工作中的应用。
(四)大数据时代对名录库的展望
大数据时代扑面而来,数据成为越来越重要的战略资源,具有巨大的开发利用价值和广阔的发展前景。面对汹涌的信息化潮流,只有积极抢占制高点,才能赢得发展先机。数据是统计部门安身立命之本,统计工作者要以开放的姿态拥抱大数据,积极推动大数据与现代统计的深度融合,争当大数据开发利用的“排头兵”。大数据应用既能让我们获得更加客观真实的外部数据,也能得到更加丰富完整的调查总体,提高数据采集效率,是统计调查实现“真实、准确、全面、及时”的重要保障。要加快名录库建设,对数据资源进行深度整合,达到共建共享,真正打破部门间信息壁垒,实现“全国一库”。统计部门要以大数据在统计工作中的应用为突破口,倾力打造数据生产新兴之轨,展开统计工作的崭新时代画卷。