大数据背景下“四经普”工作展望简析
2018-12-06
一、大数据发展情况简介
国外学者对大数据的研究可以追溯到《Nature》于 2008 年推出的 Big Data 专刊,也就是说大数据概念在2008年就已经被提出。随着社会对大数据的逐渐了解,维基百科给出了一个关于大数据的描述:大数据指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据科学家John Rauser提出一个简单的定义是,大数据是指任何超过了一台计算机处理能力的数据。
近年来,在我国对大数据的研究和应用不仅引起了我国自然科学和人文社会科学界的广泛重视,也受到我国中央政府的高度关注,并将大数据列入国家战略。《“十二五”国家战略性新兴产业发展规划》明确提出支持海量数据存储、处理技术的研发与产业化,《国民经济和社会发展第十三个五年规划纲要》中也提出了“实施国家大数据战略”,这些都说明我国早在“十二五”期间就已经在推动大数发展,并配套出台了一系列的文件,如国家先后颁布了《关于做好制定“互联网+”行动计划有关工作的通知》《大数据产业发展规划(2016-2020)》《关于组织实施促进大数据发展重大工程的通知》《促进大数据发展行动纲要》等。
作为政府统计部门,国家统计局也在高度关注大数据在统计工作中的应用。2012年8月国家统计局科研所就召开了大数据应用研究座谈会,提出了在大数据时代运用现代信息技术建立统计云架构的研究目标。2013年11月,国家统计局与上海钢联电子商务股份有限公司、山东卓创资讯集团有限公司、58同城信息技术有限公司、天云融创数据科技(北京)有限公司、中国联合网络通信有限公司、天脉聚源(北京)传媒科技有限公司、百度在线网络技术(北京)有限公司、阿里巴巴(中国)有限公司、纽海信息技术(上海)有限公司、昆明泛亚有色金属交易所股份有限公司和南京擎天科技有限公司共11家企业签订了大数据战略合作框架协议,共同推进大数据在政府统计中的应用。通过国家统计局的一系列动作可以看出,“大数据+统计”的大数据宏观管理时代已经到来,并即将对未来的统计工作影响深远。
二、大数据对传统统计工作带来的机遇和挑战
目前来看,大数据已经引起了统计部门的高度重视,大数据的应用必将掀起全国统计系统的一场革命,面对“大数据+统计”,统计系统既要抓住机遇,又要迎接挑战。
大数据促进了部门数据的共享。我国的统计体系分为政府综合统计和部门统计两大体系,大量的数据分布各个领域,由于没有统一的数据规范,跨部门、跨行业、跨地区的信息很难实现互连互通,形成许多信息孤岛,导致数据无法系统地进行整合,对数据的挖掘、分析造成了壁垒。在大数据时代,通过建立政府部门与应用平台之间的统一数据交换接口,有效地规范和整合各部门、行业间的信息资源,来满足各方面需求,进而提高工作效率。现在的市场上的商用企业信息查询系统,“启信宝”、 “天眼查”、“企查查”等大数据平台,就是充分利用了全国企业信用信息公示系统中的企业信息数据为基础,再将中国裁判文书网、中国执行信息公开网、国家知识产权局、商标局、版权局等网上公开的企业信息数据进行挖掘和整合,而形成的大数据,这些数据对于社会公众全面了解企业发展现状具有很大的帮助作用。
大数据创新了数据的采集方式,提高了采集效率。 “一套表”联网直报是目前统计信息化的重要工具之一,有利于统一业务流程,保证数据质量,但也存在平台不完善,制度不健全,管理模式不合理等缺点。大数据时代将为政府统计部门提供一个更加完善的、开放的的信息系统,以便在相对统一的数据收集框架下开展数据采集工作,并及时解决数据存在的冗余、空缺和错误,以及更新不及时等问题,进一步提高统计数据质量。传统的数据采集方式多是通过纸质报表和手工记录来完成,数据采集过程中对人员的专业要求比较高,而在大数据时代,统计数据的采集是通过互联网、计算机等工具来完成,只要采集人员能够熟练掌握互联网、计算机等新兴的信息化技术即可。这些方式不仅能降低统计信息采集的门槛,还能吸引更多非统计专业人员参与到统计工作中来。另一方面,通过大数据也提高了数据采集效率,使统计数据能够及时、准确地反映经济社会发展现状。
大数据对统计工作带来了机遇也带来了新的挑战。在当前的政府统计工作中全面运用大数据进行统计分析还需要很长一段时间。在这个传统与现代统计生产方式相互交织的过程中,对政府统计能力提出了新挑战。一方面政府统计数据还要继续使用传统的统计调查方法、数据采集和数据处理方式来开展日常工作,以满足国家当前宏观管理和社会公众需要。另一方面,政府统计系统还要超前谋划,积极主动地投入大量的人力物力进行大数据的挖掘、处理和运用,否则将无法适应大数据宏观管理时代和公众社会时代对统计工作的新要求。
大数据对统计数据的权威性带来了挑战。过去提到数据不由自主地就会想到统计部门。但是,倘若现在再坚持这种的观点,那就不是与时俱进了,而是逆潮流而退了。现代社会,以电子商务、网络社交、网络游戏和在线搜索为主体的互联网经济日新月异,海量数据由统计部门掌控的时代已经一去不在复返。各个企业和国民经济各个部门以及社会群体都拥有大量的可观数据,只要对其进行数据挖掘,便可得到十分重要的“数据宝藏”。面对大数据时代,统计系统如果还沉浸在“法定数据”、“法定部门”的官本位思想中,并试图继续维护统计部门的权威性将越来越艰难。
面对当前大数据时代的到来,统计部门在开展各项调查、周期性普查工作中,不可回避大数据时代对统计工作的冲击。2018年将开展“四经普”工作,如何充分利用大数据成果开展经济普查工作,将是一个崭新的课题,也是对新时代统计工作的一个检验。
三、充分利用大数据,开展“四经普”工作
2018年第四次全国经济普查,是在十九大后习近平新时代背景下,开展的第一次全国大型普查,也为我国制定“十四五”规划提供重要的基础性资料,此次普查要全面调查我国第二产业和第三产业的发展规模、布局和效益,了解产业组织、结构、技术、形态的现状以及各生产要素的构成,并摸清全部法人单位资产负债和新兴产业发展情况,进一步查实各类单位的基本情况和主要产品产量、服务活动,全面准确反映供给侧结构性改革、新动能培育、经济结构优化等方面的新进展。可以看出经济普查的指标多,涉及到单位的方方面面内容。而在商事制度改革后,各类经济主体日新月异,每天都有大量的经济单元“诞生”,这就要求摸清普查对象单位数据是一项重要的基础性工作,如实填报普查对象的经营信息是普查最低要求。面对繁重的普查工作,如何利用大数据来提高普查数据质量和工作效率将显得尤为重要。
1.充分利用商用企业信息查询系统大数据,开展企业单位清查。根据《普查试点方案》要求,此次普查明确提出,在正式登记前进行全面的地毯式单位清查。2013年的经济普查,由于没有单独地进行单位清查,在正式普查登记阶段,耗费了大量的时间进行查遗补漏,而结果却不是令人十分满意。建议在现有名录库数据的基础上,充分利用商用企业信息查询系统对名录库数据进行全面的更新维护。首先,按照单位名称信息剔除工商部、编制、民政等部门已注销的单位名录,然后利用企业2018年上半年工商企业年报信息对单位名称和法人代表相同的单位进行全面的覆盖式更新,进而解决名录库工作中的历史遗留问题,净化名录库数据。
2.充分利用编制、人社、民政部门大数据覆盖更新机关、事业、社团等单位信息。根据社会统一信用代码证办理规定,2017年底所有的单位必须完成换证工作,同时结合机关、事业单位养老制度改革,充分利用部门数据实现全面批量覆盖统计部门名录库中的机关、事业、社团单位名录。通过上述两种方式摸清辖区内的单位“家底”,减轻基层普查中的查遗补漏工作量。
3.充分利用税务、财政、人社部门财务大数据,更新维护单位财务指标。企业的生产经营指标可以通过税务的纳税记录进行更新,机关、事业单位的非企业支出、从业人员可以通过财政部门和人社部门的数据进行更新,确保在清查阶段开始前,能够将一个精准、完整的普查单位名录清单以及财务指标数据导入到PDA数据采集终端中,普查员只要利用PDA数据采集终端逐一上门核实、更新变动的相关数据信息便可。
4.充分利用大数据开展后期普查数据的开发利用。当今世界,大数据、云计算、人工智能等技术迅速发展,地理信息技术也开始拥抱大数据。统计地理信息系统是未来统计成果展示的发展方向,在“四经普”后期资料开发中要充分将普查成果进行可视化处理,并进一步整合人口普查、一套表数据、年鉴以及其他相关部门的资料,让在数据通过各种图表进行融合展示,使普查成果更好地服务社会大众。地理信息技术与大数据结合将会产生非常神奇的效果,可以让人做到“所见既所得”,使数据的展现更加直观、易读。
综上所述“四经普”是2018年全国统计系统的一项重要工作,充分利用大数据是普查工作的必由之路。目前,不管是“大数据”依托统计工作,还是统计工作依托“大数据”,这已不是主要问题,但是统计工作如何充分利用“大数据”,做到“大数据”与传统统计无缝衔接却是目前统计工作需要解决的问题。在大数据时代下,统计的生命在于服务,统计部门应该顺势而为,充分挖掘、利用好“大数据”,进而提高统计信息服务水平,以适应国家宏观管理和决策的需要。