大数据时代如何开展统计调查工作
2016-05-14宋立京
【摘要】大数据时代对统计工作提出了新的要求和挑战。统计调查作为统计工作的基础,应该按照规定的步骤进行,这样的调查结果才是真实可靠的。同时,调查方式也要创新,传统的抽样调查方式应当与网络调查和一定范围内的普查相结合。
【关键词】大数据时代 统计调查
统计学领域当前较为流行的词语之一就是“大数据”。时代要求对海量数据进行加工、提炼,以得到有价值的信息资料。统计调查是统计工作的基础,如果不能对“大数据”这一新课题进行深入研究,调查结果就会与实际有差距。本文就大数据时代如何开展统计调查进行初步探讨。
一、大数据时代统计数据的特点
一是数据总量巨大。2014年8月,IBM(国际商业机器公司)的研究称,整个人类文明所获得的全部数据中,有90%是过去两年内产生的。而到了2020年,全世界所产生的数据规模将增长43倍。
二是类型繁多。传统的统计数据一般侧重于对数字关系的计算和对比。在大数据时代,数字只是数据的一小部分,更多的数据表现为网络日志、音频、视频、图片等等。
三是数据价值密度相对较低。随着互联网技术的进步,大量碎片式的信息不断被制造出来。但对特定部门和人员来说,其中的绝大多数价值并不大。如何发挥计算机的强大计算功能更迅速地完成数据价值“提纯”,是目前亟待解决的难题。
四是时效性要求高。市场形势瞬息万变。如果对市场信息未加及时的分析,政府管理部门就不会做出科学的方针政策,企业就会在市场竞争时处于劣势甚至被淘汰。
二、传统统计调查方式的欠缺
随着市场经济的深入推进,统计调查方法改革势在必行。而现实情况是,多年来,我国各级政府发布的统计数字不能反映经济社会发展真实情况,有关部门陷入了“塔西佗陷阱”的尴尬境地,没有进行统计调查方法的科学选择是主要原因。
一是没有真正做到抽样调查,样本的选择不具代表性。市场经济条件下,同一行业内部经营规模有相当大的差距。为掌握该行业的总体经营情况,必须确定代表性的样本,通过对样本的计算推算出该行业的总规模。而现实情况是,受各种主客观因素制约,在开展调查工作时,没有严格按照抽样调查的原则要求进行。有的通过网络调查的方式进行,有的则采取大街上发放调查问卷的方式,甚至进行“选择性”调查,也就是怎么方便怎么调查,等等。这些调查方式,虽然名义上是抽样了,实际上样本没有做到“随机”,所以其代表性大打折扣。
二是统计调查过程不严谨,数据处理不科学。许多统计调查不是由专业的统计机构而是由行业管理部门自身开展的。受各种因素制约和影响,样本确定后,有的部门不考虑影响数据变动的有关因素,对调查到的数据只进行简单处理。比如,为反映一个城市公交发展成都,需要计算该市的公交分担率。这就需要计算有关公交线路的客运量。据本人查看有关资料,有的部门出于各种目的,会有意识地选择或避开客运高峰时段进行客运量统计。这样一来,计算出的结果往往差距好几个百分点。又如,各级统计部门公布的人均可支配收入指标,经常遭到大家质疑。这是因为可支配收入指:个人收入扣除向政府缴纳的各种直接税以及非商业性费用等以后的余额,可以基本认为是每人的实发工资。而在当下中国,相当一部分人其实还有一部分支出,那就是每月要还房贷,许多年轻夫妇一人的大部分收入用于还贷,还贷压力很大。所以在需要还贷的这段时间,他的实际可支配收入可能很低,与官方公布的人均数据差距很大。
三是调查资料利用度低。第一,许多统计调查仅有数据的罗列,或是进行简单的求和、平均、增长速度等处理,没有进行正态检验、相关回归等基本统计分析和主成分分析、因子分析等多元统计分析。第二,许多统计调查报告文字说明有余,数据资料不足。有论点没有论证,加上论据不足,所以调查资料的指导意义不大。第三,信息化建设滞后,有的统计调查信息陈旧,需要资料时不能随时查阅。还有,许多统计调查工作多部门都在开展但资源彼此不能共享,重复进行。浪费了人力、物力和财力。
三、如何开展科学的统计调查
针对当前我国各行各业统计调查尤其是行业管理部门统计调查中存在的薄弱环节,为取得有价值的统计资料,笔者认为首先要改进统计调查工作。
一是加强行业主管部门和综合统计主管部门的合作。进行大规模的行业统计调查时,行业主管部门的统计工作人员应该主动向综合统计主管部门说明统计调查的思路,介绍本行业的特点,在样本选定、数据计算和修正等方面听取他们的意见,争取得到他们的业务支持或指导。
二是加强统计能力建设。大数据时代,统计工作面临着新的机遇和挑战。各有关部门和单位尤其是行业管理部门的统计工作人员一定要树立大数据的理念,掌握网络技术,跟上信息技术的发展。同时,加强统计基础知识学习,不仅熟练掌握分类、回归、聚类、偏差等传统方法,还要掌握最新的数据分析软件,才能够从大量数据中提取有用的信息。
参考文献
[1]黄良文主编.《统计学原理》.中国统计出版社,2000.6.
[2]梅长林,周家良编著.《实用统计方法》.科学出版社,2002.
[3]李强,王吉利主编.《统计基础知识与统计实务》.中国统计出版社,2005.6.
[4]季晓晶.《大数据时代统计调查工作的挑战与思考》.《统计与咨询》,2013-5.
[5]维克托·迈尔·舍恩伯格著,盛杨燕译.《大数据时代》.浙江人民出版社,2013.1.
[6]曾鸿钟.《论网络调查和传统调查方法的综合应用》.《工业技术经济》,2006.12.
作者简介:宋立京(1973-),男,山东临沂人,硕士,山东省淄博市交通运输管理处统计师。