APP下载

加速开拓统计学的应用价值
——中国统计教育回顾与展望

2016-06-29赵彦云

统计与信息论坛 2016年6期

赵彦云

(中国人民大学 应用统计科学中心,北京 100872))

加速开拓统计学的应用价值

——中国统计教育回顾与展望

赵彦云

(中国人民大学 应用统计科学中心,北京 100872))

摘要:2015年10月20日是第二个世界统计日,在“优化数据,改善生活”主题下,本文聚焦了中国高等统计教育的发展历程、贡献及其主要特色,以及探索了面向大数据挑战的宏观统计思想,呼唤和期待中国统计对世界的更大贡献。

关键词:世界统计日;统计教育;大数据统计;宏观统计

联合国确定2010年10月20日为第一个世界统计日,并在上海举行了第一个世界统计日的隆重庆祝活动。按照联合国每五年一个世界统计日的历志,2015年10月20日是第二个世界统计日,联合国统计司与国家统计局、陕西省人民政府联合在中国西安举行了面向全世界现场网络直播的隆重庆祝活动,主题是“优化数据,改善生活”(Better Data. Better Lives)。本文是应邀在会上所作的报告,主要是向全世界聚焦了中国高等统计教育的发展历程、贡献及其主要特色,以及探索了面向大数据挑战的宏观统计思想,呼唤和期待中国统计对世界的更大贡献。

一、计划经济时期的中国统计教育

1949年新中国建设初期,因为没有如何建立适应中国社会主义经济建设的教学与科研体系的经验,我们按照苏联的经验和办学模式于1950年在中国人民大学设立了计划统计系及统计学专业,邀请前苏联统计教育专家帮助培养社会经济统计骨干。当时,国家急需一批统计专业干部与管理干部充实到国家各级机关和企事业单位的计划统计部门,因而在高等财经院校中完全按照计划经济中制定计划、检查计划、考核监督所涉及的统计知识进行系统的统计教育,实行了以统计学原理和部门统计教学为主的统计教育体系。实事求是地说,当时的这套统计教育教学方案是适应中国社会主义经济初创阶段的要求的,建立了满足企业统计、产业统计、政府部门统计、政府综合统计,以及在计划经济中的全部统计支持的应用统计知识体系,为中国计划经济制度体系和工业产业体系、科学管理体系、财政金融体系等建设发挥了重要的作用。随着中国社会主义经济建设事业的全面展开,高等财经院校的统计教育应该逐渐走向正规化、系统化,应该学习借鉴国际先进统计方法技术,努力赶超国际先进统计教育水平。遗憾的是,受苏联1954年统计会议极“左”思想的影响,排斥数理统计方法,认为数理统计学是数学,社会经济统计学是一门具有阶级性、党性的社会科学,人为地将概率论数理统计与社会经济统计的人才培养和科学研究割裂开来,形成了在应用数学下面的概率论数理统计和在经济学下的统计学两个统计专业平行发展的局面。概括讲,1952-1978年中国主要受前苏联影响,统计教育分成社会经济统计和数理统计两门统计学。1966-1977年文化革命期间中国高等教育停办,中国统计教育随之停滞。

二、改革开放以来的中国统计教育

在文化革命之后的1977年,中国恢复高考制度。

1981年1月实施中华人民共和国学位条例,统计学的本科、硕士、博士学位人才培养走向制度化、规范化。1993年中国统计学高等教育已经进入全面发展阶段。在恢复高校统计教育初期的1979年仅有17所高校设置统计学本科专业,到1993年全国本科设有统计学专业的高校140所,其中设有概率论与数理统计学专业的高校12所,其余128所都是经济学下的统计学专业。这期间,不仅综合性大学和财经院校中原有的统计学专业得到恢复和重建,而且一些综合性大学、工科大学及新建的财经院校内增设了统计系或统计专业。1998年教育部对原有的本科专业目录进行调整修订,在本科中设置了一级专业学科统计学,在学位设置方面也有了经济学和理学两个学科的学位授予,这为促进统计学专业的改革和发展,培养同时具备统计理论基础和实际应用能力的人才搭建了一个很好的平台。

2011年,教育部学位办下发《关于按〈学位授予和人才培养学科目录〉进行学位授权点对应调整的通知》(学位办2011,25号文),统计学正式成为一级学科。根据“教育部高等学校统计学类教学指导委员会”发布的数据*http://statstsc.org/category/%E4%BF%A1%E6%81%AF%E5%85%AC%E5%BC%80/%E6%95%99%E5%AD%A6%E5%8D%95%E4%BD%8D,截止2013年11月,全国开设统计学专业本科的教学机构分布如下:

表1 2013年全国本科统计学专业高校教学单位数

表2 1979-2013年全国本科统计学专业高校单位数

表3  1996年以来全国获得统计学硕士学位的人数

*应用统计专业硕士学位研究生自2011年开始设立并招生,2013年首届毕业。

表4  1996年以来全国获得博士学位的人数

图1 1996年以来全国获统计学硕士学位人数变化图

图2 1996年以来全国获博士学位人数变化图

三、中国统计教育和高校科研的特点

中国统计教育和高校科研的特点之一是分别以社会经济统计与概率数理统计两个核心为特色向应用领域不断发展的,如图3所示:

图3 “数据+模型”的二分模式图

图3中经济学一级学科下的统计学是以数据即描述统计为主要应用开展统计教学和科研及人才培养的,其中统计学原理是专业基础,同时也强调经济学、管理学和社会学的基础,专业课主要是部门统计学,包括农业统计、工业统计、商业统计、交通运输统计、财政金融统计、人口统计,以及物价统计、综合平衡统计学等。1985年1月国务院成立国民经济核算标准统一领导小组,国家统计局领导开始参加联合国统计会议,部门统计逐步向国民经济核算体系为主转变,企业统计学、国民经济统计学、国民经济核算,以及市场调查、抽样调查技术、应用回归、时间序列、多元统计、统计预测等课程及研究成为经济统计学的主要专业教育内容,同时也加强数学基础和计算机应用等能力的培养,总体上非常突出统计在经济、金融保险、管理及社会发展中的分析、预测、监测、风险管理、政策制定,以及在各种调查、数据搜集整理及数据库等方面应用能力上的人才培养。

图3应用数学一级学科下的概率论与数理统计学非常重视相关数学基础能力的培养,统计理论方法特色突出,并注重在质量控制、工程领域、自然科学领域的应用,以及向金融工程、生物医学统计、保险精算与风险管理方面的应用发展。中国培养了一大批概率论与数理统计专业优秀本科生留学美国等发达国家,良好的数学基础和理论统计学基础使他们成为当今世界的著名统计学家。

中国统计教育和高校科研的特点之二是紧密联系实际的应用统计发展。例如国家统计局的政府统计数据开发应用,包括人口普查、经济普查、农业普查、投入产出表编制调查、景气调查、创新调查和年度数据、季度数据、月度数据,以及政府部门统计调查,如水资源调查、林业资源调查、国土资源调查、R&D清查等,都非常重视高校统计教育资源,包括教师和研究生、博士生、博士后的参与,通过课题招标、委托项目或合作研究等方式构筑统计教育与实际统计工作的密切联系。国家统计局提供基金支持的每年一度的全国统计科学研究规划项目,每年都有全国高校教师申报的项目600多项,支持了统计教育和科研的发展。中国是全世界研究国民经济核算体系和政府统计高校人数最多的国家。

中国统计教育和高校科研的特点之三是统计学科内部交叉发展。在统计学由应用经济学一级学科下的二级统计学专业和应用数学一级学科下二级概率论与数理统计专业上升为与经济学和数学平行的统计学一级学科之后,发展成统计学、应用统计学、经济统计学、概率论与数理统计学四个专业,专业之间互相渗透发展,形成了推动统计教育和科研发展更加广阔的空间。

中国统计教育和高校科研的特点之四是统计学科与其他学科的交叉发展。首先表现在统计学与生物医学的交叉发展形成的生物医学统计不断强大。其次是统计学与环境和生态资源的交叉形成应用统计的重要领域。第三,统计与人文社会科学的交叉,表现出统计在新闻学、法学、社会学、人口学、政治学、教育学、伦理学、文献计量学等领域的应用,推动人文社会科学定量化和精确化研究的发展。第四,统计与遥感地理信息学的交叉,推动经济社会数据空间标准化及其空间统计分析的发展。

四、建立面向大数据的宏观统计,让统计在大数据科学中发挥核心作用

近30年,勤奋的统计学家面向应用发展了许多统计理论和统计方法,对人类社会进步和经济社会发展做出了重要的贡献。互联网、大数据、云计算成为新的时代发展特征,从大数据提取知识的统计理论方法研究,已经成为大家的共识。但是,面向大数据的发展,以提升大数据资源价值的统计理论方法研究非常重要,因为针对大数据的发展,以不产生危害社会的数据垃圾为目标的统计理论方法研究将挑战大数据时代的核心价值。为此,我们提出探索服务于大数据科学的宏观统计的新目标。宏观统计的价值取向是运用统计理论方法实现大数据资源累积与价值提升,创造统计数据记载人类知识体系的新方式和新方法,奠定统计学新基础。

以宏观统计立论的几个要点阐述如下:

宏观统计目标:使大数据有序,使大数据资源成为人类社会宝藏;

宏观统计结构:全总体、全对象、全过程。

宏观统计的结构解析:

全总体:所有人的个人的全历史信息数据记录唯一社会编码(个人身份证号码);所有单位的全历史信息数据记录唯一社会编码(法人组织机构编码);所有自然物种的全历史信息数据记录唯一社会编码(动物、植物、生物编码)。

全对象:所有的自然物与自然品类别全历史信息数据记录唯一社会编码;所有的产品类别全历史信息数据记录唯一社会编码;所有的服务类别全历史信息数据记录唯一社会编码。

全过程:生态系统;经济系统;社会系统的内在过程一体化,实现人与自然统一的最大有序数据集,刻画包括空间、时间、内容的一体全过程。

大数据发展会不会产生危害社会进步的数据垃圾?这是建立宏观统计的根本所在。显然,目前大数据着重于眼前的过程之中或短期,过期的数据是否还有用,是否还全部有用,如果回答否的话,那么,随时间的推移,大数据之后必然有不用的数据,或在某一个时点之前的数据成为永远都不能用的数据,即使数据还有点价值,但是随着时间趋向无穷,其数据使用价值趋向零,显然这些就是数据垃圾。大数据是否一定会产生大数据垃圾,如果不产生需要什么样的条件。现实看,大数据不能学狗熊掰棒子,拿了新的丢了旧的,总是眼前数据,这样的大数据会产生大数据垃圾。目前的大数据发展突出追求个性化和社交网络化服务,个性化治疗、个性化健康、个性化需求、个性化制造等等,大数据价值大小取决于个性化的个性单位最小化和社交网络数据上的大数据网络结点有效连接的最大化,自然、经济、社会构筑最大范围和最多属性的社交网络。然而,个性化与社交网络一体化的大数据,不能缺位时间上的连续性条件,也就是个性化单位最小化应该具备时间连续的条件,同样社交网络数据上的大数据网络结点有效连接的最大化也要具备时间连续的条件,个性单位最小化和社交网络数据上的大数据网络结点有效连接的最大化与个性单位和社交网络的时间连续条件满足的话,那么,大数据发展可以避免大数据垃圾产生。宏观统计追求自然、经济、社会全总体、全对象的唯一历史性记录编码,个人身份证号码成为人类社会唯一记录数据的标识,同样,法人组织单位、自然物种都实现人类社会唯一记录数据的表示,这样可以做到所有数据形成有序性关联,并做到最大有序空间,能够容纳人类所有认知和人类所有知识的数据记录,为全新统计模型分析奠定基础。

宏观统计的发展价值是空间、时间、数据点之间一体化的细化,表现在用数据统计刻画自然与人、经济、社会的最大化,如图4所示:

图4 全总体、全对象、全过程、全内容宏观统计结构示意图

宏观统计要实现与所有学科和所有知识的有序交叉,并运用于累积大数据资源价值上,这需要运用

统计理论方法发掘自然到人类社会客观有序与人类知识有序之间并运用于大数据累积之上的宏观有序结构研究。其研究体现在以大数据为目标的从局部的多学科交叉到更大范围的学科交叉,逐步向全总体、全对象、全过程、全内容的系统研究,从而提炼最简化的人类所有的知识体系和最完备的大数据体系,为人类社会发展服务。

五、结论

1、中国统计教育65年取得了高速的发展,人才培养面向实际应用统计,在经济社会发展建设中发挥了重要的作用。

2、数据(描述统计)+模型(推论统计)的各自发展与统计内部学科方向交叉和与其他学科交叉,在面向大数据科学发展的新时代,具有重要价值。

3、互联网、大数据、云计算已经成为未来发展的必然趋势,统计学应该发挥核心作用,其中用统计累积大数据资源价值,贡献于人类社会发展,将是统计学者的历史使命。面向大数据资源价值最大化的宏观统计是最具价值的发展方向之一。统计人可以为之奋斗努力,为人类社会发展做出更大的贡献。

4、从大数据提取知识的统计理论方法研究,已经成为大家的共识。但是,面向大数据的发展,以提升大数据资源价值的统计理论方法研究非常重要,因为针对大数据的发展,以不产生危害社会的数据垃圾为目标的统计理论方法研究将挑战大数据时代的核心价值。为此,我们提出探索服务于大数据科学的宏观统计的新目标。

5、运用统计思想和统计方法,在互联网、大数据、云计算支持下,探索实现自然与人、经济、社会之间有序的最充分量化和数据资源的历史累积,以便运用统计方法探索自然与人、经济、社会之间的扁平化、个性化、智能化的最优条件、最优配合互动等内容。让大数据在统计理论方法支持下成为最有价值。

(责任编辑:杜一哲)

Accelerate to Develop the Applicationof Statistical Value——The Review and Prospect of China's Statistical Education

ZHAO Yan-yun

(The Center for Applied Statistics of Renmin University of China, Beijing 100872, China)

Abstract:October 20, 2015 is the second world statistics day, in the "better data, better lives" theme, this paper focused on the development of higher education in China, the contribution and its main characteristics, as well as to explore the macro statistical ideas for big data challenges, Calling and looking forward to the greater contribution of China to the world.

Key words:world statistical day; statistical education; big data statistics; macro-statistics

收稿日期:2016-04-22

基金项目:国家社会科学基金重大项目《经济社会公共数据的空间统计样本数据开发及应用研究》(11&ZD157)

作者简介:赵彦云,男,天津武清人,教授,博士生导师,研究方向:经济统计和分析,竞争力与创新指数。

中图分类号:C812

文献标志码:A

文章编号:1007-3116(2016)06-0003-04

【统计理论与方法】