大数据驱动下统计学人才培养模式研究
2016-12-20陈立双
祝 丹,陈立双
(闽南师范大学 商学院,福建 漳州 363000)
【统计教育】
大数据驱动下统计学人才培养模式研究
祝 丹,陈立双
(闽南师范大学 商学院,福建 漳州 363000)
随着信息、网络和计算技术的快速发展,记录人类社会实践活动的大数据在社会经济各层面、各领域的应用已经引起了人们日益广泛的重视。统计学作为大数据价值得以实现的重要支撑性学科,具有举足轻重的地位。因此,探讨了大数据背景下统计学人才的应用前景,同时归纳了部分高校统计学人才培养模式及其存在的突出问题。据此,基于大数据驱动下学科交叉发展的视角,从人才培养目标和规格、人才培养主体构建与分工、人才培养方法与手段、专业课程设置等方面探讨了统计学专业人才培养模式。
大数据背景;交叉学科;统计学专业人才;培养模式
一、问题的提出
2012年3月,美国奥巴马政府关于“大数据研究和发展计划”的宣布受到世界各国广泛关注,大数据在经济社会各个层面、各个领域的应用也逐渐引起了人们的重视。伴随着大数据时代的来临,目前世界各国对大数据的重视程度已提到了前所未有的高度。2015年8月国务院常务会议通过了《关于促进大数据发展的行动纲要》,纲要明确提出充分运用大数据,丰富统计数据来源,实现对经济运行更为准确的监测与预警,提高决策的针对性、科学性和时效性[1]。可见,对统计学获取和利用大数据的重要性认识已上升到国家层面。
统计学作为与数据打交道的重要工具学科,对于激活大数据的生命力、实现大数据广泛的应用价值起到了举足轻重的作用,尤其是在通过自身优势以实现不同来源和种类的巨量数据存储与整合、提高数据处理效率、萃取海量数据的有效信息、全面系统地挖掘用户的广泛需求等方面具有极其重要的作用。各行各业大数据的爆发式增长必将极大地促进统计学在经济社会实践中的广泛应用,社会对具备大数据分析能力的统计专业人才需要也将出现爆发式增长。然而,真正掌握大数据技术的专业人才却极其匮乏,因此各高等院校及科研院所纷纷开始探讨大数据专业人才的培养,尤其是与数据密切相关的统计学专业人才的培养。基于此,本文结合大数据的系列特征和处理技术以及大数据在经济社会实践中的应用,从学科交叉发展的视角,系统、深入地探讨大数据背景下统计学人才的培养模式。
二、大数据特征及其在统计学社会实践中的应用价值
(一)大数据特征
与传统调查数据相比,大数据具有较为显著的若干特征,部分学者将其概括为:数据体量巨大(Volume)、数据类型繁多(Variety)、价值密度低(Value)、处理速度快(Velocity)[2],更有学者将其概括为七“V”特征:大量性 (Volume)、多样性(Variety)、高频率(Velocity)、黏性(Viscosity)、准确性(Veracity)、时效性(Volatility)和易变性(Variability)等[3]。大数据的应用要求能够有效地记录和储存其数据信息,并能够运用相关技术快速地挖掘、提炼其中有价值的信息,从而做出科学高效的预测与决策。因此,我们可以简单地将大数据概括为混合型数据对象、综合性技术和广泛性应用三者的有机统一。
(二)大数据在统计学社会实践中的应用价值
人类实践活动的各个领域几乎都涉及到大数据,尤其是社会经济实践活动,而统计学在社会经济实践活动中有着广泛应用,因而大数据的出现必将进一步促进统计学在宏观、中观和微观层面功能的扩展与应用价值的提升。因此,我们将从宏观、中观和微观三个层次阐述大数据在统计学社会实践中较具代表性的应用价值。
1.在宏观经济统计领域中的应用价值。
(1)大数据在GDP核算中的统计应用。GDP是宏观经济最为重要的经济指标,其准确性事关重大。大数据将极大地丰富GDP数据来源,改变GDP的核算方式。具体地,这些改变可以归纳为:优化GDP核算数据的来源、提高GDP核算数据的质量、推动GDP核算流程的变革、提高GDP核算的价值、推动GDP核算的国际化等重要作用。
(2)大数据在价格统计中的重要作用。宏观经济价格指数,尤其是居民消费者价格指数从总供给层面反映宏观经济整体运行的状态与趋势,成为测量通胀水平的重要宏观经济价格指数。但传统调查数据下编制的相关价格指数反映通胀水平存在一定程度的失真,据此学术界已经开始借助大数据编制了多种价格指数,例如Watanabe K等基于扫描数据统计了每日价格指数[4];美国麻省理工学院基于“十亿价格项目”(Billion Price Project)挖掘世界各国在线交易数据并统计了每日通胀指数[5]30-38;而Google则借助其规模庞大的网络购物数据库,开发“谷歌价格指数”为用户搜集价格信息和提供官方数据外的价格指数参考;中国国家统计局与阿里巴巴合作编制了ISPI价格指数;上海市统计局与1号店合作编制了快速消费品价格指数等,这些都是基于大数据背景下价格指数统计的研究与实践工作。Armah等研究指出,政策制定者可借助大数据所编制的宏观经济预警指标,更为及时地预测经济拐点[6-7]。由此可见,大数据在价格统计中具有极其重要的实践应用价值。
(3)大数据在就业统计中的应用。关于大数据在就业和失业统计方面的应用,国际组织和各类企业通过网络搜索和监测等方式及时获取劳动力市场信息,以预测相关就业率与失业率的走势,为失业者和政府宏观经济管理提供了难得的信息。较具代表性的研究主要有:联合国借助博客、论坛和新闻媒体等展开的失业调查;谷歌利用搜索平台对失业展开的预测;澳大利亚实施的在线职业空缺信息调查等。基于大数据技术的就业与失业统计中,企业和居民有望借助网络大数据平台,进行岗位与失业的实时登记,宏观经济管理部门也将据此展开就业与失业的大数据统计分析,进而及时测算失业水平和预测失业率趋势。
2.在中观经济统计领域中的应用价值。大数据在中观经济统计领域中也有着极其重要的应用价值,如大数据在工业统计、农业统计、商业零售业统计、交通运输业统计等各个行业统计中的广泛应用。大数据在这些行业的有效应用,不仅将改变这些行业的发展格局与现状,同时也将对这些行业的统计流程与标准产生重要影响,因为大数据的应用会促使政府部门在这些行业的数据采集与储存、数据的管理方式、产品统计等方面发生变化,而这些变化又要求政府部门具有掌握大数据技术的统计人才,进一步扩展行业统计的范围、提高其统计频率,以真正实现企业的信息化、实时化管理。
3.在微观经济领域中的应用价值。根据《2015年中国大数据发展调查报告》,2015年中国大数据市场规模达到115.9亿元,增速达38%[8],大数据市场规模的快速发展必将为电子商务、物流配送和互联网金融的发展起到极大的促进作用,也将为企业提供有效的市场需求以及深度挖掘、精准营销和销售量预测与库房自动补货等做出极其重要的贡献。例如,互联网服装品牌裂帛充分利用大数据技术,开发出全新的一套系统,实时精准地监测到任何一天任何品牌的售价、销售情况以及自有品牌的毛利和消费者第一时间反馈的意见;又如滴滴每天数据分析量级是50TB,约为5万部高清电影容量,每天实时更新的定位数据是50亿次,据此滴滴公司能够不断提高算法精度,优化路线,以便司机在第一时间便捷地找到乘客[9]。由此可见,大数据扩展了互联网信息在微观经济领域的巨大应用,同时也改变了数据分析的思维和模式。
实际上,大数据在经济领域的应用远远不止上述这些,大数据时代的大数据量给统计专业进行数据分析留下了巨大的空间。总之,大数据在人类社会经济实践活动中正发挥着极其重要的引导和突破作用,然而大数据在社会经济领域不可估量的价值无疑有赖于人们对其大数据的收集、储存、整合、分析和挖掘技术。显然,上述若干重要问题的有效解决,对统计学专业人才的培养都具有一定的挑战。
三、大数据驱动下统计人才培养模式问题探讨
(一)大数据驱动下统计学专业人才所面临的严峻挑战
大数据分析处理过程大致包括五个方面:数据的采集、数据的导入与预处理、数据的统计分析、数据挖掘及预测与应用等,其中理论方面涉及到大数据特征、统计指标的构建及相关学科的基本理论等;技术方面涉及到云计算、分布式处理、存储技术等;实践方面涉及到数据挖掘、可视化处理及预测分析等,因此大数据价值的实现具有交叉性学科的重要特征。
(二)相关高校和科研院所关于大数据人才的培养模式
大数据的社会实践应用是发生在互联网时代的一次变革,在掌握大数据技术的人才极其短缺的现实情况下,大数据人才的培养对促进大数据的社会实践应用至关重要,因此国内部分高校和科研院所纷纷开始整合各种资源培养大数据人才。
1.清华大学大数据人才培养模式。2014年4月26日,清华大学宣布成立数据科学研究院,并推出多学科交叉培养的大数据硕士项目。该项目以大数据与国家治理、互联网金融、商务分析、数据科学与工程、社会数据等硕士项目为先导,依托6个院系共同创建,其具体的人才培养模式如表1所示。
表1 清华大学大数据人才培养模式
注:表中内容由作者根据网络相关资料搜集与整理得到。
2.天津财经大学珠江学院数据工程专业人才培育。2013年,天津财经大学珠江学院将2012届的统计学专业调整为“数据工程专业”,开始启动统计人才培养改革项目,其培养模式详见表2。经过两年教学实践的推进,取得明显成效。
3.中国人民大学等五所高校协同创新平台的大数据分析人才培养模式。中国人民大学、北京大学、中国科学院大学、中央财经大学和首都经贸大学等5所高校组建了一个协同创新平台,以“应用统计专业硕士”为载体培养大数据分析人才,其具体的人才培养模式如表3所示。
(三)国内关于大数据背景下统计学人才培养模式的特点
为了培养能够满足社会需求的大数据相关人才,国内各高校和科研院所纷纷推出不同的统计学人才培养模式,归纳起来目前国内统计学人才培养模式主要具有以下几个特点。
1.人才的培养模式实行理论学习与实践有机结合。对大数据熟练的业务与管理能力的要求决定了大数据人才的培养,不仅需要在校学习基本理论知识,同时还要在企业或者研究院所进行实践与案例的学习。如清华大学大数据人才培养模式不仅为学生提供多模块课程体系,而且注重鼓励学生参与数据科学研究院举办的大数据实践活动,采用线上线下混合式互动的教学方法;天津财经大学数据工程专业人才模式不仅构建了学科交叉型课程体系,而且深入推进基于校园云构建的实验教学体系;五所高校协同创新平台的大数据人才培养模式则不仅注重多学科交叉培养,而且重视实践环节,采用双导师制,一位来自于大学,一位来自于企业界。
表2 天津财经大学珠江学院数据工程专业人才培养模式
注:表中内容由作者根据“把握时代脉搏,冲浪大数据海洋——天津财大珠江学院创立‘数据工程’专业方向,http://zhujiang.tjufe.edu.cn/Class/sjgc_xw dt/index.htm”及相关资料整理得到。
注:表中内容由作者根据上述相关高校有关网站公布的信息及参考文献[10]等资料整理得到。
2.人才的培养模式具有明显的学科交叉特点。统计学、计算机科学在大数据人才培养过程中具有重要的专业基础地位。大数据研究需要建立有效的大数据平台,并据此展开数据的整合、分析和应用研究。因此,针对大数据展开的分析,既要有数据库和软件等计算机方面的专业知识,同时还需要统计定义、统计设计等理论知识和技能。可以说,计算机科学和统计学在大数据的解码和价值萃取方面具有极其重要的作用。事实上,这一特征从上述案例中也能够得到较为明显的验证。大数据人才的培养涉及到统计学、计算机科学与技术两个一级学科,同时这一领域的应用型人才还需具备财经、管理、生物医药和新闻等相关领域的专业基本知识,才能够成为真正意义上的“数据工程师”或“数据科学家”。因此,这一复合型人才显然是某一个学科难以单独培养的,学科间的交叉培养显现了大数据背景下统计学科人才培养模式的重要特征。
3.人才培养的课程设计呈现模块化特征。由于大数据人才培养的课程设计往往具有跨专业的模块化特点,例如培养经济应用领域的大数据人才,除了需要掌握统计学、计算机科学的专业知识和技能外,还需要加强经济学专业知识的学习;管理类大数据人才的培养,则还需要掌握管理学相关专业知识和基本技能;生物医药领域大数据人才的培养,也需要掌握生物医药领域的相关专业知识和技能等。因此,进行模块化的课程设置,一方面凸显了大数据较强的实践应用价值,同时也体现了大数据人才的综合性技能。
(四)国内关于大数据下统计人才培养模式的问题分析
国内各部门推出与大数据相关的统计学科人才培养模式,代表了人才培养的最新趋向和高效人才培养模式的改革方向,对国内高等教育人才培养模式的创新与发展必将起到极为显著的效果,但也可能存在一定的问题:
1.人才培养的学科交叉并不代表培养主体部门的大杂烩式交叉。尽管大数据人才的培养需要多学科、多领域的联合,但大数据人才培养所涉及的部门越多,对各部门间协调性的要求也就越高,如果缺乏有效的管理和各部门间有力的配合,将难以实现人才培养的最终目标。因此,大数据人才的培养并不是涉及到的部门越多效率越高,部门的选择应该以大数据实践为导向,遵循大数据行业发展的趋向性,以打造大数据背景下统计学人才工程为原则进行科学、合理的组建。
2.交叉人才培养主体的分工有待进一步明确。大数据人才的培养需要多方主体的参与,包括具有专业知识的产学研部门和具有熟练实践知识的政界和企业界。众多部门的参与容易导致人才培养主体的缺位,分工上的不明确。因此,大数据人才的培养有必要建立在“政、企、产、学、研”一体的基础上,进一步明确各方主体的任务与分工,并据此制定更为明确的人才培养路线。
3.人才培养的特色和导向有待进一步明确。人才的培养应该以自身优势为基础,以实践问题为导向,以市场需求为准绳,这样培养出来的人才才能够真正满足市场需求。基于此,各科研院所应该结合自身专业优势和特色,进一步体现大数据背景下统计学科人才培养的特色和导向,而不是寄希望于培养出包揽全部领域和统计学科的全才或通才,更不可走重复培养和建设的道路。
四、大数据背景下统计学科人才培养创新模式探讨
(一)人才培养目标和规格——具备交叉学科背景的应用型人才
根据上述分析,大数据的出现无疑进一步扩展了统计数据分析的内涵与外延,大数据人才的培养也需要计算机、统计学、数学等多学科共同参与[10]。因此,大数据背景下统计学专业人才培养应该定位为具有交叉学科背景的应用型人才,特别是对计算机知识和技术的熟练掌握,因为很多问题需要通过计算机,通过机器学习、自动识别来解决。这就要求统计人才既能熟练掌握计算机,又能熟练应用统计软件进行分析,能把不同源头的数据整合到一起,比如把文本信息转换成可以分析的统计数据。如果研究心理问题还需要学习了解心理知识,如果研究政府统计还需要学习了解国民经济,具备这种交叉学科知识背景的统计人才才能满足大数据时代的需求。因此,统计学专业人才的培养应在原来的知识框架上,进一步拓展计算机技术、实际应用领域相关知识。具体的培养规格应针对不同层次的人才进行分类设计,如本科生应侧重于应用,因此本科生的培养规格更注重能力的培养,使其能根据社会需求,运用有效的方法解决现实问题;而研究生则侧重于理论与实践并重,培养规格比本科生要求更高,不仅应具备解决问题的能力,还需要较高的专业素质,能够在社会各个领域独立从事大数据采集、储存、整合与分析。
(二)专业课程设置——模块化的课程设置
大数据背景下统计人才的培养应以市场为准绳,以交叉学科知识为基础,模块化的课程设置对于培养具备交叉学科知识的应用型统计人才具有极其重要的作用。在综合国内相关高校课程设计的基础上,笔者对统计学专业人才培养的课程设计体系进行了整合、提炼(表4)。
需要说明的是,上述课程设计只针对应用学科进行了分类,各个专业的课程设置应在统计学和计算机科学技术基础学科的基础上,结合大数据的应用领域,进一步设置相关专业课程,以培养懂理论、会技术、能实践的大数据背景下统计学专门人才。
(三)人才培养方法与手段——实践教学的强化
1.案例分析、讨论式参与科研项目的教学方式。大数据下的统计学是一门实用性很强的学科,人才的培养应立足于业界的实践问题。基于此,大数据背景下统计人才的培养可以通过案例分析法、针对重要实践问题展开讨论的方式,或围绕业界的相关科研项目展开教学等。
2.采用多导师制。大数据背景下统计学人才的培养具有学科交叉、理论与应用密切结合、涉及部门多等特点,而单一导师可能难以兼顾教学与实践指导工作,因此可以采用多导师制或导师组联合培养的方式,解决学生学习中所遇到的各种理论或实践问题。
3.个性化的人才培养方式。大数据背景下统计学的应用领域越来越广,各科研院所都在想方设法地培养大数据技术人才,但遗憾的是任何一所研究机构都难以包罗万象地培养社会所需要的要求,而且由于学科之间存在的天然屏障,大数据通才的培养并不容易。基于此,各科研院所有必要在借助“统计学”和“计算机科学与技术”基础性专业知识的基础上,借助本单位的科研和教学实力,挑选例如财经类、医学类、管理类等优势学科,以设计更具个性化的统计学人才培养方式。
(四)人才培养主体构建与分工——多方参与的深度对接
大数据背景下统计人才的需求具有行业分布广、市场导向性强、专业水平高等特征,因此大数据背景下统计人才的培养有必要搭建灵活的“政、企、产、学、研”平台,相应的人才培养主体包括大数据资源方、大数据人才需求方、拥有丰富理论和专业知识技能的科研院所等多个部门联合展开。每个部门在人才培养中所充当的角色和所赋予的任务显然是不一样的,各方需要在各负其责的基础上展开必要的合作与协调。
总之,作为具有重要社会实践应用价值的统计学科,面对波涛汹涌的大数据,大力培育具有大数据技术的统计学人才,既是统计学科的合理选择,也是统计学科发展的重要历史性机遇。因此,各人才培养单位需结合自身优势,主动融入到大数据背景下统计人才的培养浪潮中。
[1] 新华网.国务院关于印发促进大数据发展行动纲要的通知[EB/OL].(2019-09-23).http:∥www.gov.cn/zhengce/content/2015-09/05/content-10137.htm.
[2] 李金昌.大数据与统计新思维[J]. 统计研究, 2014 (1).
[3] 刘叶婷, 唐斯斯. 大数据对政府治理的影响及挑战[J].电子政务, 2014(6).
[4] Watanabe K, Watanabe T. Estimating Daily Inflation Using Scanner Data: A Progress Report[R]. University of Tokyo, Graduate School of Economics, 2014.
[5] 马建堂.大数据在政府统计中的探索与应用[M].北京:中国统计出版社,2013.
[6] Armah N. Big Data Analysis: The Next Frontier[J].Bank of Canada Review, 2013(Summer).
[7] Galbraith J, Tkacz G. Nowcasting GDP: Electronic Payments, Data Vintages and the Timing of Data Releases[R]. CIRANO,2013.
[8] 中国信息通信研究院.中国大数据发展调查报告[EB/OL].(2015-09-07).http:∥www.caict.ac.cn/kxyi/qufb/ztbg/201512/p020151211378952148273.pdf.
[9] 赵陈婷. 滴滴出行张浩:大数据主宰现在与未来[N].第一财经日报,2015-11-16(9).
[10]汪瑞林. 如何拥抱大数据时代——访中国人民大学中国调查与数据中心主任袁卫[N].中国教育报, 2014-06-30(5).
(责任编辑:崔国平)
The Research on Statistical Personnel Training Mode Based on Big Data Driving Force
ZHU Dan, CHEN Li-shuang
(Business School, Minnan Normal University, Zhangzhou 363000, China)
With the rapid development of information, networking and computing technologies, it has begun to attract widespread attention for the big data's applications about the recording of human social practice in various fields of the socio-economic. It plays a decisive role for statistics in accelerating the application value of the big data. This paper discusses the application prospect of statistics base on big data background, then systematically introduces and summarizes the personnel training mode and the outstanding problems of some colleges in China. Accordingly, the paper explores personnel training mode of statistics talent for big data background base on the perspective of training objectives and specifications, body construction and personnel training division, training methods and means, professional curriculum design.
big data background;interdisciplinary;statistical professional talents;training mode
2016-07-22
福建省社科规划项目《大数据视阈下中国CPI编制方法及优化对策研究》(FJ2015B091)
祝 丹,湖北鄂州人,数量经济学博士,讲师,研究方向:统计理论与数量分析; 陈立双,湖北监利人,统计学博士,副教授,研究方向:统计理论与大数据应用。
F224
A
1007-3116(2016)12-0102-06