数据科学与大数据专业和统计学专业的比较研究
2019-10-06许萍孙康王诗莹
许萍 孙康 王诗莹
摘 要:在大数据与人工智能高速发展的背景下,全国掀起了兴办数据科学与大数据专业的热潮。同时,越来越多的人疑惑,与传统的统计学专业相比,数据科学与大数据专业的差异在哪里?从专业设置现状、专业建设与人才培养方案、教学模式、就业方向四个方面比较了数据科学与大数据专业和统计学专业的差異,对数据科学与大数据专业的稳步发展,统计学专业的教学改革提供有针对性的建议。
关键词:数据科学与大数据;统计学;比较
中图分类号:G4 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2019.28.089
2016以来,数据科学与大数据技术专业的开设高校数量以倍数方式在猛增。截至目前,数据科学与大数据专业开设院校共1161所,其中普通本科学校479所,高等职业院校682所。在近期召开的2019中国大数据教育大会上,众多专家围绕大数据系列教材建设、人才培养、专业建设、产教融合等教学领域进行了探讨和交流。在此背景下,探讨数据科学与大数据专业和统计学专业的差异更为迫切,这对数据科学与大数据专业的稳步发展,统计学专业的教学改革都具有重要的现实意义。
1 专业设置现状比较
我国统计学专业最早开设在1950年,是一个较为成熟的专业;数据科学与大数据专业最早开设在2016年,是当前非常热门的新专业。
从开设学校数量来看,统计学专业普通本科学校约300所;数据科学与大数据专业普通本科学校479所,其中211和985学校所55所,办学数量排名前5的省份分别为河南、北京、山东、湖北、广东。
从所属科目及学院看,统计学专业主要包括:统计学(071201)、应用统计学(071202)、经济统计学(020102)。一般开设在数学学院、经济或金融学院。统计学、应用统计学多颁发理学学位,经济统计学多颁发经济学学位。数据科学与大数据专业(080910T)一般开设在计算机或信息学院,多授予工学学位,部分也授予理学学位。
2 专业建设与人才培养方案比较
对于专业建设与人才培养方案的比较,我们以第一批开设数据科学与大数据专业的3所高校——北京大学、对外经济贸易大学、中南大学为例,分别就这两个专业的人才培养方案进行比较分析。
从培养目标看,统计学专业更强调:培养具备较强的运用统计方法和统计软件分析数据和解决实际问题能力的复合型人才。数据科学与大数据专业更强调:培养具备大数据采集、预处理、存储、分析、挖掘等行业核心技术的应用能力,能够胜任大数据系统开发、系统运行与维护、大数据分析与挖掘等工作的专业型和研究型人才。
从课程设置看,我们通过词云图分别展现了这两个专业的课程设置方面的差异。从图1可以看出,统计学专业主要核心课程有应用时间序列分析、应用多元统计分析、非参数估计、数学分析、统计软件、应用随机过程、抽样调查等;从图2可以看出,数据科学与大数据专业更倾向于计算机网络、数据科学导论、操作系统原理、Java程序设计、深度学习、数据结构、离散数学等课程。这表明,统计学的专业课程更注重统计方法的教学,数据科学与大数据专业课程更注重计算机操作及深度学习能力的培养。
从软件工具看,统计学专业更强调R、SAS、Stata、SPSS等软件的使用,通过统计建模解决实际中结构化的问题。数据科学与大数据专业面对的大数据的来源往往是多元、异构的,它强调处理技术平台、获取存储、处理和展示各个环节与计算机深度融合。因此,数据科学与大数据专业更注重Python、SQL、C语言、Java、Hadoop/Spark大数据开发技术、更倾向于解决半结构化、非结构化的问题。
3 教学模式比较
在大数据的背景下,当前的统计学专业教学遇到了一些挑战。为了更适应时代的发展,当前不少高校的统计学专业教学模式向以下三个方面改革:第一,完善课程体系。在保留传统的统计学核心课程体系的同时,增设数据分析类的课程,如:数据挖掘、机器学习、深度学习等。第二,加强软件运用及报告撰写能力。目前已有高校所有统计学核心课程全部采取R软件教学,辅助Python、stata、Latex、Markdown等软件教学,提高学生的数据分析能力,报告撰写能力。第三,完善学生导师制度,注重学生竞争力指标建设。在当前大数据背景下,数学建模、统计建模、泰迪杯、市场调查大赛等各种专业竞赛络绎不绝;大学生创新训练项目、攀登计划、挑战杯等各种项目接踵而来,导师不仅是学生的专业、学业修读指导,更应该是学生参加竞赛、科研项目的指导,指导学生在竞赛和项目中成长,增强其竞争力。
数据科学与大数据专业设立时间不长,百事待兴。首先,从培养计划、教学大纲、教材建设等方面可以多借鉴统计学、计算机等相关成熟专业的经验。其次,数据科学与大数据专业和统计学专业,应优势互补,资源整合。如:两个专业的老师可以就一些共同课程,进行交叉授课;对于kaggle数据科学竞赛、阿里云天池大赛、全球AI挑战赛等一些专业赛事,可以组织两个专业的学生一起参加,增强竞争力。最后,“产、学、研、用”融合,办出特色。数据科学与大数据专业成立的一个很重要的原因是现有的专业已不能满足社会对云计算、人工智能、算法分析等行业的人才需求。所以本专业教学模式应注重“产、学、研、用”融合,搭建合理的大数据实践平台,注重在工程教育认证核心理念方面的实践。
4 就业方向比较
统计学专业是一个比较成熟的专业,其就业领域非常广泛,毕业生的主要就业流向有三个部分:政府部门及企业事业单位从事统计调查、信息管理、数据分析工作;银行、证券、保险公司等金融部门从事数据分析、应用管理、风险评价工作;市场调查公司、咨询公司、各类公司从事市场研发工作。
数据科学与大数据专业近年来就业缺口较大。目前,大数据主要有两大方向:大数据分析师、大数据工程师(包括系统研发类、应用开发类)等。大数据分析师是用适当的统计分析方法对收集来的大量数据进行分析,强调的是数据的应用。如从事经济、金融、贸易、商务等行业的产品经理,通过数据建立金融模型,来推出一些理财产品。大数据工程师侧重于技术,主要是围绕大数据平台系统的研发,偏开发层面。如在生物、交通、医疗等领域从事大数据的采集、管理、处理,开发基于大数据的新产品和新业务等。
5 结语
数据科学与大数据专业的思维很多来源于统计学,在大数据的背景下统计学专业也面临着改革问题。基于以上两个专业的差异比较,我们提出两点建议:
(1)数据科学与大数据专业的稳步发展,应学科交叉、产学研用融合。一方面,打破院系壁垒,专业壁垒,研究大数据与统计学、计算机等相关学科之间交叉融合方式,优化课程体系;整合师资队伍,以共同课程、学科竞赛为契机,形成优势互补、资源整合,各有所长的新局面。另一方面,依托大数据实践平台,培养既有严格专业技术训练,又有深刻数据视野的数据科学人才,满足大数据相关产业对基础人才的需求。
(2)统计学专业的教学改革,应与时俱进、稳中求竞。一方面,进行课程改革,增设一些数据分析的课程;教学更强大的统计软件,如R、Python等;另一方面,提高学生竞争力。统计学和大数据专业就业领域有所交叉,侧重点不同。我们应以学生为中心,激发学生兴趣,提高其专业竞赛参与率、项目课题参与率,进而提高其专业化水平。
参考文献
[1]聂淑媛.数据科学的发展与人才培养研究[J].统计与信息论坛,2019,34(01):117-122.
[2]王国仁,金福生,刘驰,等.面向国际化的数据科学与大数据专业课程体系建设[J].中国大学教学,2018,(12):43-45+51.
[3]贺文武,刘国买,刘建华.新工科专业育人共同体与学习共同体构建研究——以数据科学与大数据技术为例[J].教育评论,2018,(08):46-51.
[4]孙欣,尹彪.大数据时代背景下统计学学科的应对[J].统计与决策,2017,(06):2+189.
[5]朱建平,张悦涵.大数据时代对传统统计学变革的思考[J].统计研究,2016,33(02):3-9.