APP下载

与大数据公司开展统计学专业实习的探索

2018-01-16张学新

大学教育 2017年12期

张学新

[摘 要]本文系统阐述了当今大数据时代,高校与大数据公司联合进行统计学专业实习实训的必要性,提出选择合作数据公司的标准,探索一种新的、低成本的、校内联合进行的统计学专业实习模式。数据企业主导,一线工程师指导编程,真实企业案例教学是这种项目模式的核心。

[关键词]大数据公司;统计学专业;联合实习实训;校内场地;准商业合同模式

[中图分类号] O212.1 [文献标识码] A [文章编号] 2095-3437(2017)12-0047-04

无论在什么领域,信息是关键的竞争优势。对于企业,数据是无处不在和免费的,稀缺的、有价值的是利用数据资源的能力,即通过数据分析,可视化和构建有效的统计模型来生产和交流信息。因此,高校统计学专业实训教学要围绕培养数据科学专业人才去设计和实施。

一、统计学专业实习现状

目前统计学的实习方式还是以到政府统计部门或企事业单位为主的传统方式。有统计学专业的高校基本上与地方统计局签署了统计学专业教学实习基地的协议,也有通过关系与银行、人寿保险公司共建统计学专业实习实训基地的。

到统计局实习面临许多困难和问题:实习内容与培养目标背离。多数统计学专业不再把统计核算作为统计学专业的全部内容或主要内容, 但统计局的工作仍以统计核算为主要内容,此外,出于保密,许多统计数据不会让实习生接触,无法提供给学生将在课堂学到的现代统计理论和方法用于解决实际问题的实践机会。经济普查、农业普查和人口普查则具有周期性,使得实习不稳定, 实习单位不能保证年年都能接收实习生。

合适的金融实习接收单位难找。银行、保险公司对实习生要求具有金融保险学方面的专业技能,不愿过多接收统计专业实习生。在其他企业实习,专业学非所用,企业把实习学生当作高素质的廉价临时工使用,经常加班,因此学生不愿意去这些单位实习。

重點大学的大数据研究院方案开始建设。2015年12月,复旦大学给出“复旦方案”,成立大数据学院和大数据研究院。大数据研究院得到IBM公司、中植企业集团的襄助。大数据学院与复旦相关院系建立联合培养计划,对本科生培养,采取“2+2”模式,学生在完成一、二年级的学习后可申请学习大数据学院的联合培养课程,完成本科学习后,还有机会进入大数据学院专业硕士和硕博连读项目。

大数据研究院有试验场为服务对象供应充足的数据资源,提供数据收集、存储、分析、计算等服务和软硬件支持,以推动与大数据相关的交叉学科进行研究和产业应用。无疑,大数据研究院及配套试验场给统计学本科专业实习提供了机会。但是,这种统计学专业实习模式不适用于绝大多数普通本科院校。

基于校企合作的“3+1”应用型人才培养模式启用。这种模式[8]是在前三个学年里学生在校完成全部的基础课程、专业必修课程、专业选修课程及公共课的学习,最后一个学年里进入专业对口的企业中接受系统的实地训练,整个实训过程受到严格的计划和安排,使学生学以致用。这种模式的主要弊端有:前三年的课程与企业培训的技能需求脱节,企业花费大量人力、物力等资源,却不能带来利润,企业不愿意与学校合作,或者干脆提供低水平的合作。在实习过程中学校无法后续跟踪与反馈,对学生的实习情况也没有相应的考核与监管,实习无助于学生巩固专业知识的应用。

韩山师范学院实行“3+1人才培养校企合作”模式。学校把毕业设计(论文)设计与专业实习实训都安排到最后一个学年里由企业负责。据悉,多数学生实习结束后获得了数据分析师结业证书。

二、现有统计学专业实践教学模式的研究局限

统计学专业实习改革处于实践探索中。董炳南[1]提出可以由实习带队教师出题,学生自主选题,然后进行社会调查。这种做法基本上是由学院老师指导,不够贴近社会实际。林亮[2]探讨如何提高实习实践教学质量,提出应先使学生对专业的社会定位有个感性认识,再选择实习单位。张波[3]探索与实践重点大学统计学专业实习模式,与省统计局及网络科技有限公司合作,但一般地方院校不具备这样的优势。赵建强,李苏北[4]提出应当提高实践教学学分,以主流的统计软件来贯通相关的统计实践课程。高凤伟[5]提出开展“校企合作”的顶岗实习模式,学校安排在校学生进入专业对口的指定企业进行带薪实习,实习结束后学生根据自身情况可以与企业签约就业。汪朋[6]提出要实施案例教学,注重统计实验室的建设,建立多平台实践教学体系,改革统计学专业实践教学模式。魏岳嵩[7]提出要加强实践教学的内外环境建设,加强和统计部门以及证券企业间的联系,改善实践条件和形式。

不难看出,国内现有统计学专业实践教学模式的研究都有很大的局限性,还是强调学院单方面的建设,即便与企业建立合作,绝大多数也只是普通企业(不是专业的数据公司),在专业课程设置方面,依旧没有咨询数据企业的意见。这样的专业实践教学,本质上仍旧是学院主导,学生为企业打工,实习实训与提升学生应用能力的要求相差甚远。

在国外,合作学习统计学得到关注。Giraud[9]研究比较了统计课堂上,本科生合作学习方式对比课堂讲授教学方式的相对效果,合作学习班的学生取得较高的考试成绩。Cary[10]等人提供了统计教育者如何将合作框架应用于课堂教学和教师合作的实例。他们假定统计指导应该类似于统计实践,目的是突出合作方式可能转化为统计教育的具体方式,希望借此表达对那些不愿采用以学生为中心的教学策略的统计教育者,那些已经尝试过这些方法,但最终又回到了更传统的以教师为中心的教学的教育者的关切。美国卡内基梅隆大学迪特里希人文与社会科学学院的统计系,规定统计学硕士要进行为期一年,分两学期进行的专业硕士统计实习项目,实习重点是项目咨询,项目来自学校附近的公司以及校园有关部门。

本文探讨高校统计学专业实习固有的劣势及数据公司的优势,系统阐明高校统计学专业实习与大数据公司联合开展的必要性,给出高校统计学专业如何与大数据公司联合开展(应用)统计学专业实习实训教学的有益实践。endprint

三、时代召唤高校统计学专业与数据企业联合实习

2015年9月,国务院发布《促进大数据发展行动纲要》,系统部署大数据发展工作,提出要以企业为主体,营造宽松公平环境,加大大数据关键技术研发、产业发展和人才培养力度,着力推进数据汇集和发掘,深化大数据在各行业的创新应用,促进大数据产业健康发展。2016年3月,国家“十三五”规划纲要(2016-2020年)提出:“实施国家大数据战略,推进数据资源开放共享”。针对作为“十三五”十四大战略之一的“国家大数据战略”,我国《大数据产业“十三五”发展规划(2016-2020)》也已颁布,提出主要任务是到2020年,技术先进、应用繁荣、保障有力的大数据产业体系基本形成,大数据相关产品和服务业务收入突破1万亿元,年均复合增长率保持在30%左右。可以肯定,“十三五”期间,大数据领域必将迎来建设高峰和投资良机。

大数据时代的到来催生高校新专业。2014年5月,中国科学院开设首个“大数据技术与应用”专业方向,面向科研发展及产业实践,培养信息技术与行业需求结合的复合型的大数据人才。2016年2月16日,教育部首次增加“数据科学与大数据技术专业”,北京大学、对外经济贸易大学及中南大学获批。2017年3月,教育部发布第二批“数据科学与大数据技术专业”获批名单,共32所高校获批。这些高校新增的本科专业,带有较鲜明的数据特色,凸显培养应用型人才的倾向。

大数据时代给高校统计学专业联合数据公司进行实习实训提供了合作平台。

四、高校统计学专业实习与数据企业需要优势互补

(一)统计学专业课程设置有缺陷

首先,在内容上课程分散、不协调;课程冗余、缺漏,体系不健全;与企业应用贴合度不高,缺乏实战企业案例。其次,数据挖掘课程设置较晚。较多的前端课程,诸如概率论、数理统计、C语言等使学生较难在专业实习( 第7学期)之前形成较扎实的基础和实践能力。最后,数据挖掘课程使用的数据简单。由于数据挖掘课程内容多,既要讲模型和算法,又要讲数据挖掘工具应用,教师不太可能花太多课时在数据预处理内容上(需要更多业务知识),總是使用非常简单的数据。

这样的统计学专业实习实训无法使学生灵活应用统计学知识解决实际问题。在2015年第三届“泰迪杯”参加数据挖掘竞赛的全部664支队伍中,应用数学及统计学专业有286支,占比43.07%。2016年第四届“泰迪杯”全国数据挖掘挑战赛参赛队伍猛增到1665支,统计学专业占比例最高,达到50%以上。但是,组委会2015年的统计显示,所有提交作品中,35%的参赛者不能正确分析和理解相关领域背景问题,不能正确合理地使用模型、算法。

(二)教师可能缺乏解决实际问题的经历和经验

企业对数据分析师有许多专业技能要求,例如 “行业知识和经验”、“IT技术(数据库技术、编程技术,例如SQL、C、Java等)”,而这些是在高校所不能实训的。

(三)学校实验室的设备性能不够优良

做大数据分析,计算模式需要更新,因为工作环境已由单一结构(CPU,MIC)转向混合结构(CPU+GPU+MIC共存协作计算);程序由串行程序设计到MPI并行转到多粒度异构分布并行。常用的“计算密集型到数据密集型到混合型(计算密集型+数据密集型)模式”、“传统并行到分布式并行模式”在一般统计学实验室无法提供实训。

(四)学校单方面的专业实习实训与企业实战相差很远

数据分析最为关键,相反模型只是用来优化结构的,但在学校,数据挖掘教学偏重算法、原理的学习,教学案例大都是为讲解某个具体算法而设计的,缺少实际的应用背景;问题往往不完整, 缺少从问题识别/定义、数据采集/实验设计、数据分析、建模、评估、应用的全过程。学校缺少合适的案例教学资源,教师缺乏行业背景,只会选择较为理想和干净的数据源,简化了现实中数据的复杂性。

(五)校内实习实训场所的限制

高校统计学专业实习先天不足,需要数据企业弥补。对数据挖掘企业而言,公司是智力密集型企业,拥有一批懂业务的数据挖掘分析人员。虽然企业拥有先进的数据挖掘专业设备,但是办公场地小。数据挖掘任务不是标准化的,非流水线型,数据公司无法大规模接纳实习生。因此,高校统计学专业实习需要主动与数据企业进行优势互补。

五、统计学专业与大数据公司联合开展实训教学的做法

普通高校统计学专业实习应该选准大数据公司合作伙伴。我们认为,与好的大数据公司联合进行统计学专业实习,能提供以下保证:

(一)打下坚实的基础

学生能够使用较新的软件工具及数据挖掘技术,并学会如何把统计理论应用于实际。

(二)获得实践者的洞察力

通过实习,学生能接触到愿意一起分享的拥有丰富统计实践经验的教师、工作人员和来访问客户。

(三)能通过指导性实践去学习

学生有多种机会通过案例研究和动手操作咨询项目实践获得应用体验。

湖北工程学院正在探索一种新的低成本实习形式,即校内实习(非现场实习):把企业一线工程师/讲师请进学校,进行真实案例下的情景教学。这种新型实习是采用准商业合同的方式,与专业数据公司进行统计学专业实习实训的联合教学。选定一个基本条件满足前述“选准大数据公司合作伙伴”要求的数据公司,以横向项目名义签署统计学专业的实习实训项目。内容:基于企业真实案例,使学生掌握数据挖掘的基本算法及数据挖掘建模过程。目标:使学生了解数据挖掘技术的基本知识及理论,熟悉数据挖掘技术的主要应用场景及常用算法,了解数据挖掘技术针对具体应用的技术实现路线,了解数据挖掘的主要应用方向。实习实训费用由校方以课酬费用方式向企业方支付,500元/小时。

整个项目分两期进行。(1)编程语言学习期(14周)。校企联合制订实训课程大纲,确定语言编程类课程及教材选用,选择《Python入门:数据挖掘实战》或《R语言入门》,主要是依据广州泰迪智能科技公司2015年的抽样统计,在17家企业的49个数据分析应用需求岗位中,数据分析工具使用排名前三位是R:46.94%,Spss:20.41%,Python:18.37%。学习方式:学校把课程纳入专业选修课,2学分,指派教师领学。每周以邀请专家做学术交流的形式聘请企业进行一次视频讲课及答疑辅导。(2)校内实习实训期(2周)。每个工作日实训时间为8小时。企业在校方专业教师的参与下,完成培训工作,负责指导学生完成《实习报告》。校内实习实训的教学方法采用过程教学法,其主要特点一是精选典型企业应用案例;二是所有课程围绕案例主线展开教学;三是课程不冗余、不缺漏、不重复;(3)亲身参与企业项目。endprint

湖北工程学院统计学专业实践教学很有特色。2015-2016年,本校统计学专业学生连续取得全国大学生数据挖掘竞赛特等奖一项,二等奖两项,三等奖四项的好成绩。这种新的低成本实习形式能有力促进统计学专业教学改革,极大地提升学生的专业应用能力,特别是在数据挖掘方面的技能。

六、结语

与高校联合进行专业实习实训,大数据公司需要战略眼光。数据挖掘对人才的技能要求较高,数据企业一般不会接纳高校的本科实习生。因此,统计学专业与大数据公司联合开展实训教学需要解决如下主要问题:

(一)企业如何与高校优势互补、互惠互利

高校要劃拨统计学专业毕业生专项实习经费,也可以在学生自愿基础上,允许公司向实习生收取一定的费用。也采取其他辅助合作方式,例如在实验室建设上邀请合作企业参与,激发数据公司合作的积极性。

(二)如何提升统计学专业学生的就业实力

数据公司要结合市场需求,将实际项目带入校园,把大项目分解为一些小块,让学生都能参与其中,得到相对真实的锻炼。

在校企联合进行统计学专业实习的基础上,学校可以进一步选派教师到企业培训,培养实践型教师,也提倡进行校企联合申报科技项目等深度合作。

(三)大一——大三修完预备课程

一个合格的大数据分析师需要掌握多种技能:统计分析、可视化辅助工具、大数据处理框架、数据库、数据挖掘工具、人工智能、挖掘算法、编程语言等。在进行统计学专业实习之前,统计分析、数据库、人工智能、挖掘算法等基本课程必须在学校学完。实习实训的前期只是在企业的帮助下,学习编程语言课程。

(四)统计学专业实习期限要延长至一个学期

教育部在《教育部等部门关于进一步加强高校实践育人工作的若干意见》(教思政[2012]1号)中对强化实践教学环节的要求是:增加实践教学比重,确保理工农医类本科专业不少于总学分( 学时)的25%。依照文件精神,可以修订人才培养方案,把实践教学学时比重提升到30%以上,保证有充足的实习时间。

[ 参 考 文 献 ]

[1] 董炳南. 改革统计学专业实习方式[J].统计教育,2002(2):25-26.

[2] 林亮,吴群英,葛梦兰.统计学专业认识实习教学方法探讨[J].现代经济信息,2008(5):156-157.

[3] 张波.统计学专业实习模式探索与实践[J].实验科学与技术,2009(4):105-122.

[4] 赵建强,李苏北.应用型本科院校应用统计学专业的实践教学体系建设研究——以徐州工程学院为例[J].运城学院学报, 2014(2):74-78.

[5] 高凤伟.应用型人才培养视角下的统计专业实习模式实践与探索——以宿州学院为例[J].现代经济信息,2015(6): 234-429.

[6] 汪朋.大数据背景下统计学专业实践教学模式探析[J].高等教育,2015(12):77-78.

[7] 魏岳嵩.地方高校应用型统计学专业实践教学体系的构建与实施[J].通化师范学院学报(自然科学),2016(3):74-78.

[8] 仲旦彦,陈玉荣.基于校企合作的“3+1”应用型人才培养模式的探索——以会计学专业为例[J].大学教育,2014 (11): 61-63.

[9] Giraud, G. Cooperative learning and statistics instrution [J].Journal of Statistics Education,1997(3).[Online: http://www.amstat.org/publications/jse/v5n3/giraud.html].

[10] Cary J. Roseth, Joan B. Garfield, and Dani BenZvi.Collaboration in Learning and Teaching Statistics[J]. Journal of Statistics Education, 2008(1):1-15.

[责任编辑:钟 岚]endprint