新工科背景下的大数据教学体系建设探析
2019-01-10王元卓于建业
王元卓,于建业
1. 中国科学院计算技术研究所,北京 100190;2. 北京物资学院信息学院,北京 101149
1 引言
这是大数据的时代。从公司战略到产业生态,从学术研究到生产实践,从城镇管理到国家治理,都将发生本质的变换,大数据将成为时代变革的力量。然而,这也是大数据人才短缺的时代。大数据市场发展迅猛,大数据人才供给严重不足。根据Boss直聘的数据显示①Boss直聘《2018求职旺季人才趋势报告》,在人才最为紧缺的前十个职位中,大数据、人工智能、算法类岗位占据了半壁江山,以大数据、人工智能为代表的新兴技术岗位的薪资,无论是薪资基数、涨幅,还是发展空间,均高于其他岗位。
我国是人才大国,但能掌握和应用大数据技术的创新人才仍是稀缺资源,培养大数据人才成为紧迫的问题。近3年来,开设“数据科学与大数据技术”专业的高校数量猛增,已累计达到283所。虽然大数据人才的培养已开始起步,但是大数据人才培养模式与体系尚未达成共识。其原因在于大数据是一个跨学科、领域交叉、与行业应用紧密结合的复合型专业,涉及的知识往往来自于计算机、统计、行业领域等。如何有效地融合跨学科、交叉领域的知识,培养具备数据思维和计算思维的大数据人才,是当前高校大数据专业建设面临的问题。
与此同时,为主动应对新一轮的科技革命与产业变革,支撑服务创新驱动等一系列国家战略,2017年2月以来,教育部组织了多次新工科研讨会,先后形成了“复旦共识”“天大行动”“北京指南”等指导性文件,指出了新工科建设的5个“新”,即工程教育的“新理念”、学科专业“新结构”、人才培养“新模式”“新质量”和“新体系”。随后,有学者对新工科的内涵进行了解读和探讨[1-3]。“复旦共识”指出新工科建设和发展以新经济、新产业为背景,一方面主动设置和发展新兴工科专业,另一方面推动现有工科专业的改革创新。数据作为一种新兴战略资源,运用数据科学理论和大数据技术,将形成数据服务、数据探矿、数据化学、数据材料、数据制药等一系列战略性的新兴产业。同时大数据也渗透到金融、医疗、制造、流通等工业领域,提升传统行业的价值,促进传统行业的升级。大数据作为新工科专业的重要方面,相对于传统的工科人才,未来新兴产业和新经济需要的是实践能力强、创新能力强、具备国际竞争力的高素质复合型新工科人才。因此,在国家推动新工科建设的背景下,大数据专业建设与发展正当其时。
2 新工科背景下的大数据教学体系建设
在面向新工科的大数据专业建设中,应遵循以学生为中心、成果为导向、持续改进的国际工程教育专业认证理念——以成果为导向的教学模式(outcame based education,OBE)[4],提升大数据人才的培养水平。教育体系应注重数据思维和计算思维的培养,课程设置与行业应用紧密结合,专业课程注重实践能力的培养,而数据则成为实践的基础。
2.1 大数据人才素质与能力要求
大数据专业是一门涉及数据科学、计算机科学、大数据技术、行业应用等多领域的复合型交叉学科,培养的人才也是兼具行业应用专业知识和大数据技术的复合型人才。因此,在确定大数据专业的人才培养目标时,需确立大数据专业人才的基本素质和能力要求。
大数据专业人才培养基本目标如图1所示,主要包括以下方面。
图1 大数据专业人才培养基本目标
(1)多学科交叉融合的基础素质
大数据人才培养涉及数据科学、计算机和行业应用等多学科领域知识,在基础素质培养方面需要注重多学科交叉融合的素质培养,包括通识教育、语言能力、法律道德、计算机伦理、数学基础等。
(2)复合型专业能力
大数据人才兼具数据科学、大数据技术和行业应用等多专业知识,具备复合型专业能力,包括行业应用基础理论、数据科学基础理论、行业应用数据技术、学习方法等。
(3)计算思维与数据思维
除了具有多学科交叉融合的基础素质和复合型专业能力外,大数据人才还需要培养计算思维和数据思维,具备建模能力、求解能力、数据分析能力等。
(4)工程实践能力
大数据技术是与行业应用紧密结合的实践性很强的技术,大数据人才培养中也需要工程实践能力的培养,包括案例教学、实习实训等。
2.2 打造大数据课程体系
为了达到大数据人才所需的素质和能力培养要求,必须打造大数据人才培养的核心知识体系。大数据人才的知识体系主要由3个方面构成,包括基础理论与方法、大数据计算技术、行业领域知识[5]。尽管不同高校的大数据专业特色和面向的行业领域有所不同,大数据的内涵和外延也在不断拓展,但是大数据专业的核心知识体系(即基础理论与方法、大数据计算技术)是共通的,包括大数据管理、大数据处理、大数据分析等。在大数据核心知识体系的基础上,结合高校自身的行业领域优势和特色,重组并优化涵盖行业知识的专业课程体系,使课程体系一贯化、教学内容融合化,包含面向低年级的通识教育与专业基础教育、面向高年级的工程驱动的计算思维与应用驱动的工程能力培养。同时,数据思维的培养应当贯穿大数据人才培养的全过程。大数据课程体系设置思路如图2所示。
图2 大数据课程体系设置思路
为了实现大数据专业课程体系的一贯化和融合化,需要对多学科交叉知识进行融合,对传统计算机、数学、信息管理等专业的核心课程进行梳理,并与高校自身特色行业应用课程融合,涉及大数据的基础理论、计算机技术、智能计算方法和行业应用4个方面。根据以上思路,大数据课程体系设置如图3所示。
图3 大数据专业课程体系设置
大数据专业课程分为三大类:专业基础课、专业核心课和专业选修课。专业基础课涉及传统的数学基础课程、统计基础课程和计算机专业基础课程,需要对这些课程进行整合,以适应大数据专业的基础知识需求。专业核心课则涉及大数据及行业领域的专业核心知识,可分为大数据基础、核心技术、分析基础以及大数据分析等大数据专业核心知识。专业选修课侧重大数据技术实践和行业领域应用,从大数据平台技术、智能计算方法、大数据行业应用3个方面,突出计算思维和数据思维的专业知识应用和实践能力教学。
2.3 建设大数据专业系列教材
当前我国高校的大数据教学尚处在摸索阶段,尤其缺乏成熟的、系统性和规范性的大数据教学体系和教材。在此背景下,中国计算机学会(CCF)大数据专家委员会成立了大数据系列教材丛书编委会,由梅宏院士牵头组织业内资深专家,着手编著系列化、规范化的大数据教材,并在2018中国计算机大会(CNCC2018)上首先发布。
大数据系列教材丛书由中国计算机学会大数据专家委员会组织编写,采用“1+3+X”的体系,即以1本《大数据导论》为基础,设置《大数据管理》《大数据处理》和《大数据分析》3本关键技术教材以及针对行业领域的X本应用教材。
(1)1本基础导论教材
《大数据导论》介绍什么是大数据、大数据的感知与获取、大数据的存储与管理、大数据的计算架构、大数据分析计算平台、大数据治理、大数据安全与隐私、大数据行业应用等。
(2)3本专业关键技术教材
● 《大数据管理》从数据模型与语言、大数据管理系统两大方面介绍大数据的管理。
● 《大数据处理》从基础技术篇到计算篇,再到进阶篇,由浅入深地介绍大数据处理框架和技术。
● 《大数据分析》从大数据分析的基础知识、理论基础、相关算法、典型应用等层面详细进行阐述。
(3)X本行业领域应用教材
行业应用层面瞄准当前产业界大数据应用较为广泛的领域,组织编写面向行业领域的X本应用教材。“X”系列教材既可面向工程实践教学,又可面向职业培训,并且将随着产业界大数据应用的发展进行更新。
2.4 构建突出计算思维和数据思维的实践创新教学体系
大数据专业应以应用驱动和面向行业领域的职业导向为抓手,在基础教育和跨专业融合的基础上,构建以计算思维和数据思维为专业能力的实践创新教育体系,培养面向行业应用的大数据人才。在构建实践创新教育体系时,重点突出计算思维和数据思维的专业能力,通过关键技术、实验教学、实施案例、实习实训等具有实践创新的教育教学,培养大数据人才的工程能力。大数据技术具有很强的工程实践性,大数据实践教育实施的基本条件包括数据条件、师资条件、计算条件等[5]。这些大数据人才培养的基础条件,对于一般的高校而言通常难以实现,需要政产教紧密结合,依托高校所在地的优势产业,政府给予政策与资金支持,建设大数据创新基地,面向行业领域提供真实场景、真实数据、计算资源、企业导师等。
在构建实践创新教学体系过程中,要将大数据专业教师和学生“走出去”与企业技术导师“走进来”两种模式结合:
● 学生通过在学校实训或到企业实习等机会进行锻炼,提升学生的实践动手能力,未来更加契合企业的实际需求,同时帮助企业完成智力引进;
● 高校聘请企业技术专家到校开展实训、技术指导、讲学等,使学生能够开拓专业视野;
● 高校在引入企业导师的同时,对大数据专业教师进行“双师型”培训,使高校教师了解大数据在行业的应用现状等,并与基础课程教学相融合。
3 政产教融合的大数据教育创新探索
国内高校在大数据相关专业的建设和发展上持续探索[5-9]。在大数据实践教学中,需要计算资源、数据资源等条件。这些条件需要大量资金、政策、真实数据的投入,对于高校而言,通常难以实现,需要政府提供政策、资金,企业提供真实场景、数据资源等,政、产、教资源融合才能实现以学生为中心、成果为导向的教育理念。目前国内一些地方政府、企业、高校已经开始政、产、教融合的探索与实践。
● 产教融合的大数据教育创新机制。教育部学校规划建设发展中心于2016年5月正式启动数据中国“百校工程”项目,提出构建“五位一体”大数据创新生态体系,旨在通过2~3年的努力,在全国范围内遴选百所高校,部署集人才培养、资源开发、科研支撑、行业应用及社会服务于一体的“大数据应用创新中心”,与项目院校共同设立“大数据学院”,促进大数据产业、有关高校和科研机构的深度融合发展,打造大数据发展的创新生态系统,助力大数据人才培养、科技进步和产业发展。同时百校联网形成“大数据应用协同创新网络”,构建协同创新大数据超级平台。百校联网超级大数据平台具有100 PB数据规模,50万通用核和100万流处理核计算能力,约有600名学术带头人和5 000名科研人员以及一批科研团队。通过校企共建大数据学院,计划培养10万~20万名大数据工程师,成为我国大数据发展战略的重要支撑和服务力量。
● 政产教融合的大数据试验场用以提供大数据人才培养的数据条件和计算条件[5]。“大数据试验场”是面向大数据问题设计的大数据技术研发和试验验证环境,拥有大规模数据容量及管理分析能力的重大基础设施,服务于大数据研究开发和人才培养、基于大数据的科技与产业创新等。上海市已将大数据试验场写入大数据相关规划,并推进相关建设。2016年12月,由复旦大学和上海交通大学共同牵头,29家高等院校、研究所、企事业单位在上海联合成立了全国首个大数据试验场联盟,共同打造大数据试验场产业生态圈。
● 产教融合的阿里云大学高校实训项目。将阿里云的云上计算实验资源、行业实战经验与课程体系、高校理论知识融合,通过短期集中强化训练,帮助学生深入理解专业知识的应用场景和应用技巧。该实训项目由阿里云认证的企业导师负责实训教学,实现真实案例、真实场景、真实检验,并在重庆大学和贵州理工学院成功实施。
4 对大数据专业教育教学体系建设的思考
大数据产业是战略性新兴产业,大数据专业的建设和发展也刚刚起步。大数据自身的特点使得大数据专业建设需要产业界、政府、高校多方合作,共同努力。除了大数据教育教学体系建设,还应当在如下方面加快建设步伐。
(1)加强政产教融合的大数据教育生态体系建设
当前国内大数据教育方兴未艾,吸引了产业界、政府和高校的关注,但是大数据专业建设尚在探索,大数据教育的生态尚不完善。大数据教育生态体系的构建需要政、产、教等多方紧密合作,共同推进,包括大数据教材体系的建设、大数据专业建设、产教融合的大数据创新学院建设、政产教融合的大数据创新基地建设以及以人才质量为核心的人才评价体系建设。
(2)建设政产教融合的大数据创新基地
作为大数据教育生态的重要一环,大数据创新基地建设需要高校、企业、政府多方合作,高校投入师资与科研力量,政府投入政策与资金支持,企业投入定制化实训课程、数据与平台,探索政产教融合的共同培养大数据人才的新模式,帮助高校推进高水平师资队伍建设、培养战略性新型产业的专业集群、提升服务区域经济能力;帮助地方培育大数据经济智库,促进本地人才与科研成果转化;帮助企业提供大数据生态与大数据人才。
(3)加强大数据师资培训
当前大数据师资力量相当缺乏,而师资是关系到大数据人才培养质量的关键之一。大数据师资建设需要优化知识结构和师资队伍,加强大数据师资培训力度,鼓励教师到企业挂职等,了解企业大数据应用需求,熟悉大数据工程实践,增加师资队伍中“双师型”教师比例等。