APP下载

德国应用型大学数据科学硕士专业发展现状及展望
——以达姆施塔特应用科学大学为例

2019-07-23Sebastianhler

应用型高等教育研究 2019年2期
关键词:信息学学期领域

Sebastian Döhler

(达姆施塔特应用科学大学,德国 达姆施塔特 64295)

0 引 言

在数字时代背景之下,数据科学是一门关键学科。尽管对这一概念还没有统一的定义,但人们普遍认为,数据科学作为一门科学,是将计算机科学和数学科学中的概念和方法与应用知识结合起来,旨在从数据中提取重要的科学或商业知识。在全球范围内,对数据科学家和相关专业人才的需求相当大;[1]在德国,2017年需要约95 000名数据科学方面的专家。[2]美国早已开始建立相应的本科和硕士专业,但在德国,绝大多数相应的专业在2014年之后才开始产生。[3]该研究统计了德国数据科学的8个本科和25个硕士专业。从内容上看更多地要归类于信息学或经济信息学、企业经济学或数学,或者经济数学领域。德国最早一批、真正跨学科意义上的数据科学专业之一是达姆施塔特应用科学大学的数据科学硕士专业,该专业由信息学系和数学与自然科学系于2016年联合开设。

本论文首先介绍达姆施塔特应用科学大学概况及该专业的形成过程;其次对该专业的主要内容、有关专业组织的情况、所需资源、以及迄今为止积累的初始经验进行分析;最后对该专业未来进行展望。

1 达姆施塔特应用科学大学的概况

达姆施塔特应用科学大学(以下简称h_da)是黑森州一所公立大学,成立于1971年。在过去十年中,发展迅速,学生人数已经从10 000名增加到了大约17 000名(冬季学期2018/19)。这使其成为黑森州最大的应用型大学之一,也是德国十大应用科学大学之一。学校所提供的专业广泛,但工程和信息学领域学生最多,这也是学校的重点专业领域。此外,媒体和经济学也是规模较大的专业领域。在应用信息学领域,自2017年11月,h_da拥有博士学位授予权。具体而言,学校的研究和教学由12个学科领域负责组织:[4]建筑、土木工程、化学和生物技术、电气工程和信息技术、社会工作、社会科学、设计、信息学、机械工程与合成材料技术、数学与自然科学、媒体、经济。目前,h_da 提供超过60个本科和硕士专业。

2 数据科学专业的设立

“数据科学”(Data Science)和“数据科学家”(Data Scientists)由来已久,但仅在过去十年左右才开始受到关注。同样在h_da,这个领域一直开展相关教学和研究,只是使用的名称不同。如,数学系一直都有一个很强的统计教研组,在教学和研究中也都应用机器学习。信息学系(黑森州最大的信息学系之一)教师们除了教授学生编程之外,还关注其他不同的重点领域,如数据库教研组最初就在教学和研究中涉及数据科学的核心内容。此外,来自两个学科领域的教师联合建立了与数据科学紧密相关的研究所/工作组。例如设在数学与自然科学系的统计和运筹学能力中心[5],设在信息学系的大数据能力中心[6]。

开设“数据科学”专业的初步想法始于2014年春季,由信息学系和数学系部分教师组成的一个非正式小组提出。经过分析,教师们很快得出了两个结论:第一,开办数据科学专业将满足劳动力市场的巨大需求,同时还能很好地扩展学校的专业结构;第二,数据科学应该作为一个真正的跨学科专业展开教学和实践。这意味着信息学和数学都是数据科学人才培养中不可或缺的重要组成部分。诚然,这个专业既不应被作为信息学领域的专业,也不应被视为数学领域专业而设计,应被作为一个全新专业来对待,有关两个学科和院系都要同等地参与其中。

经两个院系自治机构达成一致后,专业规划委员会开始对该专业进行具体设计,直至2016年4月12日在校报上发布相关重要文件《考试条例分则》。[7]2016年9月,该专业获得了ASIIN认证机构的认证,有效期至2022年。2016年冬季学期,招收第一批16名学生。

3 数据科学硕士专业的发展现状

数据科学硕士专业是一个跨学科、应用型专业。招生对象是信息学和数学专业领域的本科毕业生,也可以录取其他本科毕业生。学制为四个学期,开学时间仅限于冬季学期,成功完成学业需要根据欧洲学分转换系统(ECTS)[9]获得120个学分(CP)。学生在本专业学习中获取的能力既可用于企业实践,也可用于科研。

第一学期,本科阶段学习不同专业的学生首先要在一个“同步模块”中达到统一的知识水平。这意味着,本科是数学专业的学生要获取相应的信息学知识,反之亦然。专业的应用型体现于广泛的专业选修模块都含有实践部分。面向当前数据科学问题的综合实践项目是专业核心组成部分。作为专业模块的补充,设计一些专门用于培养学生社会科学领域的能力以及深化和扩展社会能力和自我能力的模块。该专业由学校的信息学系和数学与自然科学系共同承办,但形式上则是由数学和自然科学系负责监督该专业的规范运行。

学生毕业后取得从事学术工作、管理、高级行政事务和攻读博士学位的资格,获学位是由达姆施塔特应用科学大学授予理学硕士(Master of Science)学位,毕业生可以使用“数据科学家(Data Scientist)”的职业称谓。

3.1 人才培养目标

该专业毕业生能够运用科学方法专业化处理复杂的数据问题并进行数据分析,通过专业的教育,掌握广泛的统计、信息学和机器学习方法。专业力求在人才培养中适当结合实践型和学术型教育:即前两个学期着重传授方法,后两个学期使学生集中精力于知识和方法的应用、积累实践经验,并为向职业生活过渡做好准备。学术能力很强的学生在学习过程中也可以奠定扎实的方法论基础,使他们原则上能够获取攻读博士学位的能力。因此,该专业的人才培养十分注重方法的传授以及对学生方法运用能力的培养,明显优先于仅仅培养学生精通某些软件工具。

3.2 入学要求

原则上,接收信息学或数学领域本科毕业生,且毕业成绩不低于2.5分。除此,具有其他专业背景的学生也有可能被录取,但会提出一些附加条件。事实上,该专业的最初三批学生中,大约三分之一都来自其他专业,例如机械工程、心理学、社会学、企业经济和国民经济学等。在这种情况下,由考试委员会最终作出录取决定。如果学生本科毕业成绩没有达到2.5 分,但总分在2.9分以上,也可以由考试委员会进行个案审查,最后做出是否可以破例录取的决定。该专业也可以采用双元制的形式学习,学生除了满足上述条件,还需要与一家合作企业签订学习协议。

3.3 常规教学计划

针对此专业的教学安排,学校进行科学设计与规划。教学计划包括总计47学分的必修模块、至少38学分专业选修模块和一个至少5学分研讨模块;硕士毕业论文,包括答辩在内,共占30学分(见图1)。

图1 常规教学计划(WP是专业选修模块)

常规教学计划显示,前三个学期一共有38个学分的专业选修模块。这些专业选修模块被划分为三个类型:DS-M类(Data Science Mathematik 数据科学数学)和DS-I类(Data Science Informatik 数据科学信息学)都包含数学和信息学领域专门涉及数据科学的课程。M-I类包含的课程既涵盖数学领域,也涵盖信息学领域课程,但没有专门的数据科学导向性。学生要从DS-M和DS-I类中分别至少选三门课,以及从M-I类至少选一门课。[8]

3.3.1 必修模块

学生第一学期首先要修同步模块(数学同步模块或信息学同步模块),目的是使所有学生达到统一的知识水平,学生专业背景存在差异。这意味着,数学专业毕业生需要获取相应的信息学知识,反之亦然。基于该专业的跨学科性和学生群体构成的异质性,同步模块至关重要。因此,该专业其他大部分模块都要求学生成功修完同步模块后才可以修专业模块,非数学或信息学出身的学生有可能必须要修两个同步模块。至于学生应修数学还是信息学同步模块,还是两个同步模块都要修,由考试委员会做出针对不同学生的决定。数学同步模块,主要介绍统计学和概率学中的基本概念和方法;信息学同步模块除了包括相关讲授课以外,还将项目式实验课与之相互结合,旨在向学生传授数据库和编程领域涉及数据科学的基础知识,并使他们了解操作系统和分布式系统。除同步模块,学生在第一学期还要修一个关于大数据伦理和法律的模块,该模块由社会科学系教师授课。

第二学期的必修模块是多元统计和数据挖掘1组成,特别是多元统计模块的内容是理解现代机器学习的必要条件,数据挖掘1主要涉及传统统计学和机器学习在实践中的应用。

在第三学期,学生要在项目模块中开展非常复杂的实践项目。作为辅助,学生还要学习项目管理与沟通的知识和技巧,并参加学术研讨课。

3.3.2 专业选修模块

DS-M和DS-I类专业选修模块均包含专门涉及数据科学的数学与信息学内容。数学类专业选修模块内容主要侧重于统计学视角下的机器学习,但也包括运筹学和时间序列分析的知识。

M-I类专业选修模块包含数学和信息学两个学科领域中的大量课程,但没有特别的数据科学相关性。

3.3.3 实践项目

在第三学期,学生通常与企业合作完成一个内容广泛并高要求的实践项目。通常约每10名学生组成一个学生项目团队,根据企业合作伙伴提供的课题展开研究,课题都是当前数据科学领域重要的实践与研究问题。学校的专业教师负责项目的质量监管,应由信息学系和数学系的教师负责;企业方面,学生的项目工作由多个员工负责指导,分别担任不同角色,也可能是在Scrum框架下。此外,为了使学生获得项目管理知识和技巧,学生还要参加“项目管理与沟通”模块的学习。

通过实践项目可以学习如何在项目团队中研究当前数据科学领域实践和研究中出现的实际问题,并将研究成果付诸实践。实践项目可以拓宽和加深学生的专业能力、软件工程和项目管理方面的能力、选择合适的数学方法方面的能力、对结果解释以及开展项目的能力,以及一般的知识转化、社会能力和自我能力。关于实践项目的课题,比如开发一个技能型推荐引擎(skills-recommendation engine)、对图像平台用户进行角色验证、分析(传感器)数据等。

3.3.4 研讨模块

学生研讨模块学习时,教师会向学生提供数据科学领域一些特定主题的论文和著作,学生要就此展开学术研究,研究的结果要以科学论文和报告的形式展示。学生要积极参与研讨课期间的学术讨论。

通过该模块的学习,学生将在数据科学至少一个子领域里获得深入的、细分的专业能力。此外,还能够提升学术能力,并通过书面和口头练习提高学术沟通技巧。

3.3.5 学位论文模块

硕士学位模块由硕士毕业论文和答辩组成。通过硕士毕业论文应该表明,学生能够在规定的期限内用科学方法独立处理数据科学领域问题。学生完成论文的期限是24周,最后要经过45分钟的答辩,旨在介绍论文的研究结果并对此讨论。硕士论文的选题通常结合实践完成,如:运用时间序列分析方法预测传感器数据、运用深度学习对比特币价格做情绪量化、拓扑数据分析,以改善分类模型等。

3.4 双元制学习形式

该专业除了全日制学习形式,也可以采用双元制。这意味着学生一方面在学校是注册学生,另一方面同时也作为员工受雇于合作企业。与参加常规学习形式的学生相比,双元制学习形式不仅具有极强的实践相关性,还能让学生实现经济独立;对企业来说,这是一个留住或吸引合格员工的好机会。

h_da所有双元制形式专业都实施被称为“黑森州双元制大学学习”(Duales Studium Hessen)标准[10]。这是为了确保黑森州双元制大学专业都能够满足一定的质量要求,不同教育机构、部委和企业协会经协商确立了高等教育双元制专业必须满足11个质量标准。只有满足标准,学校才能在“黑森州双元制大学学习”的框架下举办双元制专业。

就行政管理流程而言,雇用学生的合作企业首先与学生签订一份学习协议,以及与h_da签订合作协议。学生和企业都可从h_da的一个专门部门获得建议和咨询,[11]并在h_da的双学位专业正规注册。

h_da数据科学双元制专业是实践型双元制专业(praxisorientierter dualer Studiengang)。即这种学习形式下的学生在授课期间完成常规学习,非授课期间在合作企业工作。第三学期,学生在合作企业开展实践项目,不可缺少的项目质量监督和并行研讨会仍由本专业教师负责。同一学期所有双学位学生、各自企业项目指导老师以及学校项目指导教师会一起参加并行研讨会。此外,学位论文模块也在合作企业完成。

4 管理支持保障

4.1 专业的组织与开展

在h_da,关于各专业的组织与考试的一般规则都确定在《考试条例总章》里。[12]针对数据科学专业的其他专门规定则确定在《考试条例分则》。[7]负责该专业具体组织机构为:考试委员会负责监督考试条例的遵守情况以及与考试相关的其他任务,考试委员会由四名教授和两名学生组成,考试委员会同时还决定专业申请人的录取;专业委员会由考试委员会成员和两名学校的员工组成。专业委员会负责课程规划和专业建设方案的进一步完善。

两个委员会由数学和信息学系同等数量的成员组成,以促进院系深入、紧密的合作,并突出两个院系的共同贡献。

4.2 资源和基础设施

由于该专业由两个院系共同开办,因此,各自的人力资源(即教职员工和教师)和空间资源(教室和计算机实验室)都供该专业使用。专业的资源规划可容许每年招收36名学生,但如果申请人数增多,也会增设。开办之时,信息学系和数学系各设立一个新的数据科学教授席位,现在共有约12名教师不同程度地参与该专业的教学。学校相关机构还包括如统计和运筹学研究所[5]、大数据能力中心[6]和应用信息学博士研究中心[13],部分教师不同程度地活跃于这些机构。

5 未来展望

该专业发展迅速,虽然2016年冬季学期的第一批学生仅由16人组成,但2017年已经达到39人,2018年则为44人。目前,注册学生共计89名。女性比例约为四分之一。三分之一学生之前获得数学学位,三分之一学生持信息学学位,剩下三分之一来自不同学科,社会学、经济学以及机械工程。大约一半的学生来自其他应用科学大学和综合大学。

数据科学是一个动态发展的领域,该专业仍处于起步阶段。随着时间的推移,将会有更多的发展变化。

5.1 学生群体的异质性

该专业对学生有很强的吸引力,范围远远超出了信息学和数学专业的本科毕业生。随着学生背景的日益多元化,教师教学也面临着挑战:必须适应学生不同的知识背景。同时,数据科学作为跨学科专业决定了教师必须要离开自己的职业“舒适区”。对于学生而言,让其知识水平达到同步水平的最重要工具是同步模块。专业管理层要与学生保持密切联系,以确保该模块确实能够完成此任务,并在必要时进行调整。针对许多学生对编程课的需要,学校规划了类似Python和统计编程语言R等相关预备课,且专业管理层也积极准备开设更多课程,不过这要取决于大学的可用资源。

5.2 扩大国际化

达姆施塔特应用科学大学与国外众多大学建立了友好学校关系,在教学和研究领域展开诸多合作,但数据科学专业目前还没有专门的合作伙伴。原因在于数据科学是一个年轻的学科,大多数海外的合作院校还未开设相应的专业。但很快会有大量的数据科学专业涌现,也将会为国际合作提供机遇。

5.3 岗位的区分

如前所述,对数据科学家(Data Scientists)的概念还没有明确定义,但相应岗位却已存在,包括:数据工程师、数据分析师,以及数据策略师。随着数字化的日益发展,将出现更多的工作领域和工作岗位。目前第一批毕业生开始进入就业市场,学校也在密切观察他们具体的工作任务,以及这些工作领域将来的发展趋势。

5.4 数据素养

伴随着数字化进程,拥有处理数据的基本能力变得越来越重要。这不仅适用于数据科学家等专家,也适用于那些以数据为基础的工作领域。为了描述这种基本能力——“人人掌握数据科学”——近来提出数据素养(data literacy)的概念[14]。鉴于此,数据科学专业的教师已经为h_da开发出一个适用于全校所有院系的数据素养方案。如果这一方案得以实施,那么数据科学专业也会有新的发展机遇,例如可以创建一个校级数据科学中心,数据科学专业的学生可以和其他专业的学生合作。

数据科学的发展刚刚起步,受数学和信息学影响很大。Donoho探讨了一个问题,即数据科学作为独立的一门学科,长期来看将会发展成什么样。[15]在他的思考过程中,引入了大数据科学(Greater Data Science)的概念,涵盖了许多地方提供的专业,但不仅此于止。目前尚不清楚数据科学是否以及如何逐步脱离它的“父母”学科——数学和计算机科学,从而演变为具有特定概念和方法的独立的科学。无论这是否真的会像Donoho倡导的发展方向一样,可以确定的是,都将使数据科学专业发生变化。

猜你喜欢

信息学学期领域
新的学期 新的尝试
鸡NRF1基因启动子区生物信息学分析
期末冲刺高二上学期期末模拟卷
2020 IT领域大事记
领域·对峙
初论博物馆信息学的形成
八年级(上学期)期末测试题(D)
新常态下推动多层次多领域依法治理初探
miRNA-148a在膀胱癌组织中的表达及生物信息学分析
肯定与质疑:“慕课”在基础教育领域的应用