面向数据科学的信息管理和信息系统专业课程建设与改革
2017-08-30张宁袁勤俭
张宁+袁勤俭
〔摘 要〕 [目的/意义] 大数据时代催生了对数据科学人才的需求,推动着信息管理与信息系统专业人才培养的改革和创新,课程建设是人才培养的重要环节,为了构建面向数据科学的信息管理与信息系统专业课程体系,[方法/过程]通过考察国内外高校该专业建设情况以及数据科学的特征,反思我国当前信息管理专业教育现状,分析实施专业课程改革的必要性和可行性,建立面向数据科学的课程体系,开展对数据科学基础理论、实验方法和领域数据研究的全面培养,[结果/结论]在市场导向下,对现有学科进行融合改革,有助于学科的新发展。
〔关键词〕 大数据;数据科学;信息管理;信息系统;课程建设;课程改革
DOI:10.3969/j.issn.1008-0821.2017.08.015
〔中图分类号〕 G250;G642.0 〔文献标识码〕A 〔文章编号〕1008-0821(2017)08-0106-06
〔Abstract〕[Purpose/significance] Big data has created a demand for data science talent,and promoted the reform and innovation of information management and information system (referred to as “information management”),curriculum construction is an important part in talent development. In order to build a curriculum system for the major,[Method/process]This paper analyzed the current situation of the information management specialty education both at home and abroad,also the features of data science,and analyzed the necessity and feasibility of the curriculum reform,establishing the curriculum system for data science,carried out the basic theory of data science,experimental methods and field data research comprehensive training,[Results/ conclusions] In the market-oriented,the integration of existing disciplines reform,contributed to the new development of disciplines.
〔Key words〕 big data;data science;information management;information system;curriculum construction;curriculum reform
随着各个领域的数据增长和积累,基于大数据的产品和服务创新,正有力地改变传统组织的竞争格局。IDC《数字宇宙》的研究报告中预测,到2020年,全球数据量将达到40ZB,中国对全球数据市场份额的划分也将由目前的13%上升到22%[1],数据已然成为一种核心资产和战略资源,是能为组织带来经济利益的数字资源。
数据资源爆发增长,而目前对数据的利用率却不到0.1%,数据科学的发展正是为了处理大数据时代日益井喷增长的数据,数据科学家集合了统计学家、计算机科学家和创造性思维家的能力,麦肯锡报告预计,到2018年,美国可能面临14万到19万数据科学家的短缺,以及150万能够使用大数据做决策的经理和分析师岗位。国外招聘网站 IASSTST(Inter?national Association for Social Science Information Servic?es&Technology) 中显示, 社会对数据服务和数据管理人员的招聘数量从 2010年至 2015年,也呈现逐渐上升趋势[2]。
因此,大数据时代使得市场对数据科学类人才的需求量急剧增加,数据科学类人才的培养成了教育者急需解决的问题,而专业的教育定位应该彰显其对社会需求的呼应程度。国内学者对信息管理与信息系统专业(以下简称“信管”专业)的教育目标和模式等均开展了相关研究,在向同类专业相互借鉴学习方面,杨敏和谢阳群[3]概述了新加坡管理大学信息系统学院在师资力量、研究领域、研究机构、专业设置和专业培养等方面的情况,并提出了对我国信管专业教育的建议;类似地,周毅和张衍[4]以美国26所 iSchool 联盟院校为样本,全面分析了信息构建与信息交互为定位的教育情况;此外,王锰等[5]选取国内外具有代表性的5所高校,对其信管专业人才培养从培养目标、课程设置、课程内容等方面进行比较分析和总结;孟祥保和钱鹏[6]则对国外数据管理专业教育实践进行了综述。也有学者通过实证研究的方式调查市场需求和专业建设的现状,如郭秋萍[7]等对信管专业的学生及用人单位进行了调研,发现信息分析已经成为信管专业核心课程,并据此分析了问题成因;查先进[8]等利用创新扩散理论,针对信管专业学生,考察了高校教学改革创新的影响因素。此外,还有学者从专業课程链建设[9]、特色专业建设[10]、学科整合变革[11]等方面研究了信管专业的教学改革方法或模式。
由此可见,国内对于信管专业的建设已经有了一定的成果积累,但随着各行业对数据科学方法理论与应用研究需求的不断增加,也对信管专业在此领域的未来发展提出了挑战。本文通过考察国内外高校信管专业建设情况以及数据科学的特征,反思我国当前信息管理专业教育现状,构建面向数据科学的课程体系,以期为我国信息管理专业建设与专业教育的调整提供一定的启示。
1 信管专业历史沿革
1998年,我国教育部对本科专业目录进行了调整,将原来的经济信息管理、科技信息、信息学、林业信息管理和管理信息系统5个专业合并,并将合并后的新专业命名为“信息管理与信息系统”,由此可见,信管专业由于原来5个专业不同的背景,课程结构差异显著,长期以来专业建设和发展面临许多挑战;教育部管理科学与工程类学科教学指导委员会于2004年统一制定了信管专业的总体目标和基础课程,提倡各高校根据原有的学科背景办出自身的专业特色;不久后,中国高等院校信息系统学科课程体系建设课题组针对我国国情的信管学科,分别在2005年和2011年建立了中国高校信息系统学科课程体系(CISC2005/CIS2011),包括系列核心课程和推荐课程[9]。
在新的时代背景下,面对新时期市场对信息管理人才的规模化需求,世界各国也在积极探索信息管理人才的培养模式。为了适应信息时代的需求,2003 年,美国 7 所著名的图书馆学情报学院的院长齐聚北卡罗来纳州立大学图书馆情报学院,会议共同提出“信息学院运动”(iSchool 运动),后来组建了著名的 iSchool 联盟,致力于围绕以信息、技术和人的关系为中心的研究与实践,培养信息人才[5],我国也有武汉大学、南京大学、中国人民大学、中山大学等先后加入了iSchool联盟。
由iSchool 运动可知,广义的信息管理专业包含图书馆学、 情报学、 档案学、 信息资源管理、 信息管理与信息系统。在经历院系名称变革之后, 我国信息专业教育日渐趋于理性,专业教育和改革也取得了一定的成果,如武汉大学的信管专业,结合自身特色,创新性地提出“专业课程链”和“专业素质链”的建设。各高校针对信管本科专业的整合建设,其思路基本达成一致,即创建宽口径的信管本科教育专业,形成市场导向的办学特色。
2 数据科学的产生与特征
数据科学是以数据研究为核心的理论方法,为自然科学和社会科学研究数据提供指导,能够从数据中提取知识。其起源最早可以追溯到1960年,数据科学一词由P.Naur 作为计算机科学的替代术语而被首次提出[12],此后数据分析逐渐进入组织的决策支持和流程当中。到20世纪90年代初,数据挖掘诞生并迅速应用于各个业务领域,与此同时,运用行为和交易数据进行解释及预测的工具也随之迅速增加[13],充分显示了在决策支持的过程中,数据发挥了显著的支持作用。同时,由于数据分析的需求增长与复杂度加剧,数据科学逐渐进入研究者的视野。1996 年,国际分类学联合会IFCS( International Federation of Classification Societies) 会议在东京召开,会上首次在会议名称里正式使用数据科学这一术语(“data science,classification,and related methods”) ,之后,关于数据科学的跨学科研究逐渐取得较大进展。
大数据的发展促进了科学研究的新范式,使得传统数据处理事务、管理的视角、过程和方法都发生了显著的变化,具体来说,有4个方面的挑战:第一,大数据的体量需要提高知识处理能力;第二,大数据的多态性需要数据或知识能适应数据类型的变化;第三,大数据的价值呼吁有效的数据反冗余分类机制;第四,大数据的速率要求实时的数据生成模型。
因此,作为一门学科或方法,数据科学正是要解决上述数据的广泛性和多样性问题,数据科学人才主要需要具有3方面的特征:一是具有从巨大和多样化的数据集中收集、处理和提取价值的技能;二是具有想象性地理解,可视化并将他们的发现传达给非数据科学家;三是能够创建数据驱动的解决方案,提高利润,降低业务运营成本。
从上述数据科学人才特征中可以发现,现有的信管专业课程设置已经具备了一定的基础或优势,首先是已经开设了跨学科的课程,如数据库管理系统、信息科学、管理信息系统等;其次是相较于其他专业,信管专业更注重培养对信息价值和信息组织的理解;再次,信管专业的学生也能较深刻地理解数据管理生命周期和项目管理的基本知识;最后,该专业学生也具备一定的数据分析基础。因此,在当下的大数据环境下,针对信管专业进行面向数据科学的课程教学改革是完全合理且可行的。
3 国内外同类专业课程设置现状调研
3.1 数据来源
本文有关信管专业课程建设现状的调查样本主要来自于中国、日本和美国,中国和日本选取进入iSchool联盟的高校,同时也作为亚洲样本的典型代表,美国是iSchool联盟涵盖院校和学科最多的国家,也是该项运动的发起者,具有较好的示范性。
亚洲地区中国选取了武汉大学和南京大学两所高校,原因是武汉大学和南京大学的信息管理学院在国内高校信息管理专业教育中位居前茅,两校的信息管理学院也是 iSchool 联盟院校成员,2012 年,在教育部组织的“高等院校与科研院所学位与研究生教育评估”中,武汉大学和南京大学的图书馆学、情报学与档案管理一级学科分别位列第一和第二,因而其专业的设置对国内其他院校具有指导意义。日本选择了著名的国立综合大学筑波大学,筑波大学2002年设置图书馆信息专门学科群,同时开设了本科生、研究生及博士生课程,也是iSchool的联盟成员。
美国作为iSchool联盟成员最多的国家,已有一定数量的高校明确在培养方案中开设了数据科学(data science)的课程,如iSchool成员之一的新泽西州立大学的通讯和信息学院,类似地,也有部分专业的硕士培养中开设了数据科学的课程,并授予数据科学的相关硕士学位,我们据此进行针对性地研究。
3.2 分析结果
通过查询学校门户网站,并结合中国知网(CNKI)开展的部分文献综述,对亚洲地区的信管专业必修课程的开设情况进行了调查分析,其结果整理如表1所示,可以明显发现,国内的两所大学核心课程定位都较为模糊,相关课程在教学内容和结构式上还存在重复交叉,武汉大学的专业核心课程多达20门,主要涉及信息管理的理论、方法和技术,而且课程设置基本遵照中国高等院校信息系统学科课程体系,课程的设置还欠缺体现学科的发展动向和市场需求。而日本筑波大学的课程设置强调以培养具有实际应用型能力和国际化研究能力的专业人才为目标,大量开始专业英语课程,同时也注重对学生信息技术素养的培养,强调知识和信息的融入,将课程分为多个实践层级,每个层级的实践课程在重点上有所差异,但面向数据科学类的课程开始仍然不明顯。
全美范围内,美国开设有数据科学相关专业的高等院校共计30所,其中13所来自跨学科院系,9所来自商学院,5所来自统计系,剩下3所来自信息学院[14]。共同开设的数据科学类课程有数据分析、数据存储和管理、数据可视化以及通用系统管理。美国数据科学教育结构多元,涵盖本科、研究生等正规教育,也包含证书项目等继续教育、认证教育,表2中显示了与数据科学相关的硕士项目建设情况。
4 面向数据科学的信管专业课程构建
4.1 构建原则
人才培养是实施教学改革的重要目标,在新的数据环境和时代特征下,开展此项教学改革,必须以学生为中心,以市场需求为导向,因此提出了识别、部署、应用和反思的四步循环为指导,如图1所示:
在四步循环中,首先是识别,包括识别外部市场需求和本校的专业定位和学科优势,进而明确信管专业的课程体系定位;其次是对专业课程建设的详细部署,包括专业核心课程群的选择和构建,以及在专业教学中的任务和定位;再次是开设课程的具体应用,在循序渐进的授课中,注重教学范式和手段的创新,注意培养学生的数据意识;最后是对每期授课情况和学生情况进行的深刻反思或总结,坚持教与思的结合,做好科学的教学改革评价工作,以指导下轮的教学工作的运行。
4.2 课程设置
数据科学是研究数据的类型、状态、属性、变化形式和变化规律的学科,更大的数据科学(Greater Data Science, GDS)可以划分为数据探索及准备、数据表示及转换、数据计算、数据建模、数据可视化及演示[15]。所以在考虑四年制本科生教育中开展面向数据科学的课程设置和教学改革,应该首先遵循数据分析的生命周期规律,如图2所示:
数据科学涵盖与数据有关的知识相当丰富,按照数据分析的生命周期规律,考虑将其划分为基础理论研究、实验方法研究和领域数据研究三大模块,在课程设置中考虑对应通识课模块、核心课模块和选修课模块。其中基础理论研究涵盖数据科学的基础和数据的观察以及逻辑推理,研究数据自然界中的观察方法,研究数据推理的理论和方法,完成生命周期中的业务理解和数据理解;实验方法研究包括建立数据科学的实验方法,也即通过核心的技术手段开展数据的探索研究,从而学会认识和掌握数据的各种类型、状态、属性及变化形式和变化规律;领域数据研究主要是要结合各高校自身的办学特色和学科定位,将数据科学的理论和方法应用于许多领域,从而形成专门领域的数据科学,如金融数据科学、医学数据科学和行为数据科学等。按照通识课模块、核心课模块以及选修课模块的结构,并将原有的信管专业核心课程群进行整合,形成如下的面向数据科学的课程设置方案,如图3(以商业领域数据为例)所示:
4.3 实验实训
培养在数据科学领域里工作的人才需要具备两方面的素质,一是概念性的,主要是对概念模型和数学模型的理解和运用;二是实践性的,主要是处理实际数据的能力以及业务理解能力。所以,在课程体系的设置中尤其要注意实践能力的培养,在图3的课程方案中,已经在核心课模块中集中体现了实践能力的训练,还应注意培养认知计算能力,以及思考一些大数据环境下的情景应用,例如,如何创建一些大数据的实验项目,考虑增加细粒度的交易型数据、非结构化数据、社交媒体数据、低延迟的实时数据等,考虑增加移动端的分析,同时能够将商业现象转换成一定质量的表格数据并进行分析。
由于信息技术在社会、经济和生活等各个领域不断渗透和推陈出新,企业和商业部门最先接触到了海量数据,也产生了对数据管理和数据分析的巨大需求,因此在人才培养过程中,要思考并尝试校企联合培养的模式,借鉴国外产学合作项目的成功经验,充分挖掘双方的共有需求,从实际项目入手,细化可操作实施的方案,以价值共创激发双方合作的积极性,丰富和深化产学内容,制定培养标准,共建共享教育平台。
5 结语
Gartner在2015年提出了全民数据科学家的概念,即用户应对数据科学具备基本的知识和技能,并且能够使用正确的工具和流程,以及高级的数据分析工具和方法以支持小数据发现,同时能帮助数据科学家实现大数据发现。
信息管理与信息系统专业具有培养数据科学家的潜在优势,通过整合和强化核心课程建设、提供市场导向的专业课程建设、改进现有的实践模式,进行面向数据科学的学科融合改革,有助于促进学科的新发展,也有助于社会的整体进步。
参 考 文 献
[1] IDC最新调研报告:2020年的“数字宇宙”[EB/OL].(2017-03-10) [2012-12-26]. http://info.chinabyte.com/487/12496987.shtml.
[2] 周晓燕,尹亚丽. 国外高校图书馆科研数据服务人员知识结构分析——以 IASSIST 网站中 2015 年的招聘信息为例[J]. 图书情报工作,2016,60(3):76-82.
[3] 杨敏,谢阳群. 新加坡管理大学信息系统教育及其对我国的启示[J]. 新世纪图书馆,2016,(7):80-84.
[4] 周毅,张衍. 以信息构建与信息交互为定位的信息管理专业教育——以美国iSchool联盟院校为样本的分析[J]. 中国图书馆学报,2014,(6):67-82.
[5] 王锰,左建安,陈雅. 大数据环境下信息管理专业人才培养模式分析与构建[J]. 图书馆,2015,(4):90-95.
[6] 孟祥保,钱鹏. 国外数据管理专业教育实践与研究现状[J]. 中国图书馆学报,2013,(6):63-74.
[7] 郭秋萍,赵静,单欢欢. 信息管理与信息系统特色专业建设实证研究[J]. 情报科学,2015,(9):105-110.
[8] 查先进,杨海娟,严亚兰. 创新扩散和制度同形视角下高校教学改革创新影响因素研究——以信息管理专业为例[J]. 图书与情报,2016,(4):113-124.
[9] 马费成,宋恩梅. 信息管理“专业课程链”的建设与实践[J]. 图书情报知识,2014,(2):4-10.
[10]张志琪,邓胜利. 基于UCD理论的信息管理与信息系统专业教学改革研究[J]. 图书情报知识,2016,(5):13-21.
[11]陶俊,王传清. 信息管理学科整合的变革路径研究[J]. 图书情报工作,2014,(14):41-48.
[12] Data science:history [EB /OL]. (2017-03-11)[2016-06-10]. https:/ /en.wikipedia.org /wiki /Data_science.
[13] FRAWLEY W J,PIATETSKY -SHAPIRO G,MATHEUS C J.Knowledge discovery in databases:an overview[J]. AI magazine,1992,13( 3) :57 -70.
[14]数据科学硕士[EB /OL].(2017-03-11)[2015-08-22]. http://www.mastersindatascience.org/
[15]赵柯然,真溱,汤珊红. 数据科学50年(下)[J]. 情报理论与实践,2017,(2):145.
[16]REZNIK-ZELLEN,R,ADAMICK,J,MCGINTY,S. Tiers of Research Data Support Services[J]. Journal of eScience Librarianship,2012,1(1),27–35.
(本文責任编辑:郭沫含)