“互联网+”视角下面向科学大数据的数据素养教育研究*
2016-12-14李立睿邓仲华
李立睿 邓仲华
(武汉大学信息管理学院 武汉 430072)
·专题研究·
“互联网+”视角下面向科学大数据的数据素养教育研究*
李立睿 邓仲华
(武汉大学信息管理学院 武汉 430072)
科学大数据的形成以及科研模式的转变,使传统数据素养教育的内容和方式面临挑战。但是“互联网+”的出现,为面向科学大数据的数据素养教育提供了发展机遇。文章从“互联网+”视角下分析了面向科学大数据的数据素养教育内容,在此基础上,从基于泛在互联的嵌入式教育模式、基于知识协同的综合化智库支撑以及基于情景感知的智能化教育平台三个方面,探讨了提升科学大数据素养教育质量的发展趋势。
互联网+ 大数据 科学大数据 数据素养教育 科学研究
〔引用本文格式〕李立睿,邓仲华.“互联网+”视角下面向科学大数据的数据素养教育研究[J].图书馆,2016(11):92-96
1 引言
当前,科学数据已经逐渐成为科学研究的基础资源和重要保障。尤其是在自然科学领域,以高维度、复杂和异质为主要特征的科学数据正在向科学大数据发展,研究人员正在通过对海量动态的科学大数据进行组织、聚合和分析,以数据驱动的方式进行知识的探索与发现。因此,对科学大数据的认知、获取、利用和管理几乎成为每个科研人员必备的技能素养。与此同时,“互联网+”思维模式和相关技术的发展,为面向科学大数据的数据素养教育提供了一种变革思路,通过以互联网为基础设施和创新要素,在顺应数据密集型科研范式转变的同时,能够重组传统数据素养教育业务流程,创新数据素养教育服务模式,进而培育科研人员的科学大数据智慧学习技能,构建泛在化信息环境的科学大数据素养教育生态系统。
2 科学大数据:数据素养教育的新挑战
2.1 科学大数据与数据素养
大数据时代的到来,学科的发展与交融,科学数据正以指数级式的速度在不断增长,研究人员面临的主要问题不再是如何获取科学数据,而是如何以海量科学数据为研究资源,从这些数据中提取信息、发现知识和呈现规律。由此可知,科学大数据是以数据密集型的综合性学科(如地球科学、基因工程、气候科学等)为主要特征,数据表现为复杂性、动态性、全球性的特点,其研究方法向多领域、跨学科方向转变,并且通过数据来分析、设计和实施科研方案。通过对科学大数据相关的理论研究与实践应用进行梳理,科学大数据主要具有以下特征:①高度数据维度[1]:由于科学大数据表征了复杂的自然科学和社会科学的现象或关系,而这些数据关系极其复杂,具有高度数据相关性和多重数据属性;②高度计算复杂性[2]:科学大数据多以高度复杂的数据模型形式,应用于非线性复杂系统,并且需要结合复杂的系统理论和机理模型进行分析和探索;③高度不确定性[3]:科学大数据的获取主要来自于传感器的自然感知和科学实验,这样导致了数据的获取存在一定误差和不完备性,从而引起整个科学大数据系统表现出相对的不确定性。不难发现,科学大数据的收集、组织、分析和应用给数据管理技能提出了更高的要求,同时为科学数据素养的教育带来了新的挑战。
目前,对于数据素养的概念缺乏统一的定义,部分研究者认为数据素养是媒介素养、信息素养、统计素养等概念的拓展和延伸,只是侧重的对象以数据为主。但更多的研究者认为数据素养具有更加深刻的内涵:Carlson认为数据素养涵盖了以数据生命周期为基础的数据收集、数据组织、数据分析、数据可视化以及数据再利用的数据基本能力[4];张晨进一步指出数据素养由数据的辩证认识能力和综合应用能力两方面组成[5]。此外,孟祥保等从科研生命周期的角度、学科专业的角度以及大数据的角度全面剖析了科学数据素养的内涵,并指出其包括数据意识、数据技能以及数据发现三个层面[6]。因此,以科学大数据为视角的数据素养必须以科学大数据显著特征为基础,强调数据密集型科研环境下科学大数据辨识技能、分析技能、展示技能等方面的数据素养。在此基础上,科研用户能够通过了解专业领域的数据管理规范和数据质量标准,充分利用自身专业技能,对科学大数据集中进行数据挖掘和知识发现。
2.2 科学大数据对传统图书馆数据素养教育带来的挑战
科学大数据在给科研人员带来挑战的同时,也促使着图书馆对于科学数据素养教育职能的转变。笔者通过对地球科学、气候科学、生物科学等学科的科学大数据现状进行分析发现,科学大数据对于传统图书馆数据素养教育的挑战主要集中在两个方面。
(1)数据素养教育的内容。由于科学大数据具有明显的海量、异构以及复杂特征[7],因此图书馆不得不应对数据素养教育内容的多样和繁杂。一方面,由于科学大数据主要集中在自然科学领域,图书馆必须以该领域的学科背景为基础,从科研人员易于接受的视角进行数据素养的教育,帮助其厘清面向特定问题的科学大数据分析和处理技能;另一方面,不同学科和层次的科研人员对于科学大数据的认知各异,这样导致图书馆中的数据馆员必须针对不同的教学对象,根据其不同的需求,对数据素养教育内容进行不断调整,这种专深化和个性化的数据素养教学内容无疑给图书馆带来了挑战。
(2)数据素养教育的方式。科学大数据的获取主要来源于传感器、计算机仿真以及科学实验,这些数据的维护、管理与利用是各不相同的,这样导致科研人员对于科学大数据生命周期各个阶段的数据能力要求也是不同的,因此,这就需要图书馆在寻求以多样化的教学方式(如合作化教学、混合式教学、游戏化教学等)的同时,能够结合媒体化的教学手段来提升单个研究者或群体研究团队的数据素养。
3 “互联网+”给科学大数据素养教育带来的发展机遇
“互联网+”与科学大数据素养教育的结合,不仅仅是数据素养教育的在线化,而是一种变革思路,而“互联网+”的本质是网络智慧和现实智慧的集合[8],也就是说,将互联网相关技术作为基础设施和创新要素,注重将以互联网思维为导向的开放、互联、协同和跨界,通过与现实素养教育模式进行智慧化的深度融合,从而优化教育组织结构,提升技术创新效率,促进整体素养教育业态的转型和升级。
在理论方面,“互联网+”为科学大数据素养教育引入了新的思维理念。“互联网+”作为国家经济发展的一项重要战略,它要求传统行业基于互联网思维的模式来思考和解决现实问题。同样,在泛在化信息环境下,数据素养教育质量的提升显得更加重要,而运用互联网思维对传统数据素养教育模式进行重新审视,可以优化数据素养教育流程,促进新型数据素养教育业态形成。“互联网+”的思维理念强调了一种开放互联、平等交流、协同创新的服务特征,这也顺应了科学大数据跨学科融合、跨领域协同的研究方法和创新模式,对于科学大数据素养教育的目标也是非常契合的。
在实践方面,“互联网+”为科学大数据素养教育提供了新的技术支持。“互联网+”及其相关技术极大丰富了科学大数据素养教育的管理方式和服务手段,提供了更加智能化的技术支撑和高效化的基础设施,尤其是大数据、云计算、移动互联网、物联网、智能穿戴设备等技术和工具的发展[9],为整个科学大数据素养教育提供了基于云、网、端一体化的数字化、智慧化的技术支持,能够实时化感知用户的动态情景,跟踪科研人员需求偏好的变化,真正形成以科研人员为中心的智慧课堂[10],从而提升了科研人员的体验度和满意度。
4 “互联网+”视角下科学大数据素养教育的内容
图1 “互联网+”视角下面向科学大数据的数据素养教育研究
面向科研人员的科学大数据素养教育实质上是服务团队通过借助“互联网+”相关技术(如大数据技术、虚拟现实技术、物联网技术、云计算技术等),构建面向科研人员的虚拟现实空间、智能计算空间、移动网络空间、泛在知识空间,从而实时感知科研人员情景,将线下问题发现与线上服务推送进行融合,形成虚拟协作与实体活动的人本化教育服务体验,在整个科研项目生命周期中形成全面的知识协同,真正实现从科学大数据的产生、分析、管理、利用、归档等一系列相关数据素养教育服务质量的提升,保证科研人员的素养教育服务满意度,快速推动知识创新和知识应用,如图1所示。
4.1 科学大数据意识素养教育
科研人员的数据意识是其具备良好数据素养的必备条件,直接影响着科研人员对于科学大数据需求、获取和评价的自觉程度。与此同时,科学大数据意识的强弱程度也直接影响着后期以互联网为基础的科学数据价值共享、挖掘和再利用过程。因此,科学大数据意识素养的教育能够借助数据馆员在学科情报服务方面的优势,提升科研人员的数据意识。由此可见,科学大数据资源意识教育可以从以下两个方面进行:科学大数据的资源意识教育和法律意识教育。一方面,海量的科学大数据作为一种战略资源成为科学研究的基础,科研人员必须具有一种强烈的数据资源意识。因此,数据素养教育服务人员可以重点强化学科数据资源的重要性,加强网络化科学数据的资源保护意识,培育科研人员对于大数据资源的需求、共享和分析的意识理念,强化科学大数据的互联互通、开放存取和跨学科共享,这是因为大数据资源和一般资源不同,可以通过互联网进行广泛共享融合,不断提升数据资源的应用价值。另一方面,科学大数据在存储和共享过程中,可能由于人为或意外的原因导致敏感数据的丢失或泄露,这势必对于科研机构产生难以估量的潜在风险,因此,对于科研人员相关大数据法律意识的培养也是至关重要的,尤其是在开放性的互联网环境下,只有围绕整个科学大数据的生命周期进行法律和网络风险意识的教育,才能合理利用和开发受知识产权保护的数据,从而在源头上预防潜在的威胁。
4.2 科学大数据分析素养教育
由于科学大数据具有自身独特的复杂性和不确定性,这就导致了科研人员对于科学大数据的分析和利用过程不同于一般数据的处理。大数据分析素养是研究人员有效利用数据、扩大数据影响的重要环节,它直接决定着研究人员对于数据价值的认知。
通过对相关文献的梳理,笔者认为在“互联网+”环境下,科学大数据分析素养教育主要涵盖以下方面:①科学大数据评估素养。不同学科的数据来源方式各有差异,因此,对于科学大数据获取的格式、类型和方法等需要一套完整的评估策略和评估机制,这就需要数据素养教育服务团队针对不同科研人员进行系统化的评估素养培训,以此提升其科学大数据评估能力;②科学大数据管理素养。科学大数据复杂多样,不同层次的科研人员对于大数据的组织方式、元数据管理、分类标准、数据的网络化安全需求不同,数据素养教育服务团队应围绕科研项目系统地对科研人员进行数据的标准化管理,也为后期大数据的归档、科研成果的整理奠定良好基础;③科学大数据的表达素养。大数据的探索和挖掘是科学研究过程中最为重要,也是最复杂的部分,一方面,数据素养教育服务团队要向科研人员进行常用数据分析工具和方法的应用培训;另一方面,相关的数据馆员应作为科研团队中的一员,对科研人员通过网络化工具的应用,进行大数据可视化工具和技巧的教育,帮助科研用户从不同的学科视角来进行大数据的分析和理解,发现科学大数据背后隐藏的知识和规律。
4.3 科学大数据监护素养教育
科学大数据的产生是一个具有时间序列特征的大数据集合,从大数据的整个生命周期来看,科研人员通过运用自身的数据洞察能力、数据分析能力和数据展示能力从大数据集合中挖掘有价值的信息和知识。除了原始的大数据集合以外,在对整个科学大数据集合开发的过程中,会产生种类繁多、类型各异的数据集,其中包括图片、手稿、视频、代码程序、网络收藏、报告材料等一系列相关的数据,对于这些第一手数据的监护和管理工作是相当重要的。
因此,对于科学大数据监护素养的教育主要体现在两个方面:①原始科学大数据集合的监护素养,整个科学大数据集可能因为研究需要,被转化或分割成不同的数据集合,为防止数据的丢失和破坏,科研人员必须针对不同的需求对科学数据进行备份和维护,这即是科学大数据集合监护素养教育内容的重要组成部分;②科研人员小数据集合的监护素养,科研人员小数据集合主要是指其在研究过程中不断产生的数据集合,亦是知识发现过程中的中间数据。由于不同层次、不同学科背景的科研人员对于这类中间数据集合具有不同的理解和认知,因此导致了对这类支撑科研人员发现知识的小数据集合的监护管理工作是相当细致和复杂的。数据素养教育服务人员必须通过网络化的协作方式对不同科研群体进行针对性的监护素养培训,共同探讨和制定这类异质化小数据集合的管理方案,按照特定的标准进行整理,保证数据集合具有良好的重用性。
不难发现,在数据密集型科研环境下,科学大数据素养教育是一个系统而庞杂的过程,数据素养教育的内容不仅涉及到数据文化层面,还涉及到特定学科具体的数据技能和网络安全方面,这就决定了数据素养教育需要依托“互联网+”,创新数据素养教育的组织模式、服务模式和教学模式,以适应当前科学大数据管理服务工作的要求。
5 “互联网+”视角下科学大数据素养教育的发展
5.1 基于泛在互联的嵌入式教育模式
随着Polanyi在1944年提出个人的经济行为能够嵌入到经济化和非经济化的社会关系之中[11],嵌入性这一核心概念逐渐受到了多个学科学者的关注。在图书情报学领域,由Knapp在1956年最早明确指出,图书馆用户的教育不应该单独由图书馆员提供,而应该与院系教师一起,将用户教育融入到学校的整体教学工作中[12]。这极大促进了嵌入式理论在图书馆素养教育中的发展。不难发现,科学大数据素养教育也是教育服务人员与科研人员的知识共享与合作的过程,良好合作协同关系的营造是教育服务顺利开展的基础。
与此同时,“互联网+”的发展,不仅加速了科学大数据的互联,促使科学大数据跨学科、跨领域、跨系统进行共享和融合,而且提升了科研团队内部、科研人员与教育服务人员之间的合作广度和深度,这样为科研人员开展数据素养教育提供了一种泛在化的网络教育空间。科研人员可以突破现有物理环境的约束,开展关联性科学大数据技能学习、开放化的科学大数据共享体验以及协作化的科学大数据经验共享。一方面,基于泛在互联的嵌入式教育模式能够有效保障教育服务人员对不同层次科研人员数据素养需求的感知;另一方面,教育服务人员能够将物理嵌入、虚拟嵌入、组织嵌入等多种嵌入方式进行有效的结合,有机地嵌入到科研人员的专业课程或者网络教学平台,把数据意识、数据技能和数据伦理融入到专业课程教学内容,通过与学科领域专家和科研人员协作,快速提高科研群体的大数据素养。
此外,嵌入式教育模式的建立,能够有效降低科研人员对自身拥有的科学大数据安全和隐私方面的顾虑,这样有利于教育服务人员更深层次掌握科研人员的数据素养需求。此外,随着嵌入式协作机制的不断完善,嵌入式教育服务人员可以利用互联网时刻与科研人员进行需求的互联互通和动态反馈,通过参与到科研人员的研究项目之中,承担起整个科研团队的数据素养教育课程,潜移默化的影响科研人员,让其在学习和科研中不断提高数据素养技能。
5.2 基于知识协同的综合化智库支撑
面向科学大数据的素养教育是精细而又复杂的,需要图书情报机构在开展数据素养教育工作的同时,强调科学大数据素养教育服务人员之间专业化知识的协同,充分发挥教育专家的集体智慧。面向科学大数据的素养教育团队应由学科馆员、技术专家、科研管理部门、数据分析专家等以团队的形式共同组建,这样各个团队成员之间能够互相交流、互相学习,吸收其他团队成员的经验,促进知识协同效应的产生,从而全面而系统地构建支撑于科学大数据研究的智库[13]。另一方面,在获取科研人员数据素养需求的基础上,科学大数据教育服务团队之间能够发挥自身专业素质优势,基于智库进行共同协商,调查科学大数据的管理计划、组织格式、共享模式、数据利用方案等相关的数据技能,制定具有科研人员学科领域特色的数据素养教学内容,保障数据素养课程的高效开展和顺利实践。
除此之外,图书情报机构可以通过以定期或不定期的方式对科学大数据素养教育服务团队进行数据意识、数据技能以及数据伦理等方面的专业化培训,开展数据素养研讨班,促进服务团队经验的分享,激发数据素养教育人员的服务热情,提升其综合化的数据素质,进而不断丰富和发展面向科学大数据的素养教育智库。例如,哈佛大学图书馆通过举办数据科学家培训班,来提升数据馆员的数据素养能力[14]。因此,图书情报机构通过将互联网作为数据和服务互联的有效手段,加强与科研管理机构之间的合作,提升科学大数据素养教育服务人员的数据管理技能,深化智库的完善和创新,适应数据素养教育服务功能的延伸和深化,从而真正拓展馆员专业化和综合化的素质。
5.3 基于情景感知的智能化教育平台
科学大数据的特征决定了数据素养教育具有显著的复杂性、连续性和递进性,图书情报机构在发挥自身良好资源组织与服务优势的基础上,应借助“互联网+”相关技术和基础设施,构建智能化教育服务平台,其中包括无线传感网络、自动化多媒体呈现设备以及其他智能化系统,从而形成一个智慧学习空间,通过感知科研人员的实时情景、行为方式、心理状态,全面监控科研人员需求,进而快速而具有针对性地提升其智慧学习技能,充分展示应对科学大数据的管理和控制职能。在横向方面,图书情报机构应建立以科学大数据生命周期的智能化数据素养教育平台,其涉及数据收集、组织、分析、管理与再利用的重要环节,注重科研人员数据分析工具、数据引用等知识和技能的培训。在纵向方面,图书情报机构面向科学大数据的素养教育应始终保持一种由浅入深,层次递进,充分体现科学大数据管理与数据监护的周期性和完整性,因此,面向科学大数据素养教育系统的智能化平台建设应具备足够的技能多样性、内容丰富性和功能互动性,据此满足不同学科领域和层次的科研人员群体。例如,图书情报机构可以从科学大数据管理的资源导航、数据素养的通识教育以及特定学科的大数据素养教育逐层互动和递进,充分建立起科研人员与服务人员之间智慧化的数据素养教育互动平台。通过调研发现,国外教育机构已经逐步通过Waspmote、Cooking Hacks等系统构建出智能化的教育服务平台,感知用户实时行为信息,创建感知信息网络,从而获取用户需求并以此推送个性化教育培训服务[15]。另外,康奈尔大学图书馆的研究数据服务小组以专业化的学科服务平台为基础,通过监控和分析用户的互联网行为数据,为科研人员提供数据分析、数据共享和数据引证等综合化、系统化的数据特色服务[16]。
6 结语
虽然面向科学大数据的数据素养教育模式还处于初级发展阶段,但是随着科研模式转变的逐渐深入,大数据素养将成为图书情报机构展示教育职能和提升服务价值的重要手段。“互联网+”的发展,在推动科学大数据互联和融合的同时,也强化了数据素养教育服务人员与科研人员的协同创新关系,促进了数据素养教育服务人员集体智慧的发挥。毋庸置疑,“互联网+”给图书情报机构带来了机遇与挑战,图书情报机构必须乘势而上,充分利用这一思维和技术的变革,智能化感知科研人员的科学大数据需求,系统推进支持科学大数据素养教育的智库建设,不断拓展科学大数据素养教育服务人员综合化专业素质,进而提升科研人员对科学大数据的获取、分析、管理和利用等能力。
(来稿时间:2016年5月)
1. Abarbanel H D I, Brown R, Sidorowich J J, et al. The analysis of observed chaotic data in physical systems [J]. Review of Modern Physics,1993,65(4):1331-1392
2. Rocha L M. Complex systems modeling: Using metaphors from nature in simulation and scientific models. Los Alamos: Los Alamos National Laboratory,1999
3.郭华东,王力哲,陈方,等.科学大数据与数字地球[J].科学通报,2014,59(12):1047-1054
4. Carlson J R, Fosmire M, Miller C, et al. Determining data information literacy needs: A study of students and research faculty [EB/OL].[2015-11-28]. http://docs.lib.purdue.edu/lib_fsdocs/23
5.张晨.大数据时代的图书馆与数据素养教育[J].图书与情报,2014(4):117-119
6.孟祥保,李爱国.国外高校图书馆科学数据素养教育研究[J].大学图书馆学报,2014,32(3):11-16
7.宫学庆,金澈清,王晓玲,等.数据密集型科学与工程:需求和挑战[J].计算机学报,2012,35(8):1563-1576
8.詹青龙,杨梦佳.“互联网+”视域下的创客教育2.0与智慧学习活动研究[J].远程教育杂志,2015(6):24-31
9.李立睿,邓仲华.基于“互联网+”的融合图书馆构建研究[J].图书与情报,2015(6):33-37,62
10.陈丽,林世员,郑勤华.“互联网+”时代中国远程教育的机遇和挑战[J].现代远程教育研究,2016(1):3-10
11.Polanyi K. The great transformation: The political and economic origins of our time [M]. Boston: Beacon Press,1944
12. Knapp P B. A suggested program of college instruction in the use of the library [J]. The Library Quarterly,1956,26(3):224-231
13.王红.图书情报机构在国家智库建设中的使命担当与服务创新[J].图书情报工作,2015(14):46-50
14. Harvard library offers data scientist training [EB/OL]. [2015-12-12]. http://library.harvard.edu/09162013-0930/ harvard-library-offers-data-scientist-training
15. Libelium[EB/OL].[2015-12-15]. http://www.libelium.com
16. Cornell research data management services [EB/OL]. [2015-11-28]. http://confluence.cornell.edu/display/ rdmsgweb/ services
Research on Data Literacy Education of Scientific Big Data from the Perspective of “Internet +”
Li Lirui Deng Zhonghua ( School of Information Management, Wuhan University )
With the transition of scientific research pattern and development of scientific big data, it challenges contents and methods of traditional data literacy education. However, the emergence of ‘Internet +’ provides the opportunities to the data literacy education of scientific big data. This paper summarizes the contents of data literary education oriented to scientific big data from the perspective of ‘Internet +’. On this basis, it discusses the development trends which can promote the quality of scientific big data literary education from the perspectives of embedded education pattern based on ubiquitous interconnection, complex think-tank construction based on knowledge synergy and intelligent education platform based on context-aware.
Internet+Big data Scientific big data Data literacy education Scientific research
G252.7
*本文系国家自然科学基金资助项目“大数据环境下面向科学研究第四范式的信息资源云研究”(项目编号:71373191)与国家自然科学基金资助项目“云计算环境下图书馆的信息服务等级协议研究”(项目编号:71173163)的研究成果之一。
李立睿(1989-),男,武汉大学信息管理学院博士研究生,发表论文10余篇,研究方向:知识服务;邓仲华(1957-),男,博士,武汉大学信息管理学院教授,发表论文100余篇,研究方向:信息组织与信息系统。