国外数据素养教育研究及其启示*
2020-02-23张娟杨文建
张娟 杨文建
(1.四川外国语大学图书馆,重庆 400031;2.重庆第二师范学院图书馆,重庆 400067)
人工智能、云计算、移动互联网、大数据技术的飞速发展,持续提升着社会的信息化程度,也使得人们与数据的关系越来越密切。国际方面,早在2012年,联合国就曾发布大数据政务白皮书《大数据促发展:挑战与机遇》(Big Data for Development:Challenges&Opportunities),旨在推动社会对大数据的利用并带动全球发展。以美国为首的西方国家开始重点关注大数据问题,其中以美国国家科学基金会(NSF)和国家健康研究所(NIH)制定的数据管理与利用政策为主要代表,引起了全球对于数据管理与数据素养教育问题的极大关注,部分大学和大学图书馆由此开始了数据素养教育实践与数据管理指导,以满足教师的科研管理和学生数据素养提升需求。我国在数据素养的教育研究上还存在一些不足,以期通过对国外数据素养教育实践经验的研究为国内数据素养研究与教育实践提供一定的参考。
1 数据素养研究的产生背景
受大数据环境的不断影响,大数据管理与应用工作的重要性逐渐凸显。2009年,微软公司研究人员在《第四范式:数据密集型科学发现》(the Fourth Paradigm:Data-Intensive Scientific Discovery)中指出,通过实证、分析与模拟能够解答很多科学问题,但以数据密集驱动为特征的大数据应用,使计算思维形成对科学研究的重塑,称为第四范式,依托大数据研究可以实现简化或脱离模型构建和假设研究,直接依靠数据开展研究,而数据素养也成为衡量个体在大数据环境下研究能力的标准之一[1]。2013年,美国科学技术政策办公室(OSTP)发布的备忘录指出,美国联邦政府所资助的研究结果(包括数据)都应该以最大程度且尽可能少限制的方式向社会予以公开[2]。随后,我国也开始重视大数据管理与应用工作。2015年,我国出台了相应政策,其中以国务院印发的《促进大数据发展行动纲要》《国务院办公厅关于运用大数据加强对市场主体服务和监督的若干意见》为主导,旨在推动国内对于大数据的发展利用[3];次年,国家“十三五”规划纲要中也明确提出,要实施“国家大数据战略”[4],湖南、辽宁、海南、山东、江苏、广东等省份的机构改革方案中省级大数据管理机构的设立,意味着国内很多省份开始高度重视大数据战略,对大数据的管理与应用也提上了各级政府、事业机构的议事日程[5]。但在高等教育行业内,国内尚未形成对数据素养教育的全面实践,国内的数据素养教育环境尚未形成。随后于2018年,在科学大数据管理问题上,国务院又出台了《科学数据管理办法》,旨在全面提升国内高等教育行业对大数据的重视,助推了国内大数据应用的发展,也进一步将数据素养教育与高等教育挂钩,体现了我国对数据素养教育的极大重视。
高校、科研院所作为未来科研领军人才的主要培养机构,其对个体数据素养、数据能力的培养既体现了对国家大数据政策的积极响应,也是面向社会大数据环境的适应性发展。但从总体上看,国外数据素养教育特别是美国的数据素养教育活动仍然走在国际前列,所以可借鉴欧美国家数据素养教育的先进经验与可行措施,在进一步完善国内数据素养教育环境和改革教育措施的基础上,提升国内数据素养教育的整体水平。
2 国外数据素养内涵研究
当前,严格且准确的界定数据素养还存在一定的困难[6]。Henty等[7]指出,数据素养是科学数据与信息素养在数字环境下演化出的新概念,在部分关于数据素养的论述中,数据、数字、信息往往被混用。数据在一定程度上被理解为数字(存储方式)或量化证据(情境含义),表达的是信息(内涵),所以,数据素养是一种新的素养,其意义仍在不断发展。数据素养,在部分研究中又与科研数据素养、数据信息素养、统计素养等存在密切关系,Carlson等[8]从数据的收集、整理和利用流程中界定了数据素养,认为数据素养是以个体所具备的发现、收集、组织、综合处理和再利用数据的能力为基础,同时也包含个体理解数据含义、格式和转换方式的能力,且具备遵守数据标准规范、伦理与保障数据安全等方面的综合能力总称,所以部分国外学者对数据素养的界定与个体的科研活动、信息处理能力、统计分析能力相关。随着社会对大数据重视程度的不断提升,科研数据管理已经成为当前高等教育的重要研究内容之一,随之而来的对于个体的数据素养的界定也在不断发展。
国外关于数据素养的定义多样,其中有代表性的研究如Stephenson等[9]基于数据操作能力的界定,即数据素养是研究者对于有用数据的敏锐意识和整理、分析、使用能力,重点在于个体的数据操作能力;Sarah等[10]基于数据意识的界定,即数据素养是研究者将有用数据转化为决策支持、方案制定依据的数据意识;Qin等[11]基于数据使用过程的界定,即数据素养是指科研工作中研究者所表现出来的数据操作、使用能力以及数据意识;Mandinach等[12]基于综合能力的界定,数据素养不仅是对个体数据利用能力的界定,也包括对用户思维方式的引导,是个体数据获取、数据利用、数据操作、数据批判、数据伦理等方面能力的综合体现;Prado等[13]从核心能力的角度,将数据素养能力映射到传统的信息素养框架中,指出数据素养的核心能力既包括理解数据,查找和获取数据,阅读、解释和评估数据,管理数据,以及使用数据,也包括遵守数据伦理的意识。
在高校特别是图书馆界关于数据素养教育的相关界定中,数据素养通常被狭义地界定为通过观察、研究获得数据集的能力。Deahl[14]指出,当前的数据素养界定更多地是面向大学教育和科学研究,对普通大众、儿童和青少年的关注较少,在将数据素养的界定脱离高等教育的范畴后,将普通大众的数据素养定义为:“数据素养是使用定量和定性的分析方法进行数据理解、发现、收集、解释、可视化和决策支持的能力”,数据技能、数据知识和数据伦理是一般公众数据素养水平的主要衡量指标。Ford[15]认为,“当前用于数据素养教育的数据实例多以数据集为主,但数据集只有在特定的数据情境中才能被正确地理解和应用,脱离数据情境的数据素养教育不能有效地培养个体的数据理解能力”。在后期的研究中,大多数国外研究者还是倾向于将数据素养界定为若干能力的集合。但对于不同的研究对象,国外也有学者偏向基于不同的数据利用目的来界定数据素养,较为典型的就是基于数据作为正式研究和非正式研究目的对于个体数据素养的界定,如基于科研的数据利用可以使个体对于数据的重视程度更高,更加有利于个体将数据作为学习、研究、转化的主要对象加以深度认识,从而加深个体对数据的理解能力、转化能力、决策支持能力方面的综合提升;而基于非正式研究目的的数据利用就更加偏向提升个体对于数据的发现、收集、组织和利用方面的综合能力[16]。从数据素养教育环境来看,高校是开展个体数据素养教育的重要场所,如何使个体完成从数据采集者、使用者到制造者的角色意识的转变,是能否有效提升个体数据素养的重要因素。
3 国外数据素养教育重点
欧美国家对数据素养的研究实践处于世界前列,其对数据素养的研究源于20世纪80年代美国政府对中学教育的高度重视[17]。近年来,以加州大学伯克利分校为首的一部分美国高校纷纷开设旨在提升大学生数据意识、数据操作能力的数据素养课程[18],华盛顿大学、麻省理工学院、耶鲁大学的图书馆还利用Libguides建立科学数据管理导航,旨在通过资源汇总与推介帮助研究者了解科学数据管理的方法、软件和可用资源,便于学生从实际应用中不断提升数据素养[19]。2011年,普渡大学、斯坦福大学、明尼苏达大学、俄勒冈大学的图书馆还联合开展了“数据信息素养培训”项目,针对部分研究生进行专项数据素养教育[20]。当前,以美国为首的西方国家数据素养教育研究已经在形式、内容、实践上形成特色,对带动其他地区的数据素养教育研究实践具有重要意义。
3.1 关注数据理解能力教育
Mandinach等[12]在对数据素养的定义中指出“数据素养是有效理解和使用数据以便为决策提供信息的能力。它由个体特定的技能和知识组成,对教师而言,是使教师能够将数据转换为信息,最终转化为可操作的知识或信息。这些技能包括了解如何识别、收集、组织、分析、汇总和处理数据,贯穿教育环节中的发现问题、收集和解释数据,以及制订和实施计划的整个过程”。Deahl[14]认为,数据素养是使用定量和定性数据理解、发现、收集、解释、可视化,以及将数据转化为决策支持信息的能力,也包括客观认识和批判数据的能力。相关研究指出,个体的数据素养教育必须涵盖结合数据情境进行的数据批判与理解、解释、转换数据的能力,以及使用数据来解决实际问题的能力培养。尽管数据情境在一定程度上会随着时间推移、记录缺失、理解偏差产生变化、失真等,但数据素养教育必须以忠于数据所表达的客观事实为基础,不能将数据简单地理解为数字或符号。所以,数据素养教育必须关注数据理解能力教育。
3.2 关注数据实践教育
实践是推动个体数据素养教育的有效途径。以大学生为例,在大数据环境下,大学生是数字网络的主要利用者,也是网络数据的主要来源者与消费者。从数据对大学生群体的影响力来看,特别是科研数据、网络数据已经成为大学生学习、生活的固有组成部分,可以结合大学生的网络数据行为对其进行数据实践教育。现有研究已经证实网络虚拟世界和数字网络环境对个体成长、性格养成、交友学习的重要影响,依靠数据教育实践能够有效稳固个体数据素养教育的成效[21]。同时,利用网络数据还能提升大学生的数据获取和数据判断能力,可以通过对数据的数字痕迹研究来培养个体数据伦理、数据道德,这对于形成正确的隐私保护、数据伦理、数据道德具有重要的指导意义,与基于学术研究体系化的数据伦理、数据道德培养具有不同的作用方式[22]。所以,数据素养教育不仅与个体的学术能力培养有关,也需要考虑个体的数据应用与实践环境,从实践中培养个体的数据能力。同时,也需要注重结合个体的身份特征、角色属性开展数据素养教育实践,如针对教师、学生、研究者、网民等不同身份开展适当的数据素养教育,有针对性地提升个体的数据素养[23]。
3.3 注重拓宽教育渠道
对数据素养教育,国外较为注重通过多种模式进行教育,着力拓宽数据素养的教育渠道。Carlson等[8]在Data information literacy: Librarians, data, and the education of a new generation of researchers中以数据生命周期为主线,提出完全基于学术环境和学术研究目的的数据素养能力体系,该体系是数据素养能力界定方面的重要成果,也是部分数据素养教育实践所重点参照的内容。在数字网络环境下,以大学生为主的青年群体通过移动设备、在线平台、App等途径产生大量的数据,但缺乏对这一部分数据的管理与研究,这是该体系的不足之处,利用数据生命周期对大学生进行数据素养教育的成效并不稳定。所以,个体数据素养的培养不仅需要经过基于学术研究的养成模式,也需要通过更广泛的渠道进行数据获取、管理、利用等能力培养。鉴于这种现象,部分国外图书馆在数据素养教育课程外,邀请黑客传授数据收集、整理和利用经验,包括进行个人数据整理与管理实践[24],这也为国内的数据素养教育拓宽了思路。国外还注重通过系统的数据素养教育计划来提升个体数据素养,如1995年由普渡大学实施的EPICS计划就是通过对本科学生进行数据操作与管理技能培养,其主要注重解决工科毕业生缺乏项目管理的实操能力的问题,以及向非营利组织提供足够的基于资金、管理的分析与决策支持服务[25]。美国缅因州还专门开发了面向公众数据素养教育的数据素养工具包(MDLK)MAINE数据素养项目,该项目提供多样的、真实的数据集合以及数据集合创建策略以供教师和学生使用,拓展了数据素养教育渠道;儿童调查网则提供了一套游戏和视频,旨在教未成年人通过调查研究,促进“未来公民正确认识数据道德和数据利用途径”。
3.4 关注数据意识教育
对个体而言,造成其数据素养难以提升的主要原因在于数据意识不高,以及对数据利用的消极态度,改变认识与习惯永远是数据素养教育所面临的最大挑战[26]。在对个体数据素养教育的影响因素研究方面,相关研究指出,教师、数据素养教练、数据素养环境都是影响数据素养教育效果的重要因素[27]。个体对数据的客观态度源自方方面面,如数据采集难度会直接影响个体对数据使用的态度,数据采集难度越大,个体呈现消极的数据使用意愿程度越高;非理工类学科对数据利用的关注度要比理工类学科低,主要原因在于数据利用对非理工类研究者的专业学习能力、科研能力提升不够及时、明显。当前,以课程教育辅以小组训练的模式是国外数据素养教育的主要开展形式,但在培训小组分组时应考虑到学员自身能力水平与学科背景的差异,将差异极大的个体分到同一训练小组将严重影响小组的数据素养培训效果[28];此外,授课教师或数据教练是否能够采用适合个体学科专业特点与认知习惯的方式来培养个体的数据意识也是影响个体数据素养教育的重要因素。
3.5 注重数据交流教育
数据素养并非一个独立的个体素养,也包含个体交流、传递与分享数据的能力。虽然利用数据实践进行数据素养提升已经成为大多数教师与学生的共识,但在培养数据的交流、传递与分享能力上的关注还不多。同时,对于个体而言,培养全面的数据素养能力也包括对个体数据交流能力的培养,只注重个体数据处理、分析能力与数据批判的培养,容易使个体的独立研究能力较为突出,而在合作研究、成果交流与发表方面存在不足[29]。由此,部分研究指出,个体数据素养的提升还应当注重对个体数据交流能力的培养,按所从事的主要工作进行数据交流能力培养,如针对大学生应注重通过数据分享、讨论来提升交流能力,针对科研工作者应注重通过数据安全传递、团队信息共享、科研成果转化与发表等形式进行数据交互能力培养。此外,也可以借助团队训练来有意识地提升个体的数据交流能力,如开展阶段性的数据收集整理成果分享,交流数据获取、分析经验,在培养团队协作能力的同时提升个体的数据交流能力[30]。
4 国外数据素养教育的启示
随着研究的不断深入,人们的学习、生活越来越依赖数据,从数据的影响范围看,数据的收集、创造到形成最终的决策支持信息或知识是一个极其复杂的过程。对数据素养不高的群体特别是公众群体而言,他们通常不具备处理大型数据集的能力。所以,数据素养的产生最初也是基于数据使用能力,以及与数据相关的意识和批判能力的培养需求。从数据素养研究实践的产生来看,数据素养教育是指导个体学习数据操作环节中的系列技能,从而使其获得从数据中找出有用信息的过程;同时,它既是系列技能教育的集合,也是培养个体结合数据情境理解数据、批判数据的能力。特别是对于大学生以及社会年轻群体而言,他们不具备充分的数据处理经验,且不具备数据专家对数据的独到见解,所以对于数据素养教育本身而言,个体数据批判能力是否得到提升是数据素养教育是否成功的重要衡量标准之一。另外,国外对数据素养教育的关注点也从早期的精英教育向大众教育发展,如何使大众具备与数字信息环境相匹配的数据素养,已成为当前数据素养教育所必须解决的问题。
4.1 培养个体数据理解能力
随着数据在科研、工作、生活中的重要作用不断展现,数据分析也正在从科研领域进入日常的工作与生活。对于普通大众而言,他们接触不到类似于美国大选这样庞大的数据集合,但对于教师而言,如何利用现有的数据情境指导大学生获得基于数据的敏锐思考能力是一个难题。所以,数据素养教育的另一个要点就是激励个体不断思考、理解自己所接触的数据,并积极通过各种方式提升个体对于有权控制的数据的全面利用与理解能力;另外,对思考能力的培养不仅限于对数据的思考,也包括对数据情境和数据利用环境的思考,可以遵循“实践、检验、讨论、假设和反驳”这一思维路径来提升个体的思考能力[31]。所以,Shinn等[32]指出,可以通过递进式提问的方式来提升学生基于数据的思考能力,但这必须要建立在教师和学生都具备以数据操作、数据意识为基础的数据素养能力上,才能保证教师对学生的授课效果。具体模式:①如何定义数据集;②数据集收集、分析、传播、利用的各方利益关系是什么;③采用哪种软件、图表或可视化工具能够更好地表现数据间的相互关系;④如何在特定的数据情境中解释数据及其分析结论;⑤利用数据结论会产生何种结果或倾向;⑥在本次数据处理过程中有何收获。
4.2 按需培养个体数据能力
当前对个体的数据素养教育融合了个体作为数据制造者、传输者、研究者和使用者的多重身份,是较全面的教育模式,而教育形式主要依托数据素养技能培养,数据素养的研究应当注重数据素养教育方法的体系化,注重对教育环境的营造,图书馆馆员应当充分履行数据管理者与数据素养教育实践者的双重身份[33],利用长期从事数据存储、共享、管理方面的经验,为个体传授数据管理应用的技能[34]。数据素养教育的主要对象通常是大学生或科研群体,这种教育模式注重的是对社会少数群体的教育,虽然教育具有专业性且能在一定程度上形成对于社会科研工作与数据伦理问题的正向引导,但对整个社会而言,这种重点关注大学生和科研工作者的模式还是存在一定的不足。所以,针对数字信息环境中参与对象的角色不同进行数据素养教育策略研究,或是基于个体在数据利用过程中的身份进行划分,即传播者、读者、制造者、专家(科学家、科研工作者),每个个体的身份在不同的数据集和数字情境下、在不同的数据利用目的基础上都可能不停地转换。具体而言:①传播者。数据的传播者,理解和讲述、传播他人需要或感兴趣的数据。②读者。查看、阅读数据的个体,需要通过一定的数据技能或利用工具来解释、筛选日常生活中越来越多的数据。③制造者。数据制造者,需要技能创造、采集或整合数据并用于提升自身的关注度或从中获取利益,能意识到数据的重要影响力以及数据伦理的重要性。④专家。专业的数据处理、解析与转换专家,具有强大的数据操作能力,能将数据转换为决策支持信息和知识,能够促进社会对于数据的深入理解。从数据素养的教育过程来看,应当遵循从读者、传播者、制造者到专家的逐渐复杂化的能力培养体系,基于上述分类的数据素养教育也能够使数据素养教育更具有针对性,更便于从个体的数据利用需求目的进行针对性数据素养教育引导,以个体的兴趣带动其学习积极性。
4.3 拓展数据素养教育途径
大多数高等教育的教学实践并未体现数据素养的重要性,其数据素养教育当前仍然以数据处理和统计分析等基础性技能教育为主,同时大多数高校用于数据素养教育的数据集合相对固定且数据之间存在较强关联,并不能正确反映数据类型的大小和复杂性,其中一些数据是通过随机模拟产生的,并不能反映科学研究中数据的多样性与随机性[35]。Dunlap等[36]建议从现实世界中采集数据集合而不是采用教科书中的模拟数据,呼吁开展数据素养教育的教师应当鼓励学生自主收集用于分析的数据,以便学生在收集数据时积极参与数据创建、采集和获取过程,帮助学生更好地理解数据与数据情境的关系。通过数据可视化能够有助于个体更好地理解数据之间的相互关系,并锻炼学生的数据理解与转换能力。所以,应当将简单数据集和复杂数据集都作为数据素养课堂教学材料的一部分,便于个体提高对数据理解能力的重视程度。部分研究还指出,应当将数据素养课程作为高校的通识教育核心课程,推动数据素养教育的专业化发展[37]。此外,在大数据环境下,网络作为个体获取数据、利用数据、培养数据伦理的主要途径,也可以用于数据素养教育。当前,部分高校在开展线下数据素养教育的同时,也注重通过网络课程培养个体的数据素养,一是培养个体利用网络资源的能力,二是通过网络环境进一步培养个体的数据伦理与数据道德意识。
4.4 培养个体数据创建能力
数据创建能力虽然并未被大多数的数据素养界定所涵盖,但数据创建在任何数据工作中都可能有涉及,个体数据创建能力也会影响个体的数据转换能力以及对数据伦理的认识[38]。用户创建数据的过程是其“自我收获”的过程,数字信息时代的个体需要不断通过这种数据创建的过程来认识当前的数字信息环境,同时借助这种创建过程加深对数据素养的理解,借此塑造他们正确的数据伦理观[39]。以数据操作、利用能力为基础构建数据素养界定模式反映了个体以更多的知识谋取利益的基础需求,所以从数据操作、数据利用方面进行数据素养教育也是较为普遍的方式。基于数据创建并用于解决或揭示问题的能力培养需要长期的培养与训练,可以依托对研究目标的分析进行逐步培养[40]。然而,创建数据的能力培养相对于现有的数据利用能力而言,需要培养个体了解相关的数据标准、数据生产和数据采集、数据校正与数据清洗、合并、转码的技术或方法,但这种技术与方法的培养需要经过长期的过程。由此,部分研究者认为数据素养教育的第一要务是培养个体确定研究目标或研究目的的能力,然后基于目标进行数据创建以及相应的数据理解、分析与转换,如果数据已经存在,则需要根据研究目的进行数据获取,然后进一步评估数据质量和可信度(按照解析—发现—获取—评估的路径进行系列能力培养)。个体也可以通过自主设计问卷并执行调研的方式,用数据分析的方式来解析、论证他们的问题,这种方式能够有效地提升个体对于数据道德与数据伦理的认识,并进一步提升其数据意识。
4.5 培养个体数据交互能力
数据作为现代信息交流的主要内容,具有表达事实与传递信息的双重意义,数据本身可能没有价值,但结合数据情境就可以产生不同的内涵,也可能由不同的个体结合数据情境而进行不同的理解和描述。对于社会个体而言,每天都会接触到各式各样的数据,这些数据既可以是个体为了学习、研究、工作所创建、采集的数据,也可以是个体利用数据、浏览数据或传递数据所产生的数据痕迹或数据衍生品。以个体在生活中的数据交互为例,他们可以从媒体、网络或他人口中获取消费、交通、娱乐等方面的数据并加以理解,而其所掌握的数据对应的数据情境的真实性、全面性和时效性都对个体理解和利用数据存在较大的影响。在大多数情况下,绝大部分数据用户的角色都是“读者”而非“创建者”或“科学家”,他们只是通过数据来进行决策支持,而不能全面处理数据,所以个体数据交互能力水平就事关个体是否能正确批判数据,并借助对应的数据情境作出正确的判断和决策。据英国面向企业主的一份调查报告指出,他们需要雇佣具有较强数据操作能力和交互能力的数据科学家来完成相关的数据统计、分析与数据结果交互工作,但目前他们很难找到适合的人选[41]。由此也催生出对数据中介的需求,数据中介被认为是目前数据交换体系中的重要组成部分,可以通过雇佣方式介入企业或个人的工作,或是为其提供专业的数据咨询服务[31],但数据中介是否能发挥巨大作用需要在通过长期合作并赢得雇主信任的基础上才能实现,这种特殊要求所造成的影响是企业能够找到合适的数据专家来处理数据并形成数据结果,但仅有很少的数据专家能够将数据结果的含义完整地传递给非数据专家,这也是造成大量的数据分析结果不能有效用于参考决策的原因。所以,部分数据素养界定中也包含个体数据交互能力。由此,需要注重对于个体的数据交互能力的培养,其中既包括对数据本身的真实、全面的传递,也包括对数据情境的客观、全面的描述能力。
5 结论
虽然当前数据素养在高等教育领域已经逐渐成为图书馆学和信息科学等学科的主流核心课程,但在大多数情况下,数据素养教育仅限于“了解”的学习内容范围,缺乏对于数据素养更加精深的教育实践。就整体而言,国外对数据素养的研究在高等教育领域所取得的成果相对更加丰富,现已开始面向社会个体开展的数据素养教育实践,在面向社会大众特别是社会中青年的教育上已经呈现出一定的特点。数据素养教育目前已出现社会化、行业化教育的趋势,但对于社会群体的数据素养教育还尤为不足,需要进一步从社会个体的实际需求出发,以需求带动数据技能和数据能力的提升,促进社会整体数据素养的提升和数据素养教育环境的不断成熟。