数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析
2015-07-22华东师范大学图书馆上海200241
隆 茜(华东师范大学图书馆 上海 200241)
数据素养能力指标体系构建及高校师生数据素养能力现状调查与分析
隆 茜
(华东师范大学图书馆 上海 200241)
〔摘 要〕文章在调研国内外文献的基础上,构建了数据素养能力评价维度与具体指标体系,并以此调研了高校不同群体(大学教师、博士生、硕士生、本科生)的数据素养能力现状。研究发现不同群体在数据素养能力上具有显著性差异,高校图书馆可通过设置数据馆员岗位、建设数据服务网页及开展差异化的数据素养教育等方式提升高校师生的数据素养能力。
〔关键词〕数据素养 能力 维度 评价 指标体系
随着大数据时代的来临,科学研究范式进入到一个新的阶段,产生了继实验科学、理论科学、计算科学之后的科学研究第四范式—数据密集型科学。2007年,图灵奖获得者、微软研究院科学家Jim Gray提出了“以数据为基础的科学研究第四范式”(The fourth paradigm: data-intensive scientific discovery)的概念。微软公司还于2009年10月发布了《e-Science:科学研究的第四种范式》论文集,首次全面的描述了快速兴起的数据密集型科学研究。数据不再仅仅是科学研究的结果,而且变成科学研究的基础,科研工作000799者需要基于数据来思考、设计和实施科学研究,并从中推论出事实真相。因而,在大数据时代,科研工作者的数据素养对其顺利开展科学研究具有重要推动作用。
1 数据素养能力评价指标体系的构建
1.1 数据素养概念综述
对数据素养目前有不同的定义,有研究认为数据素养(data literacy)的概念是对媒介素养(media literacy)、信息素养(information literacy)等概念的一种延续和扩展;也有研究将数据素养等同于统计素养(statistical literacy)、数字素养(quantitative literacy 或numeracy);还有研究认为数据素养是信息素养的同义词;也有研究认为数据素养是信息素养的提高与深化。但总的来说,大多数的研究支持数据素养是人们有效且正当地发现、评估和使用信息及数据的一种意识和能力。而对数据素养的内涵与能力,文献中则有不同的阐述。文章在调研国内外文献的基础上,总结了国内外文献对数据素养定义、内涵或组成能力的具体阐述(见表1)。
从文献中对数据素养内涵及其组成能力的具体表述可以发现,国内研究者着重于数据素养的数据意识、数据获取、数据处理、数据评估等能力,而国外研究者则更着重于利用数据来演绎、推导结论及利用数据进行决策的能力。
表1 数据素养定义、内涵或组成能力
1.2 数据素养能力评价指标体系的构建
目前除陈娜萍提出了初中生数据素养评价指标外,国内外对高校师生数据素养能力评价的研究较少。文章在综合国内外文献对数据素养内涵、组成能力的阐述的基础上,从数据意识、数据获取能力、数据处理与分析能力、数据交流能力、数据评价能力及数据道德等几个维度构建了高校师生数据素养能力评价指标体系(见表2)。
表2 高校师生数据素养能力评价指标体系
2 数据素养能力问卷调查
2.1 调查问卷的编制
问卷调查对象为有科研需求的大学教师、博硕士研究生及本科生。问卷内容分为两部分,第一部分为被调查者的个人信息,如:职业、年龄、学历等,第二部分为文章构建的数据素养能力评价指标体系的调查。为对比不同群体在数据素养能力上的差异,研究采用评分制调查法,对每个问题按1-5分设置分值,由被调查者根据自己的实际情况自评打分,1分最低,5分最高。
表3 调查对象情况表
研究利用“问卷星”专业问卷调查平台在线发布问卷,通过各种方式广泛宣传,使被调查者可以通过电脑和移动终端如ipad、手机等方式便捷的回答问卷。问卷调查时长30天,共回收问卷151份,调查对象的具体情况如表3所示。
2.2 数据素养能力的调查结果与分析
表4列出了各群体数据素养能力指标得分均值及标准偏差等统计数据。将指标1-21的均分相加可以看出,得分由高到低的群体依次为:大学教师〉博士生〉硕士生〉本科生,说明以科研为主的大学教师和博士生是数据素养能力最高的群体,而本科生群体的数据素养能力整体较低。
表4 各群体数据素养能力指标得分统计数据(单位:分)
从各指标具体分值来看,各群体得分最高的指标是1,即数据意识中“能认识数据是科研过程中非常重要的因素”,说明大数据时代,各群体已经充分意识到数据在科学研究中的重要性。得分最低的指标是10,即数据处理与分析能力中“能够利用统计分析软件如SPSS对获取的数据做恰当的统计分析”,说明对所有群体而言,对统计分析软件利用能力或者数据分析能力较弱,相关培训的开展势在必行。
得分较低的指标还有6,7,8,19,即数据获取能力的“能够熟练获取各类数据,了解数据源,如获取途径或数据库等、具有检索与收集各种数据的能力、能够对获取的各种形式的数据(格式、类型、特点)做准确解读”以及数据评价能力的“能够批判性的评价数据,结合实际质疑数据”。随着网络的快速发展,各高校电子资源的迅速增长以及海量的数字资源每日迭加,一方面使资源的获取变得简单,另一方面也使得对资源的定位变得复杂。由于缺少数据素养获取能力的相关培训,如何高效的搜索数据仍然是各群体普遍缺乏的能力。
2.2.1 数据意识
表6 各群体数据获取能力指标分值占比
在数据意识的各指标中,各群体均能意识到数据是科研过程中非常重要的因素,而且能以严谨认真的态度对待与使用科研过程中产生的数据。但是,指标“能够认识到科学数据具有生命周期”和“能够保证数据的公正性与开放性”在不同群体中得分差异较大(见表5)。数据生命周期是指从数据产生,经数据加工和发布,最终实现数据再利用的一个循环过程。博士生与大学教师对数据具有生命周期的认知高分值比例较高(4分和5分总和分别占82%和93%),但也有部分教师自评为1分,而本科生相对高分值比例略低(4分和5分总和占73%)。反之,在数据的公正性与开放性上,则出现了相反的结果,博士生与大学教师分值中5分分别占47%和53%,并有部分2分的选项,而硕士生分值中5分占57%,表明了以科研为主的博士生与大学教师在数据的开放性上表现出相对谨慎的态度。
2.2.2 数据获取能力
各群体在数据获取能力指标上均出现了相对较低的分值。表6给出了各群体数据获取能力指标分值占比,从中可以看出,在该维度中,各群体分值均较低而且分值差异较大,1-5分均有分布,而且3-5分占比在10-33%之间,表明各群体中个体差异较大。以指标“能够熟练获取各类数据,熟练掌握各类数据源”为例,大学教师的得分在2-5分均有分布,其余的3分占比达占1/3,与硕士生3分占比几乎相同。而本科生的3分占比则近60%,如果以3分作为及格线,则表明有大量的教师与硕士生在数据获取能力上仅为合格。而在“具有检索与收集各种数据能力”的指标中,各群体3分占比也较高。由各群体在数据获取能力指标中得分的巨大差异表明,各群体中不同个体在数据获取、检索、收集等方面具有非常大的差异,这一方面可能由于不同个体学科专业存在差异,如部分文科教师的研究方向对数据依赖性不强,图1对不同学科师生检索与收集数据能力做了对比,可以看出,理科类师生总体高分值占比较高;另一方面可能与研究生是否参加过科研项目有关,研究表明,参加过科研项目的研究生科学数据收集与利用能力高于没有参加过的研究生[16]。
图1 不同学科师生检索与收集数据能力分值比例分布
2.2.3 数据处理能力
各群体在数据处理能力指标中均分最低,即使是利用EXCEL处理与分析原始数据,在不同个体间也出现了较大的差异,有部分博士生、硕士生的EXCEL数据处理能力还存在较大差距。而指标“能够利用统计分析软件如SPSS对获取的数据做恰当的统计分析”在各群体之间显示出巨大的差异,大学教师、博士生、硕士生、本科生的5分占比分别为35%、47%、54%、5%,并且各群体中1分占比超过10%(见表7)。目前各高校中,关于如何使用统计分析软件的课程较少,大多数的师生主要是通过自学来掌握这些软件,虽然各高校图书馆也陆续开设有此类的讲座,但由于各种因素限制如宣传力度不够、讲授时间过短、与师生课程冲突等导致师生无法通过课程教育有效的掌握该软件。
表7 各群体数据处理能力指标分值占比
表8 各群体数据交流能力指标分值占比
2.2.4 数据交流能力
高校师生不仅要有数据意识、数据获取能力及数据处理能力,还需要有合理有效的数据交流才能将研究成果传播出去,为科学发展作出贡献。应该说,数据交流能力是从事科研工作最重要的能力之一,如果数据交流能力弱,即使有良好的实验结果,较好的统计分析能力,但是不能有效的描述原始数据、不能恰当的应用图表展示数据、不能利用数据支撑论点以及不能利用数据结果作出正确的决策并撰写出报告、论文等等,所有的数据都没有意义。因此,国外的研究者对数据素养的交流能力非常重视,通过将数据素养与专业课程相结合,利用实践教育提升学生的数据交流能力[17]。
表8给出了各群体数据交流能力指标分值占比,从中可以看到,数据交流能力各指标中5分分值占比相对其它指标较少,尤其是“能够依靠数据及其统计分析结果做出正确决策”,表明各群体在该指标上持谨慎态度。在国外的文献研究中可以发现,较多的研究者认为数据素养能力是能够从数据中发现规律、推导论点并作出正确决策,而调查问卷也显示出在这项指标上国内科研人员相对能力较弱。
2.2.5 数据评价能力
表9给出了各群体数据评价能力指标分值占比,可以看出,各群体高分值占比不高,大学教师群体在指标“能够审核数据的准确性,剔除错误或无效数据”及“能够批判性评价数据,结合实际质疑数据”中还出现了2分的选项,说明在数据的具体评估能力上,各群体中的部分个体还需要加强。
表9 各群体数据评价能力指标分值占比
2.2.6 数据道德
在数据道德维度指标“了解数据采集、使用、分享中所涉及的道德和伦理问题,能够尊重他人的数据,使用时能够注明出处”上,各群体分值均较高。随着国内各高校、科研院所对师生及科研人员在学术道德、学术规范等方面的教育加强,师生及科研人员对数据道德也具有较高的自我评价。
表10 各群体数据道德指标分值占比
表11 985高校图书馆数据素养类相关讲座
3 国内高校图书馆数据素养教育调研
在大数据时代的推动下,数据素养研究的开展,在图书馆学情报学领域也掀起了研究热潮。2010年,第76届IFLA大会将“社会科学数据素养”列为会议主题之一;2007-2009年,秦健获NSF资助,开展“科学数据素养项目”的研究;2012年,美国博物馆与图书馆服务协会IMLS资助了“数据信息素养项目”。朱玉奴等[18-19]、孟祥保[20]分别调研了国外高校图书馆数据素养教育的现状、内容与特征发现,国外高校图书馆的数据素养教育基本是从数据生命周期角度出发,围绕科研流程所需技能而展开,通过建立科学数据管理资源导航、数据素养教育通识课程以及学科专题数据素养教育等方式开展。
为了解国内高校图书馆在数据素养教育的实践,文章调研了39家985高校图书馆数据素养教育现状。表11列出了部分985高校图书馆数据素养类相关讲座,除北京大学图书馆与上海交通大学图书馆外,其它高校图书馆虽然也有涉及到数据素养内涵的讲座,如:数据获取能力(数据检索)、数据处理与分析能力(SPSS、EXCEL使用方法),但均未明确提及数据素养。虽然北京大学图书馆和上海交通大学图书馆提及了“数据素养”的概念并开设了部分相关讲座,但还未涉及到数据素养的所有维度,更未形成系统的课程。总体看,目前国内高校图书馆尚未形成明确的数据素养教育模式。
4 国内高校图书馆提升师生数据素养能力的对策
在数据密集型科学环境下,科学研究越来越依赖于海量数据的聚焦与分析[22]。文章对有科研需求的不同群体高校师生的调研结果表明,虽然大学教师与博士生整体的数据素养能力高于硕士生和本科生,但是在数据获取能力及数据处理能力等方面较差,且出现了极大的个体差异。目前,国内高校图书馆不论在数据服务、数据监护还是数据素养教育等领域均大大落后于国外高校图书馆,国内高校图书馆应该利用第四研究范式兴起的契机,针对有科研需求的高校师生,开展有针对性的数据管理、数据素养教育等服务,提升高校师生的数据素养能力。
4.1 设立数据馆员岗位
Creamer A.通过调查美国141 个健康科学馆员与科学技术馆员的工作内容和所需技能,总结出数据馆员所需技能包括 Web2.0 技术、数据保存、数据评估、数据监管工具使用、数据服务宣传与营销、数据监管标准的制定等[23]。孟祥保等[24]通过分析国外高校图书馆数据馆员的招聘信息发现,数据馆员主要从事参与数据管理政策制定、数据资源管理、数据服务以及数据版权、数据伦理以及数据隐私等工作。叶兰等[25]分析了国外高校图书馆数据监护岗位的设置与需求后指出,数据监护岗位已成为国内外高校图书馆越来越需求的岗位。面对大数据时代的来临与大数据的冲击,国内高校图书馆应该积极应对,重新审视自己在科学数据管理中的角色定位,开展专业的科学数据服务[26]。并通过设置数据馆员岗位,为师生提供专业的学科服务。数据馆员岗位的产生可通过两种途径完成:一是设立全新的岗位,二是对原有岗位进行改造和重构[27]。
4.2 建设数据服务(data service)网页
国外高校图书馆的网站往往开设有数据服务(data service)的专门网页,如纽约大学图书馆[28]、加州大学戴维斯分校图书馆[29],内容包括查找数据、组织数据、管理数据、保存数据等。而国内高校图书馆网站目前尚无此类服务,在大数据背景下,国内高校图书馆也应该与时俱进,在网站中开设相应的服务栏目。可先从如何检索数据、数据版权、数据引用等内容开始,随着数据管理服务的逐步开展,再引入数据管理、数据保存等内容。
4.3 开展差异化数据素养教育
信息素养能力在不同群体[30]、不同性别[31]、不同年龄[32]往往具有一定的差异性,而在不同年龄与学历教师群体中也发现了信息素养水平有显著性差异[33],因此,针对不同群体开展信息素养教育具有重要意义。而在大数据时代,各领域的从业人员都需要数据素养,如记者要具备新闻数据素养;科研工作者需要科研数据素养;图书馆馆员也需要数据素养以对科研数据开展有效的管理。因此,针对不同群体开展数据素养教育迫在眉睫。同样,不同群体由于工作、生活等的侧重点不同,数据素养能力往往也有很大的差异。各高校图书馆可以在提供现有数据素养相关培训的基础上,继续深化培训内容,开展系统的、有针对性、多层次的数据素养教育。
4.3.1 针对教师、研究生群体开展深入的数据素养教育
教师与研究生群体以科研为主,往往面临申报项目、撰写论文、报告等科研任务。这部分群体人员平时常常关注科研动态,经常阅读文献,具有一定的数据素养,但往往能力还不够。主要的弱项体现在数据获取能力与数据处理与分析能力上,这一方面源于科研人员对图书馆购买的电子资源了解得不全面,另一方面也源于科研人员的检索能力不强。此外,由于缺少学习途径,对一些统计分析软件的使用方法不够熟练,也导致其在数据分析能力上的不足。各高校图书馆可为该群体制定特定的学科服务策略,深入院系,开展有针对性的数据检索、数据处理与数据分析能力的专场讲座,并结合文献、学科专业等进一步开展数据素养在论文写作中的应用,以拓展学科服务的广度与深度。
4.3.2 针对本科生群体开展全面的数据素养教育
本科生群体虽然不一定以科研为主,但在大数据时代,他们毕业后不论从事什么行业,都需要数据素养。因此,对本科生群体的数据素养教育应该采用通识教育课程,从数据意识、数据获取能力、数据交流能力、数据评价能力以及数据道德等角度全面培养数据素养能力。
随着科学研究第四范式的兴起,数据必将是科学研究中最重要的因素,数据素养也将是科研工作者最重要的能力素养之一。国内高校图书馆需要抓住机遇与挑战,积极应对数据管理、数据监护的研究热潮,一方面陆续开展数据管理研究,另一方面开展数据素养相关的教育与培训,将数据素养教育纳入学校通识教育课程或嵌入学科教育培训中,为提升高校师生数据素养能力,提升图书馆整体水平作出贡献。
(来稿时间:2015年6月)
参考文献:
1.沈婷婷. 数据素养及其对科学数据管理的影响. 图书馆论坛, 2015(1): 68-73
2.张晨. 大数据时代的图书馆与数据素养教育. 图书与情报, 2014(4)117-119
3, 20, 21.孟祥保, 李爱国. 国外高校图书馆科学数据素养教育研究. 大学图书馆学报, 2014(3):11-16
4.Schneider R. Worldwide Commonalities and Challenges in Information Literacy Research and Practice. Switzerland: Springer, 2013:130-140
5.Mandinach E, Gummer E. A Systemic View of Implementing Data Literacy in Educator Preparation. Educational Researcher, 2013, 42(1):30-37
6.陈娜萍. 初中生数据素养评价指标与试题. 初中数学教与学, 2013(14):5-7
7.张静波. 大数据时代的数据素养教育. 科学, 2013(4):29-32
8.金兼斌. 财经记者与数据素养. 新闻与写作, 2013 (10): 5-9
9.缪其浩. 大数据时代:趋势和对策. 科学(上海),2013, 65(4):25-28
10.百度百科.数据素养. [2015-06-08]. http://baike.baidu. com/link?url=AciQr1vRmlbJvFfRx7nAjHitE2BjEzhwPCVNpYT7q xlvOPqiDwDUDxoMmIWiQp2RzCXB90Tujv6PpGU29KYi9q
11.Vahey P, Rafanan K, Patton C et al. A Cross-Disciplinary Approach to Teaching Data Literacy and Proportionality. Educational Studies in Mathematics, 2012, 81(2):179-205
12.Carlson J, Fosmire M, Miller C et al. Determining Data Information Literacy Needs: A Study of Students and Research Faculty. Portal-Libraries and the Academy, 2011, 11(2):629-657
13.项华,毛澄洁. 以物理教育为例 谈信息时代的数据素养. 中小学信息技术教育, 2011(4):47-49
14.Jian Q, D’Lgnazio J. Lessons Learned From a Two-Year Experience in Science Data Literacy Education. IATUL Proceedings, New Series, 2010:10
15.Stephenson E, Caravello P. Incorporating Data Literacy into Undergraduate Information Literacy Programs in the Social Sciences: A Pilot Project. Reference Services Review, 2007, 35(4): 525-540
16.洪程,钱鹏. 高校研究生科学数据需求与利用行为调查分析——以东南大学为例. 国家图书馆学刊, 2014(1):16-21
17.Harris C, Berkowitz A, Alvarado A. Data Explorations in Ecology: Salt Pollution as a Case Study for Teaching Data Literacy. American Biology Teacher, 2012, 74(7):479-484
18.朱玉奴,陈益君. 图书馆数据素质教育的理论与实践.情报资料工作, 2014(6):106-109
19.朱玉奴. 国外数据素质教育及图书馆服务模式研究.图书情报工作, 2014(5):29-34
22.张凯勇. 数据密集型科学环境下的高校图书馆科学数据服务. 图书馆学研究, 2014(3):69-72
23.Creamer A,Morales M,Crespo J et a1. An Assessment of Needed Competencies to Promote the Data Curation and Management Librarianship of Health Sciences and Science and Technology Librarians in New England. Journal of eScience Librarianship, 2012, 1(1):18-26
24.孟祥保,钱鹏. 国外高校图书馆数据馆员岗位设置与管理机制. 图书与情报, 2013(4):12-17
25-27.叶兰. 国外图书馆数据监护岗位的设置与需求分析. 大学图书馆学报, 2013(5):5-12
28.纽约大学图书馆. [2015-06-08]. http://guides.nyu.edu/ dataservices
29.加州大学戴维斯分校图书馆. [2015-06-08].http:// guides.lib.ucdavis.edu/content.php?pid=274775&sid=2265260
30.李德娟. 信息能力群体间差异与高校图书馆信息素质教育改进研究——北京交通大学在校研究生问卷调查分析.河北科技图苑, 2013(3):39-42
31.何彤宇, 李志国. 高校师范生信息素养性别差异的相关性分析. 软件导刊(教育技术), 2013(8):54-56
32.林川, 于挽平. 大学生信息素质的年级差异研究. 图书馆, 2009(1):108-110
33.张霞, 杨劲松. 江苏省高职院校教师信息素养水平的差异性比较分析. 教育学术月刊, 2012(11):49-51
〔分类号〕G250
〔作者简介〕隆茜(1974-),女,博士,华东师范大学图书馆副研究馆员,已发表论文10余篇,参著中英文专著3部,研究方向:信息素养、数据素养、信息检索。
Construction of Index System of Data Quality Ability and Investigation of Present Situation of Data Literacy Ability of Teachers and Students
Long Xi
( East China Normal University Library )
〔Abstract 〕On the basis of the research literature at home and abroad this article introduces construction of evaluation dimension and the specific index system of data quality ability to research the data quality status of different groups of colleges and universities ( teachers, PhD, master’s and undergraduate).The study found that different groups have significant differences in data quality ability, academic libraries can set up the data librarian post, construct data service web page and carry out data literacy education in order to promote the data quality ability of teachers and students.
〔Keyw ords 〕Data quality Ability Dimension Evaluate Index system