高校图书馆数据可视化教育探讨
2020-01-03李亚玲
摘 要:伴随着大数据时代的来临,高校学术研究者的数据素养日益重要,而对数据处理的需求也不断增大,数据可视化是大数据时代最基本的数据素养之一。高校图书馆对高校师生的信息素养培训具有重要职责,因此有必要将数据可视化能力作为信息素养教育的一部分来开展。通过通识教育模式或学科混合培养模式,进行对数据处理应用和数据清理的培训,以提升高校研究学者利用数据的能力。
关键词:数据可视化;数据素养教育;高校图书馆
中图分类号:G252;G250.7 文献标识码:A 文章编号:2096-4706(2020)16-0196-03
Discussion on Data Visualization Education in University Library
LI Yaling
(Xian International University,Xian 710077,China)
Abstract:With the advent of the era of big data,the data literacy of academic researchers in colleges and universities is becoming increasingly important,and the demand for data processing is also increasing. Data visualization is one of the most basic data literacy in the era of big data. University library plays an important role in the information literacy training of college teachers and students,so it is necessary to carry out the data visualization ability as a part of its information literacy education. In order to improve the ability of university researchers to make use of data,we should train the application of data processing and data cleaning through general education or subject mixed education.
Keywords:data visualization;data literacy education;university library
0 引 言
随着大数据时代的到来,数据作为一种资源被广泛应用于各个领域,如何利用好数据资源成为学术领域必然面临的问题。数据可视化工具作为展示数据之间关系的有效工具得到了广泛的应用,成为数据分析和展示的必备工具。图书馆的数据可视化服务既包括帮助用户进行数据可视化分析,又包括对用户进行数据可视化方面的信息素质教育,数据可视化教育对于图书馆的信息素质教育有重要的意义。
1 图书馆数据可视化教育的内容
1.1 对数据可视化功能的展示
虽然在大数据时代人人都意识到了数据的重要性,但许多研究者对于数据可视化应用前景的认识依然十分有限,并不清楚数据可视化对自己的研究究竟有什么样的作用。因此,展示数据可视化功能是数据可视化教育的起步。数据可视化功能的展示主要是向研究者展示如何将数据进行可视化操作以及对研究者所在学科的应用前景。该教育是普及性教育,主要目的是激发研究者的兴趣,使研究者们不再将大数据、数据可视化视作与自己学科毫无关系,并且遥不可及的数据统计概念,促使他们将数据可视化的方法和工具应用到自己在本学科的研究内。目前国内外已经开展数据可视化教学的高校图书馆都将数据可视化功能展示作为其教学的第一步,并且普遍认为生动形象的数据可视化展示是能否吸引研究者继续学习的关键。
以西安外事学院的数据可视化教育为例,教育过程中展示了数字人文的数据可视化过程,先利用网页爬虫技术从西安外事学院的文档中抓取数据,然后利用“镝数聚”在线数据可视化平台的地图功能展示西安外事学院的出国学生分布状况,十分形象地展示了数据可视化的强大功能,如图1所示。
1.2 数据应用处理培训
根据笔者针对西安外事学院科研人员的观察发现,虽然大部分研究者都重视对研究数据的搜集,但很多研究者并不重视对数据的清洗处理,许多误差数据和错误数据也被当作有效数据进行处理,因此开展数据可视化的第一步就是数据应用前的处理。数据应用处理包括对數据进行统计、分析和清洗。虽然完全掌握数据应用处理技术是一个较为复杂的过程,需要一段较为漫长的学习时间,但对于高校师生来说,并不必完全熟悉复杂数据统计、分析和清洗方法,只需要根据自身的需要学习可以应用的数据统计方法和工具,以及了解数据清洗的必要性和一般方法即可。学习的目的主要是为数据分析做准备,尤其是为实现数据可视化做准备。在进行数据应用处理培训的时候,图书馆应结合具体科研实践中所产生的数据,逐步讲解如何进行数据的清洗、分析,帮助研究者掌握数据应用处理的过程。
1.3 数据可视化工具应用培训
熟练使用数据可视化工具是整个培训的最终目标。通过培训,图书馆要求研究者在完成数据应用处理后,能够利用数据可视化工具直接输出可见的数据关系图,并利用这张数据关系图进行数据分析,从而似数据关系图转化形成有效的研究结论,同时实现对研究结论与数据关系的清晰表达。在培训过程中,图书馆要求研究者至少能够根据自身的学科特点掌握一种数据可视化工具,并学会将数据可视化工具应用在自身的研究中;另一方面,考虑到大部分研究者的统计学知识的不足,尤其是部分社会科学的研究者对数据科学的认识和理解能力不足,图书馆培训应依托学者们经常使用的软件数据统计软件(如Excel),推荐一到两款操作相对容易、不会涉及复杂变成语言的软件(如Tableau、Gephi等)来进行,促使研究者树立数据可视化的意识,并主动可视化自身研究数据。如西安外事学院在进行数据化培训的时候,针对语言学院老师的学术特点,在数据可视化工具中选择了Excel作为培训基础工具,主要考虑到Excel普及程度较高,并且与其他数据库兼容度较好,自身也具有一定的数据可视化功能,非常适合初学者。而Tableau数据可视化软件功能齐全,不但可以应用已知表格,还可以结合地图创造表格,更适合复杂的研究。
2 数据可视化教育模式
目前,国内外许多高校图书馆都开展了数据可视化教育,根据自身情况不同,各学校图书馆主要采取了通识教育模式和学科混合培养模式来进行。
2.1 通识教育模式
在数据可视化教育中,大部分的高校图书馆都采取通识课教育,即通过一定时间内的集中培训将数据可视化的知识传授给研究者,目前通识教育模式的主要形式包括讲座培训、课堂教学等方式。在通识教育课下,研究者的专业背景没有太多的相关性,課程的主要目的是经过教学和培训使研究者能够了解数据可视化的意义,并掌握基于Excel等常用数据统计工具的数据可视化工具的使用。通识教育对于文科类专业尤其重要,以西安外事学院为例,数据可视化的通识教育在语言专业等设定了较长课时。
2.2 学科混合培养模式
由于目前国内外已经开展的数据可视化教育主要针对的是高校内的研究人员,大部分研究者参与数据可视化教育的目的也主要与自身科研项目的开展有关,因此伴随着科研项目的开展的数据可视化教育方式,即学科混合培养模式,将更加切合研究者的需要。学科混合培养模式是将研究者的信息素养教育与其学科研究结合起来,伴随着研究项目的推进,研究者在进行研究数据处理的同时进行数据可视化教育,逐步提高研究者的数据素养。近年来,国内外部分高校已经尝试采用学科混合培养模式,加大对研究者的数据素养的培养力度,为研究者提供全面的数据服务。西安外事学院也尝试利用学科混合培养模式参与学院相应的数字人文研究,通过为语言类等类别研究者提供数据服务,来进行可视化教育。
3 图书馆数据可视化教育培训的问题
3.1 按专业和需求进行数据可视化教育
由于研究水平和专业需要的不同,研究者对数据分析和处理的要求也不一样。不同专业的研究者因为学科性质的不同,适合其自身的数据可视化工具也不同,需采取不同的可视化方式,因此,图书馆应针对不同研究者的特点,在信息素质教育过程中为其选择相应的数据可视化工具。如在西安外事学院,为经济学专业的研究者选择数据统计功能较好的Dygraphs,社会科学研究者则选择具有地图数据可视化功能的“镝数聚”在线数据可视化平台或较为简单的腾讯云,而学校内的本科生在完成毕业论文时更需要使用便捷且较为熟悉的Excel来实现论文数据可视化,较为复杂的数据可应用腾讯云等比较智能化的软件。
腾讯云是一种在线网页式数据可视化软件,能够实现数据聚合、管理、挖掘、可视化技术,对接丰富的数据资源和媒体资源,使用者不需要学会复杂的程序语言,只需要将已成型的Excel表格数据上传至腾讯云大数据平台上,选择网页提供的数据表格样式,即可自动生成需要的数据可视化图形,如图2所示。
3.2 提供充分的实践机会
数据可视化工具相较于信息素质教育中的其他教学项目,研究者需要更多的实践机会才能熟练应用,因此图书馆在进行相关教育时,应当给予研究者更多实践机会,图书馆应在研究者的实践中对其进行指导,帮助其熟练掌握相应的数据可视化工具。在条件允许的情况下,图书馆员应直接参与到研究者的实际研究中,根据研究者的研究数据情况帮助其完成数据分析和可视化操作,在此过程中实现对研究者的数据可视化教育。西安外事学院每周都提供多次实践辅导机会,并与学者进行互动,帮助学院内的研究者掌握数据可视化软件,如图3所示。
3.3 使用开源和大众化的软件
虽然在实践中使用付费的数据可视化软件可能会获得更多的功能或更好的服务,但在教学过程中,出于对版权保护和教育成本的考虑,图书馆应尽量使用开源、免费并且较容易获得的数据可视化软件,并且软件能够链接研究者们经常使用的数据处理软件。如Gephi数据可视化软件具有较强的数据可视化处理功能,是一款开源软件,并且能够与研究者经常使用的Excel等数据处理软件相结合,具有很好的适应性。因此,西安外事学院图书馆将Gephi作为主要讲解软件。
4 结 论
大数据时代,高校师生的信息素质不仅包括其信息获取能力,也包括其数据获取、分析、利用和管理的能力。使高校师生能够适应数据化的研究方式,可以实现科学和社会的创新发展。数据可视化是处理研究数据的必要程序,而数据可视化工具的使用也应当是现代高校师生在研究工作中的必备技能,因此高校图书馆应当在信息素质教育中推动数据可视化教育。高校图书馆应正确认识自身研究人员的特点和数据利用特色,利用图书馆的有利条件,积极探索如何提高数据可视化的教育质量,为培养高校师生的数据意识做出贡献。
参考文献:
[1] 焦皎.大数据时代高校图书馆数据素养教育研究 [J].图书馆工作与研究,2020(3):81-84.
[2] 兰冰.从信息素质教育到创新素质教育:高校图书馆的功能与定位 [J].河南图书馆学刊,2020,40(4):36-38.
[3] 杜俞瑾.高校图书馆大数据素养教育模式研究 [J].图书馆学刊,2017(6):47-51.
[4] LAPOLLA F W Z. Excel for data visualization in academic health sciences libraries:a qualitative case study [J]. Journal of the Medical Library Association:JMLA,2020,108(1):67-75.
[5] 杨利军,高军.图书馆个性化服务中的大数据可视化分析与应用研究 [J].现代情报,2015,35(7):68-72.
[6] 赵斌.数据可视化在上海图书馆数据展示服务中的应用 [J].图书馆杂志,2015,34(2):23-29.
作者简介:李亚玲(1979—),女,汉族,陕西咸阳人,就职于图书馆,助理馆员,初级职称,本科,研究方向:读者教育。