大数据环境下的高校图书馆数字资源建设探析
2020-02-25蔡和全
蔡和全
(三明学院图书馆,福建 三明 365004)
数据分析在各领域的应用由来已久,2013年由英国牛津大学网络学院互联网研究所治理与监管专业教授维克托·迈尔-舍恩伯特(Viktor Mayer-Schonberger)和《经济学人》数据编辑肯尼迪·库克耶(Kenneth Cukjer)合著的《大数据时代》一书真正将数据分析与人们的生活紧密关联起来,掀起了大数据的热潮。随着计算技术的不断进步,人们的行为分析已被各行各业所应用,大数据已不断深入人心。高校图书馆作为高校信息和知识服务的窗口,无论在资源建设、读者服务还是管理上逐渐转向以数据分析为基础的用户服务。高校图书馆的数字资源建设一直面临着资源种类繁多、数量急剧增长和经费不足的矛盾,在以往的数字资源建设的过程中,图书馆虽然听取了部分读者的意见,也做过一些调研工作,但是难免有所偏颇。大数据环境下的用户行为分析为图书馆的数字资源建设打开了新的一 扇门。
1 高校图书馆数字资源建设面临的问题
1.1 数字资源种类繁多,质量良莠不齐
数字资源建设是图书馆的基础建设,是图书馆资源建设的重要组成部分,随着信息技术的发展,数字资源的种类和数量剧增,信息获取渠道的增加,人们的阅读习惯泛在化,图书馆的数字资源体系成为图书馆文献信息资源的主要部分,目前许多大学图书馆的资源建设经费的纸电比已呈现倒挂趋势。
在《图书馆数字资源统计标准GC-FJ080149-AD010》中对数字资源和数字馆藏做了定义,数字资源是指“经过选择、组织和加工处理,以数字格式存在的各种媒介信息”,数字馆藏是指“图书馆馆藏中所有的数字资源,包括图书馆本地拥有的和获得一定期限使用权的数据库——数字文献”,并根据高校图书馆的实际情况,将数字资源划分为四种类型:电子图书(包括与图书类似的出版物)、电子期刊(包括与期刊类似的连续出版物)、二次文献数据库(包括题录、文摘、索引等)、其他数据库。各图书馆根据自身的实际情况也会把数字资源分为不同的类别,例如以学科分类、以信息的加工层次分类、以读者属性分类、以存储的介质分类等,在日益增长的数字资源中,种类不断增加,数量不断增加,呈井喷之势。在数字资源数量不断增加的同时,数字资源的质量出现了良莠不齐的现象,部分数据库只是将一些网络信息用爬虫进行搜集,简单罗列,就形成数据库给用户使用,不考虑数字资源的版权、内容的权威性和准确性、元数据的规范性等因素。
1.2 数字资源订购费用的不断上涨与图书馆经费不足的矛盾
目前,数字资源的采购经费逐年上涨,就拿外文数据库来说,在不考虑汇率波动因素的情况下,大多数外文数据库每年的涨幅在5%以上,多的甚至达到了20%。中文数据库的涨幅虽然没有外文数据库那么大,但也存在逐年上涨的现象,以中国知网为例,虽然资源总库的涨幅不大,但是在期刊的单刊订购上不断加码,单刊的种类逐年翻倍,使订购的总体经费大幅增长;还有一些数据库化整为零,原来是打包一起订购的,现在要分块采购,这些现象都大大增加了图书馆的经费负担。从高校图书馆这方面来看,学校划拨每年数字资源的预算经费增加的空间很小,特别是山区的地方高校,数字资源的订购经费少得可怜,在同样的经费下,去年可以采购10个数据库,今天只能采购8个数据库了,这种矛盾对于高校图书馆数字资源建设的长期发展是非常不利的。
1.3 图书馆数字资源采购与读者需求之间的矛盾
我国大多数985和211高校的图书馆都设有学科馆员,每个学科馆员负责一个学科的文献资源建设,就是在这样的情况下,也难以周全,令大多数读者的需求得到满足,更何况在没有学科馆员的图书馆,仅凭一两个资源采购人员,只能做简单的调研再加上个人的喜好来选择订购数字资源,往往是图书馆买来的数字资源闲置,而读者真正需要的数字资源又没有,形成了图书馆与读者之间信息不对称的现象,这种矛盾不但不能使有限的资源建设经费得到效益的最大化,也让读者对图书馆的信任度不断降低,形成恶性循环,从而导致图书馆资源利用率的不断下降。
2 大数据环境给图书馆数字资源建设带来的变革
2.1 大数据带来的思维变革
在过去,数据对于大多数人来说,它是陈旧的,静止的,就像数字资源的数据仅仅作为一种统计资料存在,诸如数字资源的数据量有多少,使用量是多少,它的作用在于对资产的统计,称其为小数据。而大数据可以从海量的原始数据中衍生出许多规律,从思维上改变人们对数据的看法,它可以是一种资产,可以是一种服务,也可以是一种新的产品,可以根据人们的不同的需求来开发其衍生品。现在,更多的人关注数据之间的关联,在许多曲线图、柱状图、饼图、气泡图等数据图中寻求事物之间的联系和发展规律,大数据以它独特的方式改变人们的认知,创造新的价值[1]。
2.2 图书馆数字资源体系的变化
高校图书馆数字资源建设是基于读者需求的基础上,建设符合本校本馆实际情况和特色的数字资源体系,具有一定的连续性和共享性。随着网络技术和信息技术的发展,手持终端的普及,信息获取的泛在化,人工智能在图书馆的应用,使图书馆的数字资源建设的理念发生了根本性的变化,新技术让图书馆的数字资源建设不再拘泥于传统数据库的建设,而是向与移动数字资源、多媒体数字资源等相结合、互补的多样化的数字资源体系发展。
2.3 提高了图书馆数字资源建设的前瞻性
大数据环境下,人们掌握的数据越来越多,也越来越杂,不再执着于数据的精确性,在乎的是数据研究之后的预测,数据分析技术提供了这种可能,通过大量原始数据的清洗和分析,可以厘清读者利用数字资源的基本规律,通过这些基本规律反过来研究读者对数字资源的好恶,从而得出数字资源建设发展的趋势,这样对数字资源建设的内容和方向就有了一个基本判断。
3 大数据环境下高校数字资源建设的模式
3.1 纸电一体化
目前,大多数图书馆越来越重视图书馆的数字资源建设,在不断地压缩纸质资源的采购经费,在此基础上减少纸质文献的复本量,以数字资源来弥补纸质资源的不足。纸电一体化是将图书资源管理系统、数字资源管理系统、资源发现系统、分析决策系统整合为一体,共享资源和数据,在资源建设的同时,对读者的借阅行为进行分析,根据分析结果不断调整资源建设方案,以达到资源建设与服务的最大化利益[2]。
据调查,图书馆的纸电一体化资源建设,在减少纸质馆藏复本的情况下,大大增加了图书的借阅量,特别是高校图书馆,大多数读者的年龄在18-25岁之间,他们的阅读习惯以数字阅读和手持阅读为主,丰富的电子书馆藏为他们增加了可选择的空间,减少了热门图书的等待时间。
3.2 移动资源平台
手持终端在高校为大多数读者所喜的信息载体,据悉,厦门大学图书馆在首次推出kindle时就被一抢而空,而且还有许多读者的预约,大学生对手持终端阅读喜欢程度可见一斑,而移动数字资源也深受读者的喜爱,在每年的资源利用统计数据中,移动数字资源的使用量和下载量高于同类型的线上平台的使用。读者在使用数字资源时不再满足于资源的获取和学习,他们更希望能够有交流和讨论的空间,目前的移动数字资源平台较为成熟的有学习通等,它们是基于数字资源的社交平台,在平台上,可以阅读,讨论、直播、分享等,还能进行个性化的阅读定制和讨论话题的创建,将阅读和分享、学习和交流融为一体,大大增加了读者的阅读体验[3]。
3.3 特色数字资源的共建共享
高校图书馆的特色数字资源是各校根据自己学校或所在地区的特色资源所建设的特色资源数据库,据不完全统计,近年来各高校自建的特色数据库不下五百个,这些数据库具有地方特色,如以红色文化为主题的“萍乡文化特色库”,以特色产业为主题的“动漫产业特色文献数据库”,以特色馆藏为主题的“集美大学水产科技数据库”等,这些特色数据库在丰富馆藏数字资源的同时为读者提供更多样化的资源。但是在数字资源的建设中,由于没有统一规划难免造成重复建设和不够规范的问题,1999年CALIS启动特色库建设项目,在历经三期的特色库项目的建设,一共入选了近三百项特色专题数据库,进行规范化的建设,但是还是有很多特色资源没有纳入CALIS的统一建设,而且大多数特色资源仅仅局限于在各自高校的校内提供访问,无法做到资源共享。特色数字资源是图书馆馆藏资源的一个重要组成部分,目前全国各高校自建的特色数字资源量较大,如果将这些资源整合起来,建设一个统一的特色资源检索平台,这样既能使建好的特色资源得到有效的利用,提高服务效益,又能有效避免由于重复建设或建设不规范而造成的资源浪费。
4 大数据背景下高校图书馆数字资源建设的对策
4.1 数字资源建设过程中数据分析带来的新问题
依据数据分析来制定数字资源建设规划有一定的科学性,在一定程度上反映了读者对数字资源的客观需求,但是也存在一定的问题,表现在以下三个方面:
4.1.1 数据的全面性和准确性
在反映数字资源状况的数据中,有两类数据是核心数据,一是数字资源的资源量,二是数字资源的使用量。这两类数据的来源通常有两种途径,一种途径是由数据商提供,另一种途径可通过服务器端的采集器进行数据采集。数字资源的资源量大多数由数据商提供,由于数字资源的资源量庞大,数据商提供的数据是否准确,无法考证;数字资源的使用量亦是如此,有些数据商夸大资源的使用量,给统计分析人员造成错觉,而通过服务器端采集的数据会由于采集的线程、采集的路径等因素导致采集的数据不够准确,无论采取哪种方式,得来的数据都存在有一定的片面性。
4.1.2 读者调研数据的真实性和完整性
在读者调研的过程中,大多使用发放问卷或访谈的形式进行调研,所调研的读者范围非常有限,不可能对所有的读者进行全面覆盖,同时,在调研过程中许多的问卷设计本身并不能完全反映读者的真实意愿,结果就造成大多数读者抱着无所谓的态度对待问卷,这样调研出来的数据的真实性和完整性存在一定的问题。
4.1.3 数字资源的畸形消费
在许多高校,不是根据实际需求来建设数字资源,而是为了应对各类的评估和检查突击式的采购数字资源,使数字资源建设失去了连续性,丧失了图书馆数字资源体系的科学性和整体性。更有部分高校图书馆根据图书馆领导或资源采购人员的喜好来采购数据库,随着图书馆领导的更换或采购人员的调整,数字资源体系面目全非。无论是哪一种现象对整个社会资源来说都是极大的浪费。
4.2 高校图书馆数字资源建设对策
针对上述问题,高校图书馆应采取相应的措施极力避免因主观或客观因素对图书馆数字资源建设带来的不利因素。第一,应合理拟定本馆数字资源建设的长期规划和短期计划,根据本校的学科建设情况,将图书馆数字资源建设与学校的学科建设紧密地结合在一起,让数字资源的建设具有可持续性和针对性,保障图书馆数字资源体系的科学性和实用性;第二,要有效建立数字资源建设的评估制度,建立较为完善的评价指标体系,组建由学科带头人或专家组成的专业的数字资源论证团队,由专业人员对所购买的数字资源进行有效的使用效益评估,对于使用情况不好的数据库进行合理地调整;第三,要制定科学的数字资源采购流程和规范,有目的、有计划、有组织地进行资源的建设,并且邀请读者代表共同参与数字资源的建设,以提高数字资源建设的针对性和符合度;第四,应充分利用数字资源共享平台,将数字资源共享平台与本馆的数字资源建设有机地结合起来,争取图书馆数字资源体系的效益最大化;第五,建立科学的数据采集系统,增加读者需求调研的途径和方法,广泛收集读者对数字资源需求的意见和建议,切合读者需求以最大限度地确保数据的真实性、完整性和准确性[4]。
5 结束语
数字资源建设是国家信息化建设的重要组成部分,有力地推动了国家的信息化发展,高校图书馆的数字资源建设是一项长期的工作,有一定的连续性和发展性。在大数据的环境背景下,要求我们重新审视数字资源建设的重要性和复杂性,在建设的过程中不断进行改革和创新,更好地发挥大数据的力量,使图书馆的数字资源建设更具有系统性、合理性和针对性,最大程度满足教学科研需求。