APP下载

数字资源利用统计分析实例研究
——以云南财经大学图书馆为例

2021-03-16刀娟娟

兰台世界 2021年1期
关键词:外文数据库利用

刀娟娟

近年来,信息技术、数字出版以及图书馆数字化和网络化迅猛发展,图书馆数字资源建设发生了巨大转变。教育部高校图工委发布的《2018 年中国高校图书馆发展报告》显示,2018 年高校图书馆馆均数字资源购置经费占文献总经费的比例已高达60.6%,远超纸本文献,且数字资源经费的均值和所占比例逐年增加[1]。由此可见,高校图书馆文献资源建设的重心已经逐步从纸本资源转向数字资源,作为数字资源管理、评估和采购决策的重要依据,数字资源利用统计分析也越来越重要[2]。本文以云南财经大学图书馆为例,对数字资源的资源状况、利用情况、利用趋势等进行实例分析,旨在加强高校图书馆数字资源的有效利用和科学建设。

一、数据获取方式与分析方法

1.数据获取方式。数字资源利用统计数据的获取方式主要包括数据库商传送、统计账号查询、本地镜像查询和分析系统获取等[3],数据库商传送的数据主要来自统计报告、日志数据、系统平台[4]。本文以云南财经大学图书馆数字资源作为研究对象,数据获取的方式主要是收集本馆数字图书馆资源建设部、网络系统部和数据库商提供的数字资源使用统计报表,以及图书馆往年数字资源使用统计报告,对其中的相关数据进行整合处理,最后得到数字资源利用情况分析的基础数据。

2.数据分析方法。从文献分析来看,数字资源利用统计的分析方法主要有数据纵向分析、数据横向分析、成本效益分析、读者行为分析、关键词分析、学科分析、用户需求分析、决策分析等。图书馆已经使用的分析方法中,纵横向分析法是使用最频繁的,有90%的分析会使用纵向分析法,75%会使用横向分析法;其次是成本效益分析法和读者行为分析法,有40%会使用成本效益分析法,有20%使用读者行为分析;最后是学科分析和关键词分析,有15%使用学科分析法,仅有5%进行过关键词分析[5]。可见,目前图书馆对数字资源利用数据的分析方法还比较单一,深度不够,主要以数字资源的纵横向比较为主,缺乏数据挖掘和深层次分析,从读者行为的角度和学科角度的数字资源利用分析较少,可以加强此方面的研究和探索。

二、数字资源利用统计分析实例

1.图书馆数字资源建设分析。经过多年的文献资源建设,云南财经大学图书馆建立了纸本文献、电子文献和网络文献“三位一体”的文献资源保障格局,形成了以经济管理类文献为主体的馆藏体系,基本满足全校师生的教学和科研需求。目前,图书馆数据库总量达72个,其中中文数据库49 个,占资源总量的62%;外文数据库18 个,占资源总量的23%;自建特色数据库5 个,占资源总量的6%;另外,有文献传递平台7 个,占资源总量的9%。数字资源的内容已覆盖了学校各个学科、专业,其类型包括电子期刊、电子图书、学位论文、会议论文、科技报告、报纸、参考资料等全文文献型数据库,事实/数据型数据库,文摘索引型数据库,专题类数据库和多媒体数据库。截至2019 年,图书馆已有中外文电子图书190.82 万种,较去年增加了6671 种,年均增长率3.60%,如图1 所示;中外文电子期刊76.51 万册,较去年增加了7%,如图2 所示。

图1 中外文电子图书累积量(万种)

图2 中外文电子期刊资源量(万册)

2.数字资源利用情况分析。由2016—2019 年数字资源使用数据纵向分析可知,2019 年全年数字资源访问量为699.18 万次,访问量新增53.75 万次,同比增长8.33%,如图3 所示;全年数字资源下载量为379.16 万篇,下载量新增109.60 万篇,同比增长40.66%,如图4所示。由数据资源访问量、下载量趋势线显示,数字资源使用量呈明显的上升趋势,数据库使用量持续上升且增幅较大。

图3 访问量线性预测趋势图

图4 下载量线性预测趋势图

3.不同类型数字资源使用差异分析。分析不同类型的数字资源使用情况,可以清楚地了解数字资源建设是否存在不足,为资源建设提供调整依据,使数字资源的体系结构更加优化。将2019 年各类型资源的使用数据分类汇总,计算所占比例,得到各类型数字资源的下载量占比图,如图5 所示。从图5 可以看出,中文数字资源具有高产出的特征,特别是中文电子期刊和中文电子图书,下载量最大,占数字资源下载量的50%以上。外文数字资源则相反,外文电子期刊和外文电子图书资源均呈现低产出的特征,下载量比中文资源较低。中外文经管类专业数据库、事实/数据型数据库下载量占比分别在5%以上,自建数据库下载量占比不到1%。

图5 各类型资源的下载量占比

4.数字资源使用量趋势分析。数字资源的分月使用数据进行统计,得到数字资源月度使用情况折线图,如图6 所示,图中的折线显示了数字资源每月使用的情况,折点代表当月使用量的多少。由图6 可知,2019 年数字资源月平均访问量为54.29 万次,比去年增加4.40万次,同比增长9%,中位值为58.02 万次;月平均下载量为31.60 万篇,比去年增加9.13 万篇,同比增长41%,中位值为33.91 万篇。数据说明我校数字资源利用率逐年增加,呈上升趋势。由折线趋势可以看出,数字资源的使用量呈周期性变化,11 月为用户访问数字资源最多的月份,12 月为数字资源下载量的最高点,3月—6 月、10 月—12 月是数字资源使用的高峰期,2 月和8 月是数字资源使用的低谷期,这与学校的时间特性相关,3 月—6 月、10 月—12 月是学生撰写开题报告、毕业论文、教师申报课题、撰写论文的主要时期,在这段时期,用户需求不断增加,数字资源使用率随之增高。而2 月和8 月是学校寒暑假放假时间,在校师生减少,用户需求也减少,数字资源使用率相对较低。

图6 数字资源月度使用统计

三、数字资源利用统计的难点

1.数据统计口径存在差异。数据收集与整理是数字资源利用统计分析过程中的重要基础,为了保证分析结果的有效性,数据要具有规范性、可信性和可比性,这就要求数据具有统一的统计口径。统计数据的获取方式有数据库商传送、统计账号查询、本地镜像查询和分析系统获取,其中,数据库商传送是目前图书馆获取数据的主要方式,然而数据库的统计标准并不一致,统计指标也不尽相同。国外数据库大多遵循COUNTER标准,国内数据库遵循WH/T47-2012 和《高校指南》的较多,数据库统计标准存在差异,不同数据库之间可获取指标存在差异,导致数据之间缺乏可比性,最终影响数字资源利用情况分析结果的有效性。此外,不同数据库间的指标内涵存在差异。例如,下载量这一指标,有的数据库指成功下载全文的数量,不包括HTML 格式等全文在线阅览;而有的数据库下载量包含各种格式及形式的全文请求量;还有的数据库指成功下载的页面数等。在数字资源利用分析中,数字资源间的分析、图书馆间的分析等,都需要进行横向比较,这就要求数据之间存在可比性,所以图书馆应积极规范各数字资源的统计口径。

2.数据来源存在局限性。随着数字资源种类和使用量的快速增长,数字资源利用统计的数据获取存在诸多问题。首先,数据来源单一,数据真实性难以判断。目前,图书馆数字资源利用数据主要来自数字资源提供商,受利益因素驱使,提供商会尽力满足使用者期望,可能会提供虚假数据,从而影响数字资源利用分析的有效性。其次,受到数据统计平台和统计标准的限制,统计数据很难确保其完整性。有的数据库只能统计访问量,不能统计下载量;有的数据库只能统计访问量、检索量,不能统计下载量;有的数据库只能统计下载量,不能统计访问量和检索量。数据缺失严重影响了数据统计和数据分析的有效性。

3.深度挖掘数据存在困难。在数据统计过程中,由于数据来源的限制,获取的数据都是比较浅显的,深层次数据不易获取,这是不利于利用情况统计分析的。随着信息技术的发展,数字环境不断变化,教学模式与学习方式也发生了改变,用户获取信息越发依靠数字资源,行为与需求的改变对数字资源建设提出了新的要求,简单的数字资源利用统计分析已经不能满足决策支持,需要对统计数据进行深度挖掘和高层次分析,特别是行为分析、需求分析等,但通过数据库商获取的简单数据不能支持图书馆进行这些分析。由以上实例可知,目前数据分析主要以纵横向分析为主,成本效益分析为辅,使用关键词分析、学科分析、行为分析和需求分析的较少,这主要受限于深层次数据挖掘存在困难。因此,图书馆要促使数据库商提供统计口径相同的数据,在完善基础数据统计功能的基础上,深入开发系统统计功能,从数字资源本身角度、从成本效益的角度、从读者行为的角度、从学科分析的角度完善各项分析功能,进一步提高系统数据分析能力和决策支持能力。

四、提高数字资源有效利用的建议

1.外文数据库利用量偏低,应加强数字资源宣传力度。根据以上数据分析可知,相对于中文数据库,外文数据库的使用量较低,这与外文数据库较低的普及率有关,图书馆应加强外文数据库的宣传力度。首先,增加外文数据库的宣传讲座。经常开展外文数据库的培训讲座,介绍数据库的收录范围、资源特点、使用功能、检索方法等,讲解不同数据库的适用范围,分析相关数据库的资源差异性,让用户更清楚地了解数据库的资源收录情况,可以更方便快捷地使用数据库,进一步提高数据库使用率。其次,强化本馆职工的信息咨询能力。图书馆应加强培养图书馆员的外文素养,增加对外文数字资源的了解,提高利用外文数字资源的能力,从而更好地为用户提供外文数字资源的信息咨询服务和信息培训。

2.数字资源利用受网络环境影响,应完善网络设施和服务环境。网络设施和环境是提升数字资源利用率的支撑和保障。第一,加强图书馆的网络基础设施建设。在图书馆范围内进行无线网络覆盖,提高网络访问速度,定期进行网络维护和检查,保证数字资源访问渠道的畅通,构建稳定、流畅和安全的数字资源利用环境。第二,重视图书馆的网页建设。图书馆网页是用户访问数字资源的重要渠道,应尽量简洁、清晰、层次分明、重点突出,让用户能清晰了解资源介绍,能方便快捷地访问数字资源,进而提高资源访问量。第三,增强数字资源远程访问的便捷性。由以上分析可知,数字资源使用量在每年的2 月和8 月是最低的,这是因为2月和8 月是学校寒暑假放假时间,师生离校不方便使用校内数字资源。图书馆应强化数字资源远程使用的便捷性,更好地满足用户对数字资源远程使用的需求,从而提高数字资源利用率。

3.数字资源整合有利于提高资源利用量,应进行深层次的数字资源整合。数字资源整合是一种数字资源优化组合的存在状态,是依据一定需要,对各相对独立的资源系统中的数据内容、功能结构及其互动关系进行类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的数字资源体系[6]。数字资源的整合程度对资源能否被有效检索、获取及使用有显著的影响,对数字资源进行有效整合可以提高数字资源的利用效率。一方面,图书馆可以结合本馆的资源特色,采用开发或者引进的方式构建数字资源整合系统。现如今数字资源品种与数量急剧增长,让读者熟悉每个数据库并进行检索需要耗费大量的时间和精力,构建数字资源整合系统可以为读者减少查找文献的时间成本,让读者更方便快捷地获取所需文献,提高检索效率,从而提高数字资源的利用率。另一方面,图书馆应积极整理和揭示网络免费学术资源。网络免费学术资源内容丰富、获取便捷,是对馆藏数字资源的有效补充和扩展,不过其质量良莠不齐,杂乱无序,图书馆需要结合学校专业特色与教学科研需求仔细筛选和整理,科学分类,定期维护,合理有效地利用网络免费学术资源,提高资源利用率。

4.数字资源建设需要不断优化,应建立有效的评估机制。随着数字环境的变化,资源供应商、资源集成与服务商、资源类型、用户行为与需求、教学模式与学习方式也随之变化,数字资源种类日益增多,价格昂贵,品质良莠不齐。图书馆的数字资源购置费是有限的,只有科学地进行数字资源建设,不断优化数字资源体系结构,利用最优组合建设数字资源,在一定的经费范围内最大化地满足用户需求,才能进一步提高数字资源利用率。为此,图书馆应建立一套完善的数字资源评估机制:一方面,对数字资源进行综合的客观评价,包括各数据库的资源量、收录情况、学科特色、资源品质、系统功能、优缺点、服务能力、与其他数据库的差异性等,了解本校专业和学科建设的情况,分析本校教学科研需求,构建符合本校专业和学科发展趋势、满足用户需求的高品质数字资源体系,提升对学校教学科研与学科建设的支撑力;另一方面,进行数字资源利用统计分析研究,分析数字资源的使用情况,构建成本效益指标,深度挖掘数据,进行高层次分析,特别是学科分析、行为分析和需求分析,撰写分析报告为数字资源建设提供决策支持。

猜你喜欢

外文数据库利用
《世界华人消化杂志》外文字符标准
利用min{a,b}的积分表示解决一类绝对值不等式
利用一半进行移多补少
Gender Differences in Expressing Gratitude
利用数的分解来思考
Roommate is necessary when far away from home
数据库
数据库
数据库
数据库