利用SPSS在图书馆统计分析工作中的探索
2018-02-27兰鹰肖诗伯杨玉梅
兰鹰 肖诗伯 杨玉梅
摘要:通过挖掘图书馆集成管理系统中2013-2017年度不同类型读者所产生的流通数据为基础,利用SPSS软件对文献借阅量、借阅时间、分类利用比例进行分析统计,总结出读者对馆藏资源的利用行为和特点,为图书馆的管理工作的改进提供可靠的数据支持。
关键词:数据挖掘;SPSS;数据分析;流通数据;图书馆
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2018)35-0001-02
高校图书馆作为学校的文献情报中心,随着科学技术不断进步,图书馆的功能也丰富起来,但是伴随着各类形式多样信息服务、知识服务的开展,为学校的教学与科研提供文献资源保障还是图书馆最为基础的功能,借阅服务也是这项功能的具体表现。对于一个高校的图书馆而言, 衡量馆藏资源配备是否合理、图书馆藏书质量高低、读者对于藏书利用效率等, 读者借阅量应该是最为直接、最为客观的标准。[1]统计分析读者借阅量是图书馆的统计工作中一个非常重要的项目,由于历年来围绕读者所产生的流通数据量非常大,需要分析的项目也非常繁杂,但是也是最能直观体现读者与图书馆资源相联系的数据,要更为科学的完成这些工作单靠手工来统计难免会出现疏漏,这就需要借助SPSS软件的强大能力来支撑。
1 SPSS软件简介
1.1 SPSS软件的现状
SPSS(Statistical Product and Service Solutions)“统计产品与服务解决方案”软件,为IBM公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称。SPSS软件的应用领域包括通信、医疗、教育等等,SPSS作为一款数据统计的专业性软件,目前越来越多的高校开始运用该软件进行各类数据的分析,随着不断地更新和改进,SPSS统计软件数据录入、数据管理、统计分析、资料编辑、报表制作、图形绘制也变得愈发容易操作。[2]SPSS和SAS、BMDP軟件并称为世界上最有影响力的三大统计软件。
1.2 SPSS软件的特点
SPSS是世界上最早采用图形菜单驱动界面的统计软件,它最突出的特点就是操作界面极为友好,输出结果直观漂亮。SPSS使用类似Excel电子表格的方式输入与管理数据,数据接口较为丰富,能方便地从其他数据源中读入数据。图书馆数据分析工作人员,只要熟练掌握电脑的操作技巧,了解统计分析的基本原理,就可以使用SPSS来统计分析为数据,其统计过程包括了常用的、较为成熟的统计过程,完全可以满足图书馆的工作需要。
SPSS它集成了数据录入、整理、分析功能为一体。基本功能包括数据管理、统计分析、图表分析、输出管理等等。SPSS统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类,每类中又分好几个统计过程,为用户不同的需求提供不同的分析方法。
2 借阅量数据来源与方法
SPSS软件能根据统计分析需求,可以针对性的分析图书馆的馆藏、读者行为、借阅等等方面数据,本文以川北医学院图书馆2013-2017年流通借阅量数据为分析研究对象,通过数据清洗,排除干扰和错误数据,对数据按照分析需求进行分组,使用SPSS软件通过不同的统计视角来分析读者的借阅量情况,分析师生的借阅特点与偏好,为图书馆的图书工作改进和调整提供参考数据,以提高图书馆资源利用率。
3 借阅量数据统计与分析
3.1 年度借阅量统计分析
年借阅量可以反映读者在一年内到馆的借书情况,通过对图书年借阅量的统计,不但能够帮助图书馆制定馆藏发展规划,还可以为读者做出客观正确的判断以为其借阅提供依据。[3]本次收集整理的数据为2013-2017年流通借阅量数据,共计409211条记录。对2013至2017年度借阅量进行了分年度统计,结果为:2013年36597册;2014年88936册;2015年81411册;2016年79333册;2017年62934册,从数据中可以分析发现借阅量呈现逐年下降的情况,纸本图书借阅量与到馆利用馆藏资源的读者人数有一定关联性, 但最为主要原因是移动阅读方式的推广,电子资源的利用更为方便、快捷, 因此导致近几年纸质图书在图书馆的利用率逐年下降。
3.2 借阅量学科分布统计分析
通过SPSS将所有借阅数据导入软件,对数据变量进行调整、设置,通过菜单选择:分析—描述统计—频率,按照《中国图书馆分类法》中所列举的22个基本大类对数据进行频率统计。通过数据分析,可以看出2013-2017年占借阅总量排名前三的类分别是I类占42.14%、R类占25.5%、H类占12.72%,前三类占借阅总量的80.36%;后续排位是B类4.88%、K类4.54%、T类3.10%、Q类1.34%、C类1.26%、D类1.16%;其余类别均低于1%;借阅量高于4%的前五类占借阅总量的89.78%。
为了进一步核实借阅总量按中图分类法统计百分占比是否准确和具有一定普遍性,单独将2017年借阅量进行统计分析,排名前三的类分别是I类占44.11%、R类占26.05%、H类占10.75%, 前三类占借阅总量的80.91%;K类占4.46%;B类占4.41%借阅量高于4%的前五类占借阅总量的89.78%。通过对比分析,发现排名前五的K类和B类排序有个变化,但是各类占比数值基本趋于一致,巧合的是前五类占比之和都为89.78%。
从借阅量学科分布来看,读者的阅读偏好比较符合学校的专业设置,借阅量主要集中在文学和医药、卫生方面,说明本校读者在关注专业知识的同时,也注重通过阅读文学、人文方面的读物,提升自身素质,培养人文情怀。同时我们需要注意到借阅量不到1%的学科,如艺术、经济、军事等与语言、文字和工业技术这两类的借阅量(英语等级考试和计算机等级考试资料为主)形成鲜明的对比,这说明读者阅读是缺乏广度且带有功利性的,为了专业知识和通过等级考试而缺失了解跨专业领域的时间和勇气。
3.3 借阅量时间分布统计分析
通过图1所示折线可以发现,本校读者借阅量月分布情况比较规律,由于每年2月和8月为寒暑假期间,到馆读者非常少,借阅量也相应很低;3月和9月为开学之初,考试和课程安排较为轻松,读者有了充足的阅读时间,借阅量也明显增加,随着时间推移考试季临近,借阅量又会呈现逐月下降的趋势。
通过分析每天借阅量与实践的关系可以发现,读者借阅行为产生的时间主要集中在上午10~11点和下午4~6点;晚上8点会出现一个最为明显的波峰,借阅量也是最多的;从借阅时间节点来看,10点、16点、18点借阅量基本一致,11点和17点为上午和下午的波峰,数据也相差无几。透过数据能够也反映出读者能够充分利用业余时间进行阅读与学习,书库管理者也可以避开读者借阅高峰时间段对库房进行更好的整理。
3.4 热门文献资源借阅人次排行
通过SPSS分析借阅数据中的“题名”字段中出现的频率,通过数据统计,借阅人数靠前的图书文献都集中在医学专业书籍上,例如:《人体解剖彩色图片》有2521条外借数据;《医学免疫学》有564条外借数据;《病理学》《实用组织学彩色图片》《组织学与胚胎学彩色图谱》《组织学与胚胎学笔记》《外科学笔记》《生物化学笔记》《人体解剖图谱》《医学免疫学笔记》分别排在3-10位。通过数据了解医学院校的读者应该更加专注于专业知识的获取。
4 小结
由于篇幅有限,本文只对十年来的流通数据进行了部分方面的统计分析,从几个特定的视角对读者的借阅行为进行了简单描述,在一定程度上分析了本校读者的需求现状,但还是存在一定的局限性。例如,还未按照教职工、研究生、本科生的读者身份进行深入的分析与文献之间的联系,尚未对读者自行购置的文献资料进行分析,也未对读者阅读的电子文献分析,但对部分读者而言,电子资源已成为利用图书馆的首要资源[5]。总之, 高校图书馆必须紧紧围绕学校的教学和科研来深入服务,通过对借阅量数据的统计与分析,对了解读者的文献需求和掌握读者借阅行为特征将起到一定的作用。
5 结束语
在大数据环境下,图书馆所掌握的资源数据和读者数据将成为一座待开发的宝藏,对于图书馆数据进行有效的分析和利用,深度挖掘读者行为,揭示资源、读者和数据背后隐藏的规律和联系,将能为图书馆提升服务质量提供帮助,也可为图书馆业务管理、资源建设和学科服务提供参考支撑。本文利用SPSS软件对读者的节约量情况进行分析,只运用了SPSS软件中一下部分功能,只要熟练掌握软件操作方法和统计分析知识,图书馆的各项统计工作中都将有得到应用的空间。因而,高校图书馆应该结合自身的实践在SPSS功能的基础上对统计软件进行开发和尝试,充分发挥其在统计工作中的检查、咨询和指导职能,从而发挥SPSS软件在图书馆工作中的作用[6]。
参考文献:
[1] 魏萍.高校图书馆借阅管理统计研究与实例分析[J].西安财经学院学报,2014,27(4):122-127.
[2] 荆典,于涛.用统计软件SPSS对学生成绩进行分析[J].中國教育技术装备,2016(18):38-40.
[3] 黄天丽.基于流通统计分析下的藏书质量监控管理研究——以兰州理工大学图书馆为例[J].西安财经学院学报,2017,33(22):84-86+77.
[4] 刘玉婷,吕文娟,龚佳剑.首都医科大学图书馆流通借阅数据分析及服务对策研究[J].中国中医药图书情报杂志,2017,41(1):40-46.
[5] 董崇.电子资源已成为高校读者利用图书馆的首要资源——图书馆电子资源利用情况调查及统计分析[J].信息系统工程,2009(12):91-93.
[6] 魏萍.SPSS在高校图书馆统计工作中的实证探析[J].当代图书馆,2017(1):31-34.
[通联编辑:代影]