高校图书馆大数据统计分析研究
2017-12-02王最王立宏刘斌
王最 王立宏 刘斌
摘要:高校数字信息化建设快速发展,图书馆数据呈爆炸性增长,对相关数据进行统计分析有助于优化图书馆管理,提高服务水平。但图书馆大数据研究过程中存在概念不统一、研究对象单一、认识不全面等问题,严重制约了图书馆现代化管理水平的提高。针对上述问题,提出应采取规范统一概念、扩大研究内容范围、采用多维度分析等措施,促进高校图书馆大数据研究科学健康快速发展。
关键词关键词:大数据;统计分析;图书馆
DOIDOI:10.11907/rjdk.171727
中图分类号:TP391
文献标识码:A文章编号文章编号:16727800(2017)011020002
0引言
大数据(Big data)是在一定时间内无法使用现有技术进行收集、运输、处理和分析的数据集合,需要新理论、新技术才能发现和挖掘出其价值的高增长率和多样化的信息资产[1](研究机构Gartner观点),它通常具有数据规模大、数据增长快、数据类型多样和价值密度低4大特征[2]。大数据的价值在于对数据进行深度分析,挖掘出其中的规律,进而运用规律服务于人们的生产生活,而不在于数据规模是否庞大。假如将大数据比作一种产业,那么这个产业能够盈利的关键之處就在于提高数据“加工能力”,通过“加工”实现“增值”。
高校图书馆大数据指高等学校在图书馆运作过程中产生的海量数据,如采访、编目、典藏、流通等环节积累和产生的数据[3]。通过对数据进行采样和统计分析,能为图书馆采访剔旧管理工作提供统计基础,为领导决策提供科学依据,优化借阅规则、深化读者服务、提高图书利用率。
1图书馆大数据研究现状
图书馆大数据统计分析在优化图书馆职能方面地位十分重要,吸引了诸多学者进行研究。熊哲夫[4]针对图书馆数据服务现状,提出基于数据运营平台对现有业务流程和服务模式进行重构,促使图书馆服务水平更加智能化,管理工作更高效;陈学文[5]采用文献分类、读者排行榜、文献借阅排行榜以及文献年借阅量等维度,对襄樊学院图书馆2008-2010年的流通数据进行了统计分析,总结出读者阅读规律和特征,有助于优化馆藏文献结构,调整文献布局,提高文献利用率,为上层领导决策提供有力支撑;袁红军[6]针对大数据环境下图书馆参考咨询服务内容和形式进行了研究分析,提出了基于大数据思维的图书馆参考咨询服务创新机制研究框架,为图书馆咨询模式的形成和咨询服务水平的提高提供了新方法和新途径;王兰英[7]提出大数据是高校图书馆的财富,也是服务创新的依据和源泉,采用大数据能掌握读者阅读需求,创新服务策略;吴玉等[8]针对大数据时代特点,提出高校要把握大数据时代机遇,通过对图书馆产生的海量数据进行统计,分析读者预约情况,评估已有文献结构是否合理,从而促进图书馆采访水平的提升。
图书馆大数据在分析读者阅读喜好、揭示阅读规律、统计热门书籍、分析图书利用率和借阅量等方面具有举足轻重的地位,为图书馆图书采购行为、服务策略、管理和服务水平、数据图书馆建设、用户信息化服务和个性化服务等提供科学依据。作为图书馆大数据的关键问题和核心问题,图书馆大数据统计分析在提升图书馆应用和服务水平方面有着至关重要的作用。
2存在的问题
伴随着图书馆信息化和图书馆资源数字化进程的加快,图书馆管理系统每天都会产生庞杂的表单信息。
通过大数据统计分析图书利用率、读者排行榜、图书借阅率等情况,可以客观反映读者的借阅倾向、馆藏资源质量等问题,为图书馆资源建设及设备合理配置提供重要依据。笔者2017年3月21日登陆CNKI数据库,用“大数据”、“统计分析”及“图书馆”为关键词进行检索,得到结果为14篇,可见国内在这方面的研究甚少,还处于起步阶段。
目前关于图书馆大数据统计分析的研究主要集中在以下3个方面:①使用文献借阅率指标预测读者阅读需求和阅读倾向;②采用文献利用率统计分析馆藏文献和图书布局结构是否合理;③基于借阅量、入馆率等统计数据揭示借阅量不足等问题,并提出相应解决措施。
图书馆大数据统计分析研究问题主要表现在以下几个方面:
(1)概念不统一。对 “文献利用率”概念定义较少,只有河北联合大学在《基于文献利用率的馆藏分析》中对其进行了定义和说明[9]。关于文献利用率,同样的普通高校,同样用中图法分类统计出来的文献利用率差别很大。比如:山东农业大学2010~2012三年平均利用率为38.96%,塔里木大学的综合利用率为12.9%,而伊犁师范学院统计的利用率则超过了100%[10]。之所以会出现这种情况,是由于该作者将文献利用率概念与其它概念混淆。
(2)研究对象单一。图书馆大数据统计分析中值得研究的数据较多,比如:借阅人次统计、文献外借周期统计、图书借还周转统计、读者借阅排行统计、图书预约排行统计等。但目前关于这方面的研究都集中在文献利用率、借阅量这两个统计指标上,对于图书馆其它有价值的数据研究几乎没有涉及,而这些没有涵盖到的图书馆大数据,往往能够揭示出高校图书馆的运行规律。
(3)认识不全面。馆藏结构包括馆藏规模结构、馆藏时间结构、种册及经费比例结构、馆藏学科结构、馆藏等级结构、馆藏语种结构、文献类型结构(图书、期刊、专利文献、科技报纸、学位论文等)、书刊比例结构、读者知识结构(文化程度、研究范围等)。从馆藏结构所包含的内容来看,它受多种因素影响。因此,研究如何优化馆藏结构是较复杂的问题,应从多维度进行分析研究,但现有的研究方法仅仅只是通过分析文献利用率来推测馆藏结构是否合理,可能走入以偏概全的误区。
3对策措施
为保证高校图书馆能够有效利用大数据进行统计分析,优化图书馆管理职能、提高服务水平,针对以上问题,笔者提出以下措施:
(1)规范统一概念。比如:文献利用率的计算方法是:在指定时间段内,某馆藏地的文献借阅册次或种次/本馆或全馆指定时间段入藏的文献总册数或种数(同一册书或刊被借阅多次,仍记为一册),所以文献利用率不可能超过100%。而文献借阅率的计算方法是图书借阅次数与其复本数之比。通过比较两者计算方法可以看出,文献利用率是针对某类图书的借阅情况,而文献借阅率是针对某册图书的借阅情况。endprint
(2)扩大研究范围。目前,图书馆数据的研究基本集中在文献利用率、借阅量上,而图书馆值得研究的数据非常多。比如:采用文献预约情况统计分析可知哪些图书最炙手可热;借阅外界周期统计可分析当前图书的借阅规则是否合理,是否符合读者需求;图书借阅排行榜可以得出哪些图书或哪类图书最受欢迎等等。所以应该扩大研究数据范围,而不应只限定在某一个或两个数据特征上。通过全面分析,有助于了解、掌握图书馆运行现状和规律,进而对图书馆馆藏结构进行优化,合理安排业务流程。
(3)针对特定问题,进行多维度分析。在研究比較复杂的问题时,不应仅分析一两个因素就得出结论,应该全面分析得出有效结论。比如:前文提到的馆藏结构受馆藏规模结构、馆藏时间结构、种册比例及结构、经费比例结构、馆藏学科结构、馆藏等级结构、馆藏语种结构等方面的影响,应从多维度进行深入分析研究,提出一种综合或加权的评价标准,才能出客观规律,进而采取有效的解决方案。
4结语
大数据时代给图书馆管理和服务带来新的发展机遇,图书馆界应正确认识大数据,充分挖掘大数据的价值,利用大数据分析结果,有效预测图书馆事业发展过程中的新变化和新趋势,科学预测和判断读者需求,为图书馆的科学管理提供依据,最大限度地满足读者需求。
参考文献参考文献:
[1]苏明伟.图书馆大数据体系构建的探讨[J].科技创新与应用,2015(21):8788.
[2]张宏.我国高校图书馆大数据研究现状分析[J].图书馆工作与研究,2015(5):4650.
[3]蒲虹颖,闫智.论大数据时代以及给图书馆带来的挑战[J].吉林广播电视大学学报,2016(8):124128.
[4]熊哲夫.浅谈图书馆大数据的服务模式创新[J].电脑知识与技术,2016(6):1112.
[5]陈学文.高校图书馆流通数据的统计分析[J].科教文化,2012(6):166167.
[6]袁红军.大数据时代下图书馆参考咨询服务创新机制探究[J].图书馆工作与研究,2017(1):1619.
[7]王兰英.高校图书馆大数据时代数据建设及功能转型探析[J].图书馆界,2014(1):6163.
[8]吴玉,张作来,苗永菊.大数据时代高校图书馆面向学科建设的中文图书采访机制[J].中国冶金教育,2015(6):8185.
[9]赵鸿雁,冯鑫,李秀凤,等.基于文献利用率统计的馆藏分析——以河北联合大学主校区图书馆为例[J].农业网络信息,2014(2):7779.
[10]祁瑞.我院图书馆中文图书流通数据统计分析及提高文献利用率的措施[J].伊犁师范学院学报:社会科学版,2010(3):137140.
责任编辑(责任编辑:杜能钢)endprint