大数据时代高校图书馆资源建设优化探索
2017-12-28梁逶
摘 要:本文对大数据时代高校图书馆的用户行为进行分析,并对图书馆资源建设的优化进行了初步的探索。
关键词:大数据时代;用户行为分析;资源建设优化
1 大数据时代的特征及处理分析方法
大数据(Big Date)又称为巨量资料,指需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。“大数据”概念最早由维克托·迈尔·金恩伯格和肯尼斯·库克耶在编写《大数据时代》中提出,指不用随机分析法(抽样调查)的捷径,而是采用所有数据进行分析处理。大数据有5V特点,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。大数据技术就是基于分析处理(移动)互联网、信息领域日常运作中累积下来的海量数字信息资料,来发现和形成新的服务形式的技术。
大数据所处理的数据不仅仅是规模大,而且处理的数据不止是关系型数据。大数据处理的数据往往是半结构化数据和非结构化数据。大数据所需处理的信息是非常广泛的,包括个人大数据(个人使用SNS网站或软件产生的信息等)、科学大数据(科研数据、实验数据、研究报告等)、业务流程大数据(各个机构在正常运作中业务流程产生的数据)、企业大数据(企业文化、人员组成、财务状况等)和社会大数据(社会宏观环境的数据)等内容。除此之外,最重要的是对大数据进行分析处理,只有通过分析才能获取很多智能的,深入的,有价值的信息。那么越来越多的应用涉及到大数据,而这些大数据的属性,包括数量,速度,多样性等等都是呈现了大数据不断增长的复杂性,所以大数据的分析方法在大数据领域就显得尤为重要。大数据分析处理的方法有:
采集:是指利用多个数据库来接收发自客户端(Web、App或者传感器形式等)的数据,并且用户可以通过这些数据库来进行简单的查询和处理工作。
导入/预处理:虽然采集端本身会有很多数据库,但是如果要对这些海量数据进行有效的分析,还是应该将这些来自前端的数据导入到一个集中的大型分布式数据库,或者分布式存储集群,并且可以在导入基础上做一些简单的清洗和预处理工作。
统计/分析:主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等,以满足大多数常见的分析需求。
挖掘:与前面统计和分析过程不同的是,数据挖掘一般没有什么预先设定好的主题,主要是在现有数据上面进行基于各种算法的计算,从而起到预测(Predict)的效果,从而实现一些高级别数据分析的需求。
大数据时代,“各类型数据急剧增长,正朝着海量数据方向发展,高校图书馆面临着数字资源长期保存、资源整合、信息安全以及服务创新等多方面的挑战。随着读者服务扩展至计算机、数字电视、手机、手持阅读器、平板电脑、电子触摸屏等多种服务终端,服务量的不断增加,各业务系统每天都会产生大量的日志数据,其中包含了大量的用户行为信息,进行数字资源整合必须结合大数据特点和资源现状,以用户需求为导向,博采众长,突出特色,分阶段、有计划的实施。图书馆工作要顺应大数据时代的发展,努力创新信息服务模式,开放网络服务,不仅要关注师生的需求信息,并准确及时地提供相应的服务,还要分析挖掘相关的大数据,找出他们的潜在需求信息,进行个性化信息服务。大数据时代下的高校图书馆工作应在对传统纸质文献的搜集、整理与利用的基础上,加强与开发大数据技术在图书馆工作中的应用,整合各种电子资源、文献数据库等馆藏资源,跟踪并记录用户的基本信息与信息行为,挖掘数据的应用价值,为高校师生提供高质量的信息服务。总之,高校图书馆要抓住历史机遇,根据大数据的特点,充分运用大数据处理手段和技术,改变与提升高校图书馆的网络服务模式,以人为本,优化资源建设,切实提高信息服务质量,为高校的事业发展作出应有的贡献。
2 大数据环境下高校图书馆用户需求的新特点
一般而言,大数据自身的特点及其作用构成了大数据环境,而图书馆用户则会面临着受到大数据环境对文献资源获取的影响,图书馆的资源组织与用户服务需要必然要考虑大数据环境下对用户行为的作用影响,以适应用户新的需求。
1.全民社交性
大数据时代是一个知识共享、智慧共享、服务共享的时代,微博、微信、QQ等社交平台初步构成了全民社交圈,每时每刻产生大量的数据信息。为顺应这一发展趋势,高校图书馆借助这一平台,开展社交服务,将师生的讨论、需求、阅读兴趣导向与馆藏资源相结合,并在网络环境中进行创新服务,时时互动,以符合全时段服务的时代特征要求。
2.信息获取方式的多样化
大数据时代下信息资源的获取更加快捷与多样化,传统的阅读方式发生了翻天覆地的变化,读者可以借助计算机设备与现代化通信设备轻而易举地获取信息资源,对海量数据进行搜索,获取有用的数据信息。新媒体下的数字化服务,带来了阅读的便捷与信息获得的高效。
3.信息服务的交互性
大数据时代下,师生能够随时随地的获得所需的馆藏信息,而图书馆服务系统则可以通过用户的注册、用户的阅读行为、用户的学术研究方向等来获取用户的个性化信息。那么,双方的交互使得师生可以根据自己的学习习惯、科研要求定制特色资源信息服务,而图书馆则可借助现代技术为师生用户量身打造个性化服务,主动推送准确、及时的文献信息。
3 图书馆资源建设优化
1、转变管理思维
随着数字图书馆发展进程的快速推进,高校图书馆资源建设已经经历了由量变到质变的发展转型阶段,目前国内各高校图书馆的数字资源业务数据急剧增加,并已經超越了纸质业务数据。数字资源在建设、传播、存取利用方面,具有传统文献无法比拟的优势,已成为图书馆资源建设的核心内容。因此,高校图书馆应该着眼于数字资源的多样化建设,除数据库、电子图书、电子期刊、电子学位论文等传统形式外,还需要多加关注电子音乐、电子教参、数字图片、电子艺术品等数字资源的建设。此外,智能终端等的采购应用也是实现数字资源多样化建设的体现,它们基于网络、流量、人机互动的信息传播方式,让阅读行为更加多元,信息渠道更加丰富。endprint
大数据环境下,读者习惯通过网络获取信息,希望更为方便地享受服务。所以在大数据环境下,高校图书馆需应更为关注读者的个性化需求,而不应是图书馆的馆藏资源等着读者来使用。图书馆应实时动态地关注读者的需求,积极主动地解决读者潜在需求。总体而言,大数据环境下的图书馆管理思维应向敏锐抓取读者的潜在阅读需求并去满足它的方向转变。
2、适度调整各种资源的比重
一般图书馆的馆藏资源包括印刷型文献(以纸张为载体,如纸质书本)、缩微型文献(以感光材料为载体,如缩微胶片)、声像型文献(以磁性材料为载体,如唱片)、计算机阅读型文献(电子期刊、电子图书等)和网络型文献(以联机方式为读者服务)f=1。国内图书馆,特别是中小型图书馆往往注重印刷型文献的馆藏,而其他类型文献的馆藏很少。在大数据环境下,图书馆要转变这种资源建设思维,要更为重视电子资源建设。随着纸质图书价格的上涨,从经济角度考虑图书馆也应调整资源建设策略。所以高校图书馆应重视电子资源的建设,但电子资源采购经费比例则根据自身的实际情况讲行把握。
3、注重非结构化数据的建设
现在中国图书馆提供的是基于结构化数据的服务,而半结构化数据和非结构化数据的增长速度远远大于结构化数据。据统计,2012年非结构化数据占有比例在互联网达到7%,同时结构化数据和非结构化数据的年增长率分别为32%和63%。这意味着互联网世界里非结构化数据的比例将不断增大。在图书馆领域,每年结构化数据的增长是较为有限的,而与读者有关的非结构化数据却每天都在快速增长。所以高校图书馆应优化非结构化数据的收集与服务。高校图书馆应采用大数据技术,动态分析通过微信、微博、社交网络等产生的与图书馆相关的读者需求。这些需求是实时动态的,从而为读者提供匹配的读者需求。大数据环境下读者阅读特征是“3I" ;“交互式营销(Interac-tivemarketing) " ,“即刻化传播(Immediatelypropaga-tion } "与“买借同一性(Identicborrowandbuy ) "。所以大数据环境下的图书馆的资源建设过程中应注意与读者的交互性和即刻性。
4、数据资源治理的转型
高校图书馆的多样化数字资源建设,带来了海量的信息数据,各馆普遍存在着重获取轻管理、重数量轻质量、重使用轻安全的现象,因此高校图书馆界应树立数据治理的理念,对数字资源的数据进行合理的分析、优化、重新整合,确保在使用过程信息数据的高质量性、安全性和可靠性。需要不断扩大存储容量,服务器采用新存储技术和能力更强的大数据技术,转向非结构化的存储架构,构建存储系统,在软件、硬件上实现数据的系统化、信息化、标准化建设。以满足对海量数据的分析处理、挖掘等运转的要求,最大程度上实现信息资源的应有价值。
5、信息资源共享的转型
在大数据的环境下,高校图书馆对数字资源的建设绝对不能只依靠自己的力量,要结合自身用户需求以及自身学科优势进行建设,并积极开展区域性的合作,实现馆藏资源的共建共享,密切跟踪开放获取资源,联合数据商研发可靠高效的信息资源存储挖掘分析系统,来向读者提供更经济、更高效、更全面的馆藏信息资源。
大数据环境下,面对信息“快速、简单、准确”的要求,高校图书馆要全面提升服务能力。高校图书馆未来需加大资源的揭示力度,提供一站式服务,通过异构数字资源的融合、聚类和重组使资源从数据层的揭示与展现转向信息层、知识层的深度服务;利用时间轴、地域轴等知识图谱可视化展示方式将资源呈现给用户;依托融合的物联网、移动通信网以及互联网络进行传播,最终实现为用户提供电视、电脑、手机等多种终端的接收;加强用户数据分析,实现个性服务;促进业界合作建设,实现共知共享。
参考文献
[1]王咏梅.基于高校用户网络信息行为的高校图书馆信息资源建设[J].图书馆研究,2014(3)
[2]何建新.大数据时代高校图书馆的数字资源共享策略探讨[J]现代情报,2014,34(9)
[3]熊健敏.大数据时代高校图书馆资源创新服务研究[J].浙江高校图书情报工作,2014,(4)
[4]宋佳.大數据环境下图书馆资源建设与服务研究[J]图书馆学刊,2017,(5)
[5]史少凡等.基于大数据技术的高校数字图书馆资源建设研究[J].出版广角,2016,(4)
作者简介
梁逶,本科,副研究馆员,贵州职业技术学院图书馆。endprint