大数据技术应用于高校图书馆个性化服务的探讨
2018-06-05张冬梅
摘 要:大数据时代,数据无处不在,大数据技术可挖掘数据中蕴藏的价值,随着大数据思维的不断渗透,如何促使图书馆更健康的发展,必须要学会应用大数据,将大数据技术融入到图书馆工作、服务中去。
关键词:大数据技术 高校图书馆 个性化服务
中图分类号:G250 文献标识码:A 文章编号:1672-3791(2018)01(b)-0254-02
移动设备、RFID、无线传感器时时刻刻都在产生数据[1],并以每年50%的速度急剧增长,要处理的数据信息量巨大,传统的技术手段已无法满足大数据时代业务需求和市场竞争压力对数据处理的实时性、有效性均提出的更高要求。因此,大数据技术的概念被提出,并迅速成为研究的热点,引起了普遍的关注。
1 大数据概述
早在1990年,数据仓库之父Bill Inmon就开始关注Big Data[2];2008年9月《Nature》杂志发表“Big Data: Science in the petabyte era”,大数据一词正式被提出;2012年3月,美国启动“big data research anddevelopment initiative(大数据研究和发展计划)”;2012年7月,日本推出“新ICT战略研究计划”;2015年8月19日,我国通过了《关于促进大数据发展的行动纲要》。大数据至今尚无确切、统一的定义。人们主要是用它来描述和形容信息爆炸时代产生的海量数据。如今,大数据一词越来越多地被提及,主要指利用新的技术和处理模式解决具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息。
大数据技术已广泛应用于电信、金融、教育、医疗、电子商务甚至政府决策等领域。近几年,图书馆人也渐渐开始探索大数据技术在图书馆方面的应用,作为全新技术(信息技术)架构起来的数字图书馆,与传统图书馆相比,其功能、职能已得到极大的拓展,但随着大数据技术对数字图书馆的不断渗透,如何促使数字图书馆更健康的发展,需理解大数据,适应大数据,学会应用大数据,将大数据技术融入到数字图书馆的应用中去[3]。
2 革新高校图书馆信息服务的理念和思维
随着大数据时代的来临,高校图书馆信息服务不再是靠理念和经验来传承,而是用数据说话,大数据充斥在图书馆的每一个角落,诸如读者每一次图书、期刊的借还,图书馆网站的每一次访问记录等都可以转化为数据。大数据比起传统的数字具有深刻的含义和价值。如读者与图书的关联,图书与图书的关联等。通过对用户的学科、偏好、使用习惯等数据信息特征的分析而主动向用户提供可能需要的信息和服务。
3 大数据技术在高校图书馆个性化服务中的应用
高校图书馆要实现个性化服务,就必须动态地组织和呈现与用户当前信息需求最相关的信息内容,即通过了解用户的访问模式,自动地改进站点信息的组织和显示。下面通过大数据技术的流程,来描述大数据技术在高校图书馆个性化服务中的应用。
3.1 确定目标
通过在图书馆已有的信息服务平台及服务模式的基础上,整合代表高校师生对信息需求和特点的所有数据的相关记录,实时感知用户变化着的信息需求,进而针对用户的真实信息情境开展有针对性的个性化信息服务。
3.2 大数据的采集
大数据采集必须要从多维度提取数据来源来接收发自客户端(Web、App或者传感器形式等)的数据,包括从外部互联网(直接装载入爬虫引擎)和图书馆内部(评估数据采集和对接方式);除了传统的结构化数据资源(电子图书、期刊、论文数据库等)外,更加注重使用现代技术手段获取用户使用图书馆的过程中的半结构化及非结构化的数据信息(智能设备数据、物联网数据、互联网数据等)。
3.3 大数据的导入/预处理
原始数据大体上都是分散的、不完整、不一致的“脏”数据,无法直接进行有效的分析,为了提高数据分析的质量必须要进行大数据的导入/预处理等前期工作。数据的导入是将数据导入到一个集中的大型分布式数据库或者存储集;数据预处理有多种方法:数据清理、数据变换、数据集成、数据归约等。
3.4 大数据的统计/分析
统计/分析主要利用分布式数据库或者分布式计算集群来对存储于其内的海量数据进行普通的分析和分类汇总等。统计/分析的方法包括假设检验、差异分析、相关分析、聚类分析等等。大数据分析性能的好坏,与问题的性质、数据集的特性包括数据规模、数据特征等都有关系。
3.5 大数据的挖掘
数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中揭示出隐含在其中的先前未知的并有潜在价值的信息和知识的过程。挖掘的任务主要是分类、预测、关联分析、聚类分析等;挖掘的对象有关系数据库、面向对象数据库、多媒体数据库、数据仓库等。数据挖掘的方法有很多种,包括机器学习方法、统计方法、神经网络方法和数据库方法等。
3.6 结果展现
大数据处理数据分析的结果是直接反馈给用户的,因此要以可读或可见的形式展现。可视化技术是大数据产业链里的最后一环,是实现大数据从概念到实际应用中重要的一步。须借助计算机图形学技术,通过图形化手段,清晰有效地传达与沟通信息。数据图像化可以让数据自己说话,让用户直观的感受到结果。
3.7 结果解释与验证
根据设定的目标,最终的结果将为实现个性化服务提供参考性决策,例如,图书馆外文数据库使用率,95%以上是科研工作者和教师使用,而学生的使用率不足5%,这样就可以将外文数据库相关信息传递给使用率高的相关用户;学生更多是进行微博或留言等形式咨询,教师和科研工作者更多选择的是电话咨询,这样可以根据用户习惯进行参考咨询建设。最后,要通过跟踪了解,用户信息反馈,调查问卷等实践活动对结果的真实性、可用性进行验证。
4 结语
社会已迈入“大数据、互联网+、新媒体”时代,人类的发展进步已离不开信息的支撑,未来世界的竞争就是信息的竞争,在此环境背景下,世界各国的智库建设如火如荼,高校智库发展一片繁荣,已成为智库建设体系的一支队伍,高校图书馆凭借自身优势,也正在积极响应并参与智库的建设与发展[4],开展个性化服务是高校图书馆满足當下信息需求的必然选择,也是其自身服务方式的变革与转型,大数据技术能够将隐藏于海量数据中的信息和知识挖掘出来,能为高校图书馆实现个性化服务提供不可或缺的技术支撑。其中,尽管目前在我国,大数据重点应用于商业智能、政府决策、公共服务等几大领域。相信随着研究的深入,大数据技术也必然会对未来高校图书馆的建设和发展带来积极的影响。
参考文献
[1] 樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-71.
[2] 李信,李旭晖,陆伟,等.大数据驱动下的图书情报学科热点领域挖掘——面向WOS题录数据的实证视角[J].图书馆论坛,2017,37(4):49-57.
[3] 夏秀双.大数据环境下高校图书馆个性化信息服务研究[D].曲阜师范大学,2015.
[4] 张冬梅,乔红丽,肖永双.高校图书馆在智库建设中的作用[J].中华医学图书情报杂志,2016,25(10):59-61,75.