APP下载

基于大数据舆情分析的图书馆信息增值服务

2016-07-11陈显龙

中国管理信息化 2016年12期
关键词:增值大数据图书馆

陈显龙

(东莞理工学院城市学院,广东 东莞 523419)



基于大数据舆情分析的图书馆信息增值服务

陈显龙

(东莞理工学院城市学院,广东 东莞 523419)

[摘 要]目前大数据技术在各行各业得到了广泛的应用,而图书馆信息服务仍处于传统的模式中,本文把大数据舆情分析与图书馆信息服务结合起来进行了浅析,首先介绍了大数据与舆情分析的概念,其次简述了图书馆信息增值服务的内涵,最后就如何实现大数据舆情分析下的图书馆信息增值服务进行了探讨。本文对图书馆从业人员提升业务水平有一定的积极意义。

[关键词]大数据;舆情分析;图书馆;增值

0 引 言

近两年来,大数据已经成为全民关注的一个名词,各行各业纷纷投身大数据的热潮,政府部门也相继启动各种大数据项目。而当前现有数据中心技术不能完全满足大数据的需求,这就有可能会引发IT界的技术革新、架构重构等问题。目前舆情服务正在进行行业规范和整合,基于大数据的舆情分析,利用大数据技术可以精准地掌握各项事态的发展,从而有利于得出正确结论,作出精准预测。 这样的形势为图书馆信息服务的发展带来了机遇和挑战,将基于大数据的舆情分析与传统的图书馆信息服务相结合,可以挖掘用户潜在的知识需求,拓展图书馆信息服务的渠道,衍生出新的信息增值服务,达到图书馆资源、服务、用户三者之间的有机结合,推动行业的发展。

1 大数据与舆情分析

1.1大数据的概念

大数据这一概念是在2011年5月首次提出的,但是到目前为止人们对于大数据的概念、内涵等有着多种的定义与理解,并未形成一个统一的规范。通过比较不同的概念会发现,尽管各种定义在对大数据的内涵的具体表达中会有所不同,但普遍存在这样一个共识:大数据是指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。下面笔者从大数据的内容和应用上谈一下自己的认识。

首先,大数据从内容上包含了三种类型的数据,即结构化、半结构化与非结构化数据。结构化数据是指能够用统一的逻辑结构表示的数据,如数字、符号等,反之则为非结构化数据,如邮件、视频、论坛帖子等。而半结构化的数据与上面两种不同,它虽然是结构化的数据,但结构变化很大,无法在数据库中简单地建一个表与之对应,如智能设备、社交网站等会产生大量的半结构化与非结构化数据。在当前这样一个网络社会中,人们所面对的信息更多的半结构化与非结构化的数据,对这些数据的分析是传统数据挖掘工具的短板,也正是基于大数据技术的新型企业的优势。

其次,从大数据的应用上来说,大数据技术并不是静态地存储与展示数据,而是动态地对数据进行高速、实时分析。如在对图书馆用户需求分析的过程中,可以结合用户往日的阅读行为、查询记录等,运用大数据技术实时预测出用户的需求。在实际应用中,大数据的应用往往与云计算相结合,云计算所特有的高速、分布式处理技术、云存储技术等是大数据技术对海量数据进行挖掘的基础和依托。

1.2舆情分析

舆情分析就是对某个问题相关的舆情进行深层次的分析研究,最终得到相关结论的过程。举例来说就是,当一件事情发生后,人们通过网络、电视、报刊等途径了解事情发生的详情,随之对其进行抨击,或同情、或感性、或理性的评论,对这些评论进行分析、汇总,识别其中的关键信息,作出有利于事态发展的正确决定。舆情的收集渠道有多种,如报刊、门户网站、论坛、微博等。

传统舆情分析,依赖随机采样,采用模式识别、自然语言处理等技术,来得出相关结论,作出态势预测,具有单一化、静态化的缺点。而基于大数据的舆情分析,在传统的基础上,采集更多的相关数据,对所有的舆情信息进行量化,可以得出超出人类经验的精准化结果。如中国足球队在时隔15年后再次进入12强的机率,传统分析为32.7%,而结合了专业数据、队员信息、天气情况等各项指标的大数据分析,结果则为86.2%。

2 图书馆信息增值服务

图书馆信息服务实质上就是实现信息的传播、交流、增值的过程。图书馆为用户提供了纸制的、网络的文字、图像、视频等信息,用户对这些信息筛选、整理,使这些信息成为自己需要的有用信息,同时对这些信息分析、研究、判断,使其效用与价值得到更大的发挥,从而实现信息的增值。

具体来说,信息的增值主要包括三个方面:一是量的增值;二是质的增值;三是信息的使用价值。在实际工作中,对大量同类微观信息的分析、加工,就可以获得潜在的宏观信息,通过量的积累,来产生质的变化,微观信息就会得到增值。同时在信息的增值过程中,随着信息反映出来的新问题,人们需要及时作出新决策,在新的经营决策中实现信息价值的再利用,也就是信息的二次增值。

对于图书馆的信息增值服务,图书馆工作人员要在传统图书馆对信息产品简单的供给和接受模式基础上,开展更多个性化、差异化的服务。图书馆拥有海量的纸质资源与数字资源,如何将这些资源共享,利用基于大数据的舆情分析来增强信息的价值和创造力,实现图书馆资源信息的增值?下面笔者从3个方面来进行简要探讨。

3 基于大数据的图书馆信息增值服务的实现

3.1树立“大数据思维”,拓展用户主体

大数据时代带给人们的不仅是先进的技术与工具,更重要的是一种新的思维模式——大数据思维。大数据关注的从来都不是局部、单线的的信息来源,而是尽可能多地拓展收集信息源,这样最后得到的结论才能更精准。同样,基于大数据的理念,图书馆应将服务用户延伸到社会的各个领域,如政府、企业等,将服务内容延伸到舆情分析、预警,决策制定等事件处理的各个环节。

3.2打造信息资源舆情监测分析平台,实现数据价值最大化

图书馆工作人员应将大数库技术与云计算技术结合,为政府和企业打造共享数据平台,从而实现数据的互联互通以及对舆情的实时监测分析。这样就能够解决各系统之间的“孤岛”状态,从数据收集、挖掘到数据提取、报表等,将各个系统数据、技术共享,实现信息数据价值的最大化。

下面笔者简单描述一下数据平台的具体实现方式。数据平台利用物理服务器,搭建若干虚拟机,并基于NAS、IP SAN、FCS SAN等技术,架构虚拟化存储体系。同时在此云平台的基础上,架构舆情监测分析系统。如图1所示,平台底层为基础资源服务(IaaS),主要包括虚拟存储、虚拟服务器等;中间层为平台即服务(PaaS),主要为平台提供大数据服务及相应的技术组件完成舆情监测分析的功能,如网页爬虫组件、舆情分析组件、日志服务等;最上层为软件即服务(SaaS),为用户提供舆情应用服务。

图1 信息舆情监测分析平台

3.3以用户为导向,提升深层服务能力

图书馆应当利用用户阅读的行为偏好,对用户进行行为分析。在大数据时代,用户行为数据主要由5个活动步骤产生:阅读服务需求、阅读活动信息采集、阅读模式选择、阅读活动开展以及用户阅读反馈。图书馆应根据用户阅读活动的生命周期,对行为数据进行采集、分析、决策等。同时在采集数据时应尽量减少采集的盲点,提高采集数据的精桷性、及时性。通过对用户行为数据的舆情分析,就可以勾勒出每一个用户的“数字剪影”,洞悉用户的需求,从而为用户提供个性化、深层化的服务。

当前智能手机已经成为大量用户的必备工具,所以图书馆还应在手机APP端作好文章,拓展采集数据的广度和深度,增强数据的可用性。

4 结 语

笔者预见,随着大数据应用的深入,图书馆必将迎来新的发展。当然,图书馆信息服务的发展离不开专业人才的参与,而目前图书馆行业的人才结构仍有些传统和单一。因此图书馆还应重点加强对数据人才的培养和引进,积极参与技术研发,为行业的发展打好坚实的基础。总之,图书馆作为提供公共服务资源的部门,必须承担起信息传播的责任,通过对数据的生产、分析、解读,探索出一条为用户提供多元化信息服务的发展之路。

主要参考文献

[1]张毅,赵雅洁.论大数据在图书馆管理与服务中的应用[J].图书馆工作与研究,2015(9).

[2]唐涛.基于大数据的网络舆情分析方法研究[J].现代情报,2014(3).

[3]李祝启,陆和建,申林.政府网络舆情日志大数据挖掘实证研究[J].情报科学,2014(11).

[4]宋毓.大数据环境下图书馆移动微服务研究[J].内蒙古科技与经济,2015(13).

doi:10.3969/j.issn.1673 - 0194.2016.12.127

[中图分类号]G252.65

[文献标识码]A

[文章编号]1673-0194(2016)12-0188-02

[收稿日期]2016-05-20

[基金项目]东莞理工学院城市学院青年教师项目(2014QJZ005Z)。

猜你喜欢

增值大数据图书馆
图书馆
二维码在物资仓库管理中的应用
“互联网+”时代科技期刊的增值运作
基于大数据背景下的智慧城市建设研究
善用探究性学习促使数学课堂增值研究
从“添附”论知识产权的归属
去图书馆