大数据在图书情报领域的研究现状分析
2018-05-07郭平
摘 要:大数据如今已经贯穿融入到我国各类行业项目当中,而图书情报领域自然不可例外。笔者的任务,就是在客观梳理大数据在图书情报领域中的研究现状基础上,结合实际认证该类工作的发展趋势,希望能够引起更多人员重视。
关键词:大数据;图书情报;研究现状;发展趋势
前言:基于大数据技术进行图书情报领域研究,主要的研究对象包含图书发文量与时间、发文国家和机构、以共词分析为基础的学科研究主题等分布状况,所谓的研究现状自然就是围绕这一系列细节的发展动态和控制经验,进行细致化归纳梳理。
1 目前大数据在图书情报领域中的研究现状
(一)发文量和时间的分布状况
几乎国内外任何一类研究项目的发展历程,都可以凭借不同年份的相关论文数量加以表现。单纯以CSSCI和SCI为例,它们由零五年致力于图书情报领域大数据的发文工作,尽管说持续到一一年国内外发文数量始终有限,但是自动一二年过后至今,始终呈现出持续性的上升趋势。透过此类现象可以清晰化判定,现如今国内外图书情报领域在大数据上的研究正处于关键性的上升阶段。
(二)发文国家与机构的分布状况
经过对涉足图书情报领域的国家、机构混合网络解析过后,能够及时理清不同国家和研究部门在这部分领域中的合作关系,以及知识交流动态。
首先,大数据在图书情报领域中分别形成以美国与韩国为核心的两种聚类簇,其中美国在该类领域中的发文数量最多,已经达到文献总体数量的3成以上,对应数量为23篇;韩国则排在其后,占据文献综述的1成多一些,数量则是8篇。
其次,美韩中间中心性排名也十分突出,证明网络内部大多数国家都与它们有着直接亦或是间接性的合作关系,当中美国的经常性合作伙伴是英国,韩国合作对象便是荷兰。相比之下,尽管说尚且未存在显著性的聚类簇,但是中国和中国台湾之间,德国和瑞士之间,也都或多或少在图书情报领域大数据研究上进行合作交流。
(三)以共词分析为基础的学科研究主题分布状况
所谓共词分析,属于计量学中经常使用的内容分析手法,就是凭借高频出现的关键词和标题,令一些主题接近的文献快速地被聚合到一起,之后借助现有关系强弱考察途径,进行当中映射出相关主题内容的研究热度。这类方法对于大数据在图书情报领域中的研究热点归纳总结,有着一定的实用价值。
第一,关于社会化媒体的关键词共现关系认证。单纯以Twitter为例,这部分大数据研究主要包含相关算法挖掘和数据应用两类研究方式。其中前者可以细化出并行算法和分开可视化分析;后者则主张基于公众情绪数据亦或是道琼斯工业指数曲线对比解析,以及用户生成数据挖掘预测等途径,进行一些图书情报预测,如今已经引起较多学术专家和商业机构的强烈关注。
第二,涉及大数据和知识发现相互融合的关键词共线关系梳理。其强调在积极贯彻面向大数据有效知识发现系统的设计理念基础上,进行不同类型数据分析方法开拓,顺势加快各类规模数据存储、处理、开源扩展的效率;除此之外,还必须配合知识发现和大数据结合途径将数据潜在价值开发并落在实处,最终配合狄利克分布法在大数据中快速检测是否存在入侵现象。这一系列研究成果,对于促进大数据和知识发现融合,有着极为强劲的支持服务功效。
还有就是大数据融入到图书馆现代化建设与服务的状况。即凭借服务等级协议等大数据技术,针对广大图书馆读者提供富有针对性的隐私保护策略。尽管说,大数据概念衍生不久之后,我国学术专家将开始将其引入到图书情报领域当中,但是现阶段的研究始终停滞在基础与政策方面致死行,至于核心领域并未能达到切实性的突破。而在信息与知识服务方面,当前我国研究主要包含两类,一类是配合大数据视角进行其聂晗、特征、概念模型转换,另一类便是构建完善化的大数据信息知识服务平台并做好关键技术研究工作,包括可视化的终端交互技术,以及知识服务质量评价与服务管理技术等等。经过它们彼此作用之后,不仅仅可以一改传统的图书情报信息和知识服务方式,同时更为图书情报领域研究工作可持续发展提供全新指导性思路。
2 今后大数据在图书情报领域中应用和发展的趋势
(一)数据可视化分析方面
自从大数据技术衍生之后,各行各业都开始针对大数据分析提出严格性的规范要求,在此期间,数据分析结果务必要得到更多形式的展现,这样才能方便被社会大众快速理解,特别是经过大数据可视化分析工序流程确认、大数据可视化处理架构规划、Twitter大数据精细化分析之后,大数据可视化分析正由此成为潮流趋势。尽管说这一系列研究成果不可小觑,但是大数据可视化分析工作上还是不可避免地留有一些障碍,分别是究竟怎样进行大规模数据视觉转换,还有就是怎样维持这部分视觉转换的实时性和效率性。由此证明,今后我国大数据在图书情报领域研究和发展上还有很大的进步空间。
(二)移动数据和云端处理方面
经过4G网络、手机等移动终端推广使用过后,移动设备中开始出现大规模的大数据,无形之中对于手机运算、存储、处理功能提出愈加深刻的挑战,在此类背景下,云处理理念得以衍生。现阶段对于移动云处理的研究始终停滞在初步阶段之上,不过却同时获得较多研究人员和单位的重视,毕竟移动数据挖掘发展的同时还会带来一系列的安全隐私隐患,使得大数据和移动云计算在融合过程中不免出现诸多障碍。归结来讲,经过移动终端设备大力推广使用之后,今后涉及移动数据和云处理的研究会始终处于热潮之中。
(三)深度学习与大数据研究的融合方面
大数据分析的关键性问题,就是理清究竟怎样针对既有的图像、文本、声音等数据进行有力地表达、解释,以及学习。以往数据表达模型與模式过于简易化,而大数据则要求提供更为繁琐的模型架构,所以,只有确保进行这方面知识系统化学习,才可以保证及时针对大数据预测分析提供可靠的解决方案。最近阶段,国内外在大数据分析上有了一定的进展现象,即在大规模深度信念网络DBNS与CPU架构的基础上,开发设计出并行无监督的学习模式,一时间令无标记的训练集参数规模提升至1亿左右。相信长期坚持下去之后,有关大数据和深度学习的融合工作势必会有更为长足的发展成就。
结语:综上所述,如今大数据研究成果接连衍生,选择针对最新的研究进展进行细致化梳理和学习,现实意义重大。透过大数据在国内图书馆情报学领域中的研究热点分布状况观察得知,大数据分析处理属于大数据研究的重点,云计算则是贯彻大数据处理目标的前提保障,知识管理便属于大数据的主要应用领域。随着时间不断推移,相信来源于社会化网络的大数据势必会得到愈来愈多的关注,其间涉及大数据的隐私问题也必须及时得到深入性地处理。希望日后相关工作人员能够在这方面工作上多下苦功,最终引领我国图书情报领域和大数据技术的同步进步成果。
参考文献:
[1]刘海鸥.面向云计算的大数据知识服务情景化推荐[J].图书馆建设,2014,24(07):165-170.
[2]李亚峰.基于文献计量的大数据研究综述[J].情报科学,2014,17(06):88-96.
[3]马晓亭.大数据时代基于服务等级协议的图书馆读者隐私感知与保护研究[J].情报理论与实践,2014,11(04):134-139.
作者简介
郭平(1973-),女,湖北省荆门市人,民族,汉,职称:馆员,学历:本科