大数据环境下海量学术文献资源的自组织机制研究
2020-10-15陈春
陈春
摘 要:自组织机制为海量学术文献资源的建设提供了新路径,文章阐述了大数据环境下构建海量学术文献资源自组织机制的必要性,列举了大数据环境下海量学术文献资源自组织机制的建设原则及作用,最后提出了相应的建设措施,以期提高大数据环境下海量学术文献资源的利用率。
中图分类号:G250文献标识码:A文章编号:1003-1588(2020)09-0110-02
关键词:大数据环境;学术文献;自组织机制
伴随计算机技术的发展和大数据环境的产生,学术文献资源也以数字化的形式被存储和分享,在此背景下,信息服务机构资源共享平台成为近年来图书情报界探讨的热点问题。目前,我国许多图书馆都构建了符合自身资源特色和发展现状的数据平台,数据平台虽然扩大了图书馆的服务范围,但还存在以下问题:一方面,单一科研机构或高校图书馆的学术文献资源是有限的,读者需要跨越多个平台才能完成同一关键词的学术文献检索,增加了资源获取的成本,导致资源使用效率大打折扣;另一方面,每个机构或学术资源平台的分类和数据关联算法略有差异,导致学术文献资源的挖掘和共享存在“孤岛”现象。总之,大数据时代的到来使学术文献资源呈爆炸式增长,传统的资源组织机制显然难以满足读者与日俱增的资源需求,因此,利用大数据技术为海量学术文献资源打造集成化、综合化的自组织机制是必然发展趋势。
1 大数据环境下构建海量学术文献资源自组织机制的必要性
1.1 有利于解决学术文献资源的存储与管理问题
在信息时代,不同学科和类别文献资源的存储与管理问题是阻碍资源利用和共享的重要因素,同时,图书馆的信息检索技术、收集技术与数据挖掘技术也亟待改进。目前的数据管理机制与存储模式之间存在矛盾,从管理机制上看,一方面,大数据环境使学术资源的类型十分丰富,这就导致了管理困难;另一方面,快速增长的海量学术文献资源十分密集,这也就要求其存储必须是高度集中的。由于存在上述因素,文献资源管理平台就需要耗费大量人力物力,这必然会增加文献资源的存储和管理成本[1],而海量学术文献资源自组织机制则能将分散的机构集成起来并纳入自组织结构中,这个过程既不需要打乱原有的形态,又能组成数据集,可以为用户提供更加高效优质的资源服务。
1.2 避免学术文献资源的重复建设
纸质文献资源与数字资源一般是相互独立的,尚未形成互联机制,这就导致无法对纸质文献和数字资源进行统一协调构建,也很难对其进行去重处理,学术机构如再购买已有的纸质文献的电子版内容,势必造成浪费。此外,很多学术机构将资源建设重心放在数字资源方面,通过购买数据库、收集网络资源等方式搭建起了覆盖全面的数字资源库,这也会造成大量纸质文献的浪费。由此可见,构建海量学术文献资源自组织机制是十分必要的,自组织机制可以利用数据搜集技术将纸质资源和数字资源纳入集中的资源管理系统中,从而建立起交互性良好的资源检索平台。对数字资源和纸质资源进行内容上的整合,既可以提高学术文献资源的利用效率,也可以去重就简,为用户提供更加直接明了的资源检索结果[2]。
1.3 推动资源服务部门间的协作
自组织机制实际上就是学术机构资源服务平台内部子系统自行按照一定规则进行运作的机制,需要各部门间的统筹协作[3]。在传统的学术文献资源服务体系中,虽然资源的存储环节、检索环节和输出环节都属于资源服务体系的一部分,但彼此之间是相互独立的。同时,以互联网为媒介的各种信息服务平台应运而生,给学术机构的信息服务平台带来了强烈冲击,这就导致资源服务平台的服务职能面临全面衰退的困境。而构建海量学术文献资源自组织机制有利于打破系统内各部门的孤立状态,促进部门间的协作,从而转变服务方式,提高学术资源信息服务平台的核心竞争力。
2 大数据环境下海量学术文献资源自组织机制的建设原则
基于自组织机制的特点,笔者认为,构建大数据环境下海量学术文献资源自组织机制需要遵循先进性、可靠性与可扩展性三大原则。
2.1 先进性原则
一般来说,需要获取学术资源的读者大多为科研人员及教学人员,从文献内容上来看,他们对资源的质量要求相对较高,因此学术资源不仅要体现出专业性和学科性,而且要能够为其学习或科研提供必要的支撑。大数据环境下,海量学术文献资源自组织机制不仅要具备先进且专业的文献内容,还需要具备相应的技术支持。因此,先进性是大数据环境下海量学术文献资源自组织机制建设的首要原则。
2.2 可靠性原则
图书馆为用户提供的学术资源信息服务需要网络的支撑,完善的网络环境和可靠的数据传输技术是海量学术文献资源自组织机制有效、稳定运行的前提。信息服务平台只有定期对网络进行维护、对平台系统进行升级,才能保障学术资源自组织机制的稳定。
2.3 可扩展性原则
伴随信息服务平台服务方式的改变和服务种类的延伸,海量学术文献资源自组织机制也需要不断扩展。图书馆在构建服务平台之前要对学术数据进行集成并合理分配数据接口,要为数据端口留有可扩展的空间以满足信息服务平台与日俱增的业务需求。一般来说,信息服务平台会预留出优质的数据接口并按照学术文献数据管理方式将网络分成若干物理网段和逻辑网段,以便为学术文献资源自组织机制系统的管理人员提供多种文献资源管理途径,让管理人员能够对各个网络节点的数据进行统一管理,也为功能拓展提供了一定的介入途径[4]。
3 大数据环境下海量学术文献资源自组织机制的作用
3.1 对知识进行重组和整合
在大数据环境下,学术文献资源呈爆炸式增长,信息服务平台不仅要对资源进行全面的搜集和保存,还要对知识进行重组和整合。自组织机制能够对学术资源进行创新:当信息服务平台发出学术资源整合的指令之后,系统内部的各子系統将进行非线性的相互作用,使学术资源存储部门、数据挖掘环节、资源检索平台等子系统产生协同动作,从而使学术资源的建设和输出变得井然有序[5]。总之,自组织机制可以依托云计算技术实现学术资源在不同组织和系统部门间的频繁互动,从而促进信息服务平台的创新和发展。