大数据时代图书馆开放存取资源的安全保障体系构建
2019-07-27王思兵
王思兵
(福建农林大学图书馆,福建 福州 350002)
在当今信息时代,数据资源快速增多,越来越多的图情机构以开放获取的方式进行信息发布、传播及高效利用,以多元化促进学术交流,由此也推动了开放获取运动发展。开放存取资源包括开放的图书文献、科研文献数据等,为多种信息传播机构进行资源共享创造了有利条件。国外许多图书馆纷纷引入开放存取资源用于用户知识服务,如剑桥大学针对图书馆用户设置了专门的外网,并建立了数据链接,使数据资源能开放获取与高效利用。对图书馆而言,收集与利用开放存取资源能满足大数据时代的用户需求,这也成为推进图书馆数字资源转型的重要方式。但是,由于互联网具有的开放性、动态性特征及用户隐私保护等问题,也给图书馆带来众多安全风险[1]。由此,图书馆有必要分析开放存取资源的来源与特点,分析当前图书馆开放获取资源存在的安全风险,利用安全管理技术构建资源安全防护体系,使开放存取资源得到有效利用。
1 大数据时代图书馆开放数据的产生与利用
1.1 开放存取运动
20世纪初,为了推进学术资源有效传播、高效利用、高效获取,避免出版商、数据提供商垄断数据资源市场,开放获取运动在全球范围内产生,要求图书情报机构为用户提供能免费获取的知识资源。此后,开放获取运动以开放存取资源为基础获得了许多国家的青睐,成为全球学者获取知识资源的重要途径。2013年召开的《开放获取柏林宣言》年会上,与会者对开放存取运动提出了新的发展要求,认为开放存取资源应保持较高的学术质量,并通过开放存取协议实现全学科共享,使知识资源利用与知识产权保护有机结合[2]。同时,伴随着开放存取运动在全球开展,以开放、自由、共享理念为主的开放获取资源(Open Access 简称OA资源)逐步被人们认知。OA资源是指经过学科专家审核评议的科学研究报告、学位论文、科研论文、科学数据等学术文献组成的资源。OA资源主要类型有开放获取期刊、开放存取仓储、电子预印本、开放获取搜索引擎4种。
1.2 开放存取资源的来源
随着开放存取运动在全球范围内产生发展,使用互联网传递的数据资源数量逐渐增多,开放存取资源数量种类也逐步增多,并成为现代图书馆获取资源开展知识服务的主要方式。对图书馆而言,大数据时代充分利用开放获取资源可有效降低文献资源采购成本,提高文献资源获取使用效率。目前图书馆获取开放存取资源的途径较多,一方面可直接从互联网上下载开放资源,另一方面可以通过访问文献存储网站下载文献资源,包括信息共享数据、视频、音频、文档资源等[3]。由于互联网上充斥着大量异构的数据资源,图书馆可以利用搜索引擎进行信息检索,通过开放的文献获取知识库、信息数据集合网站对文献资源分类检索,为用户获取开放存取资源创造便利条件。
1.3 开放存取资源的利用
现代图书馆针对开放存取资源合理地组织利用,不仅要针对网络空间中分散的开放资源建立数据搜集体系并进行有效收集,还需要对这些资源进行检索、加工、存储。通过建立开放存取资源发现系统,针对开放存取资源实现批量处理,通过对原始数据挖掘,对加工后的开放存取资源实现精准发布,使开放存取资源产生更大的利用价值。我国开放存取资源政策发布及相关技术的广泛应用,为图书馆开放存取资源的使用奠定了基础;开放存取资源使用条例及相关隐私保护政策的不断完善,使更多有价值的开放存取资源可以通过互联网有效传播、组织、加工,使其使用价值得以进一步提升[4]。
2 大数据时代图书馆开放存取资源面临的安全风险
伴随着开放获取运动的发展,图书馆开放存取资源得以有效利用的同时也面临着突出的安全风险,这种风险包括物理安全风险、用户使用风险及网络安全风险。
2.1 物理安全风险
开放存取资源大量存在于开放的互联网环境中,被广大网民用户下载使用,具有较高的使用价值。图书馆在开放存取资源搜集、甄别、使用过程中如何保障资源安全、促进资源利用,是需要高度重视的问题。在开放的大数据环境中,为了有效降低开放资源使用成本,图书馆将开放存取资源存储到云服务器,借助虚拟网络进行资源存储,此举使资源使用管理更为便利,但也承受着较大的安全风险。计算机通讯设备是图书馆信息系统运行的物理基础,极容易受到外界环境因素影响,如温度、湿度、电磁干扰等,物理设备损坏会导致重要数据资源丢失,影响开放存取资源的使用。
2.2 用户使用风险
图书馆开放存取资源的共享、下载、获取为用户获取知识资源提供了便利,在帮助用户高效使用开放存取资源的基础上,图书馆也需要完善资源管理规范,建立合理的开放存取资源使用原则,推进开放存取资源安全使用。但在现实中很多图书馆忽视了对开放存取资源使用规则的体系建设,如未针对开放存取资源建立合理的安全使用规范,甚至部分图书馆没有建立开放存取资源使用目录,没有确定哪些资源向用户开放、哪些资源不能向用户开放,在资源管理中缺乏明确导向,加之图书馆并未建立用户隐私保护机制,致使资源在使用管理中不能围绕用户需求进行个人信息保护[5]。
2.3 网络安全风险
大数据时代图书馆开放存取资源以互联网为基础进行数据传播,使用多种互联网传播平台促进用户高效获取。但开放的互联网环境,很容易使图书馆的开放存取资源成为不法分子攻击的对象。图书馆数据库存储的海量数据资源涉及到知识产权、用户个人资料,再加上对数据资源的频繁加工、发布,数据资源极容易在互联网环境下产生安全风险。如若黑客借助网络系统对图书馆开放程序资源发动攻击,便能迅速获取大量数据资源,这点是传统黑客攻击无法做到的,给信息资源的安全存储带来了挑战。
3 大数据时代图书馆开放存取资源安全管理技术
图书馆开放存取资源的共享使用应全面考虑到安全保护问题,借助信息技术加强对开放存取资源的安全保障。
3.1 数据安全防护技术
图书馆针对开放存取资源的安全防护,首先应保障数据安全,做好数据资源的安全存储工作。目前图书馆常用的存储媒介包括光盘、硬盘、软盘等,由于这些物理存储媒介的使用寿命有限,容易影响到开放存取资源的安全存储。而与传统的纸质文献资源相比,开放存取资源在存储过程中更容易丢失、泄露,很容易被不法分子通过网络攻击获取。同时,在开放的网络环境中,也容易受到计算机病毒的影响。很多图书馆将开放存取资源存储到相关的云服务器中,这就要求图书馆要关注云服务器的安全问题,了解云服务器的安全系统是否存在漏洞,以及存储的数据资源是否安全,防止因网络故障、操作失误给开放存取资源带来安全风险[6]。
3.2 网络安全防护技术
图书馆针对开放存取资源进行网络安全防护,主要通过网络防火墙、安全访问控制、计算机病毒防护等措施,降低开放存取资源可能遭受的网络安全风险,保障开放存取资源的安全。防火墙是常见的网络安全防护技术,是保障图书馆开放存取资源安全的第一道防线,不仅能避免黑客在线发动的网络攻击,也可以通过设置特定的访问端口防止内部信息数据丢失。同时,访问控制技术的应用能对在线访问图书馆用户的身份进行鉴别,并有效分析系统存在的运行风险,针对各类非法操作进行准确识别,控制非法访问次数,保障系统的安全性。
3.3 资源使用安全检测机制
大数据环境使图书馆有着丰富的开放存取资源获取渠道,若图书馆丰富的数据资源被泄露,势必给图书馆发展带来不利影响,给资源共享带来阻碍。由此,图书馆有必要建立资源使用安全检测机制,做好开放存取资源的监测工作,从用户隐私保护、资源使用、数据审核等方面进行机制设计,为图书馆开放存取资源使用提供制度保障。图书馆针对开放存取资源使用应围绕数据资源开放的周期、开放范围,从技术层面进行数据加密及用户隐私保护,防止开放存取资源在使用阶段遭受损失。在数据加密方面应着力提高资源管理人员的安全意识,明确不同类型数据的开放获取方式,设计数据使用规范,使开放存取资源能被有效利用。
4 大数据时代图书馆开放存取资源安全保障体系设计
在开放的数据网络环境中图书馆开放存取资源面临多种安全风险,针对各种安全风险的有效防范,安全保障体系要从用户、网络、资源三方面进行设计(如图1所示),三管齐下提高图书馆开放存取资源的安全防护能力,保障开放存取资源的有效利用。
图1 图书馆开放存取资源安全保障体系结构
4.1 用户层面
大数据时代用户的资源需求更加多元,大数据技术在满足用户多元获取数据资源的基础上,也为用户有效获取终端数据资源提供了便利。图书馆基于用户的行为特点,从用户角度构建资源安全保障体系,当用户获取开放存取资源时通过身份认证、身份识别等方式对用户进行身份验证,避免图书馆开放存取资源丢失泄露。用户身份信息等级根据用户个人填报的基础信息存储到馆藏资源数据库中,在开放的网络环境下容易造成用户信息泄露,难以针对用户实现个人隐私保护。为提高用户使用开放存取资源的可靠性,图书馆有必要以面部识别、数字认证等方式对用户身份进行识别,对用户开放存取资源的获取行为进行监测,并对用户信任等级进行评估,通过对用户行为的分析管理,使用户更能高效地获取开放存取资源。
4.2 网络层面
针对图书馆开放存取资源的安全应设计保障体系,逐步加强网络防护等级,通过对基础网络系统统一规划建设,健全网络系统,明确网络服务地址及系统协议,避免因网络地址混乱,影响网络系统的可靠性。图书馆要重视维护基础网络系统安全,逐步做好网络设备管理工作,如路由器、交换机等,采用不同的网络分级搭配模式,使用集合数据链路提高网络的数据处理能力,保持网络设备运行稳定。同时,图书馆应注重采用远程协议管理模式,对多种网络设备实现远程控制,提高网络系统的抗干扰能力。出于对网络安全风险防范的需要,图书馆应在网络系统中安装杀毒软件,并及时做好网络代码更新工作,通过建立实时监测机制对开放存取资源使用情况及时监督,保障开放存取资源的安全。此外,图书馆应对本馆的主机及硬件存储设备进行安全加固,除了给主机加装防火墙及病毒查杀软件外,还要做好系统的运行维护工作,定期对系统进行安全检查,并建立规范化的系统使用制度,每次在网络系统使用前对系统运行情况进行评估,根据评估结果确定系统的安全等级,使系统能安全运行。
4.3 资源层面
大数据时代开放存取资源作为用户获取资源的重要方式,依托数据网络在提高资源获取便利性的同时,也提高了网络安全风险,图书馆针对开放存取资源应建立更为完善的安全防护机制,保障资源安全。由此,图书馆在开放资源获取阶段应着力做好资源过滤、甄别、筛选工作,去除其中敏感信息,防止资源泄露。与此同时,图书馆针对开放获取资源逐步进行加密操作,既要保障资源获取的安全,也要设置相关的访问权限,并通过对开放获取资源进行分布式存储,降低存储设备对资源安全的影响。此外,图书馆应针对搜集上来的开放存取资源的质量进行评估,针对不完整、结构混乱或是失真的开放存取资源进行挖掘、加工,从中提取有价值的数据,并建立专业的开放存储资源数据库存储加工后的数据资源,使开放存储资源得到最大程度地利用。
5 结语
在开放存取运动背景下,开放存取资源成为图书馆的重要馆藏资源,是资源安全防护的重要对象。为满足大数据时代开放存取资源安全防护的需要,抵御开放存取资源面临的多种安全风险,图书馆应掌握开放存取资源的特点,把握开放存取资源面临的多种安全风险,建立多维的资源安全保障体系,从多个维度强化开放存取资源安全防护水平,使开放存取资源得到有效防护。