大数据环境下智慧图书馆信息安全问题研究
2020-01-17颜昌茂
颜昌茂
(湘南学院,湖南 郴州 423043)
近年随着5G网络、大数据、云计算(Cloud Computing)、区块链等新一代网络信息技术的实践应用,图书馆在资源建设、管理水平和服务能力上均取得了长足进步,同时智能设备和技术的推广应用无疑加快了智慧图书馆建设的步伐。但就全国范围来看,现今智慧图书馆建设仍处于探索阶段,实现智慧图书馆美好愿景还存在概念之惑、理论之贫、建设之困的难点[1]。纵然如此,传统图书馆向智慧图书馆转型发展是时代的选择也是必然的趋势。
智慧图书馆概念的形成得益于科技的进步和人们精神文化需求品位的提升,它以数字图书馆建设为基础,将物联网(The Internet of Things,简称IOT)、人工智能(Artificial Intelligence,简称AI)、云计算、智能建筑等智能化技术引入图书馆的建设中,形成众多智能创新应用和服务,目的是满足读者全新的感官体验需求,因而具有广阔的应用前景和强大的生命力。然而目前网络信息安全形势不容乐观,智慧图书馆面临着一系列威胁和挑战,比如,计算机病毒、木马程序、黑客等无时无刻不影响图书馆的正常运转,对智慧图书馆的信息安全也构成极大隐患,馆内读者信息和隐私泄露、数字资源流失,甚至产生不当言论和意识形态等严重舆论事件[2]。因此,如何提升图书馆的信息安全就是我国在智慧图书馆建设过程中应该重点考虑的关键所在,大数据的应用对智慧图书馆信息服务安全提出了更高的要求,如何保障智慧图书馆信息安全,提高图书馆智慧服务水平,满足用户个性化体验需求已成为图书情报领域特别关注的研究课题。
一、信息安全的概念与智慧图书馆信息安全
(一)信息安全的概念
图书馆的信息安全是一个多因素、多层次的系统概念,是指其网络系统中的硬件、软件和信息受到保护,信息不会因为偶然因素或者外界的恶意破坏而遭到泄露、破坏、更改,系统照常运行,服务不中断的现象。信息安全的表述也可以从系统安全、网络安全、硬件设备安全及管理安全等四个方面加以理解,信息安全是确保智慧图书馆各项工作正常开展的前提,是确保为用户提供安全服务的基础。图书馆信息安全问题涉及数据传输、处理、应用等多个环节,具有可靠性、保密性、可用性、完整性、真实可控性等特征[3]。
(二)智慧图书馆信息安全研究
传统图书馆和智慧图书馆面临的信息安全问题因各自的工作流程不同而差异较大。传统图书馆整体的工作任务是对本地馆藏信息资源进行收集、加工及储存,工序相对简单,馆际信息共用共享程度低下,图书馆的信息安全反而更有保障。而现今大数据环境下,智慧图书馆信息处理的全过程都有可能面临严峻的安全形势,读者信息泄露、黑客攻击系统、文件感染病毒的情形时有发生,读者因此叫苦不迭,于是智慧图书馆数据和信息的安全问题开始受到图书馆管理者和相关人员的高度重视。总的来说,智慧图书馆除了防范自然因素对信息安全产生的影响外,还要格外关注其网络安全、版权、信息存储以及读者的个人隐私不被侵犯等问题。
二、国内智慧图书馆的信息安全现状
目前,国内不同级别的公共馆和高校馆在智慧图书馆建设方面都有自己的预想方案,有的还取得了初步的建设成效,但各类别图书馆的信息安全状况却存在较大差异,具备明显的地域性,有的是个别问题,但更多的是共性问题。地处经济相对发达的图书馆由于其规模较大、层级较高,相应的其信息化、智能化水平也较好,信息安全防护等级相应较高;而规模较小、经济欠发达地区的基层图书馆,其信息安全保障措施普遍较差。但不管是哪一类别的图书馆,实现信息安全的首要任务就是保障整个图书馆信息资源的安全与完整,保障整个图书馆智慧服务平台运行可靠与稳定。国内图书馆智慧化建设目前大多处于初级水平,其信息安全不同程度地存在以下几个问题。
(一)读者的信息安全意识淡薄
读者是智慧图书馆开展信息服务的主体对象,他们思想上的安全意识能从主观上影响信息资源利用的态度,因而客观上就能规避很多潜在风险。但事实上很多读者在获取信息资源时不注意检索规范,不了解网上信息泄露带来的风险,甚至存在侥幸思想,不相信自己会遇到个人信息泄露的状况。因此,读者在图书馆通过移动图书馆平台、IE浏览器、手机APP客户端等途径检索信息资源时,即使通过了图书馆安全网络的认证,可能也会因缺乏必要的安全意识而疏忽潜在的信息安全隐患。对此,我国在信息安全等级保护规范及信息安全管理标准中都特别强调了信息安全的教育途径和具体要求,因此图书馆需切实加强对读者进行信息检索和利用的培训,提醒读者时刻保持安全意识。但由于种种原因,很多读者都没有接受过图书馆信息安全教育,信息安全意识依旧淡薄,以致信息资源甚至隐私泄露事件频发[4]。
(二)智慧图书馆的信息资源储存不当
智慧图书馆信息储存不当体现在用户和图书馆两个层面。首先,从用户层面来说,用户在接受图书馆智能服务的时候,都期望得到专业、全面、精准的信息资源或个性化服务体验,因此就要将个人信息(如姓名、职业、专业、研究兴趣、手机号、甚至身份证信息等)提交系统储存并处理,图书馆相应的服务系统才能根据这些信息做出准确的回应。对用户来说,这些关联度很高的个人身份数据属于重要的隐私信息,如果这些特定的个人隐私信息在图书馆的储存处理过程中被过度解读分析,用户隐私就存在被侵犯的可能;如果用户信息被不法分子利用还可能会产生更严重的后果。以上情况如果发生,势必对图书馆用户在心理上造成严重后果和精神损失,是用户不可接受的一件事情。其次,从图书馆层面来说,智慧图书馆提供智能服务的基础是系统拥有的各类图书、数据库等数字信息资源,其中有的资源可能是该馆特有的或是涉密的,这些数据是图书馆多年建设积累起来的财富,是图书馆的立馆之本。如果这些信息因储存不当被不法分子非法利用,轻则造成信息泄露、知识产权被侵犯,重则扰乱社会公序,损害国家利益。
(三)智慧图书馆管理系统存在技术漏洞
随着智慧图书馆新型业务的开展和读者信息服务要求的提升,特别是大数据环境下智能技术的广泛应用加快了图书馆的转型发展,图书馆需要采用相应的应用管理系统全面提升图书馆智能化信息服务水平。图书馆智能管理系统的运行需要人、网络和计算机的协调配合才能实现信息资源的搜集、传输、处理、储存和利用。虽然如今各类图书馆智能管理系统层出不穷,系统功能也愈发完善,但在实际应用环境或使用过程中难免出现毫无征兆的系统bug(逻辑缺陷),如不及时排查修复就会导致各类信息安全事故频发。
(四)智慧图书馆的信息安全管理制度不完善
制度是行动的保障,无规矩不成方圆,图书馆的运行与发展需要一整套完备的规章制度。一般来说,图书馆的规章制度都大同小异,通常包括图书馆相关业务与技术标准、图书馆资源建设规划、图书馆业务管理要求等等。规章制度具备内部效力和外部约束力两大作用,对内规范图书馆员的管理行为,对外促进读者养成良好的行为习惯。智慧图书馆的网络开放程度相对较高,有的图书馆从安全角度考虑,在制度中明确规定未经允许不得通过智能下载软件获取图书馆购买的电子资源,但在实际的管理过程中如何使这一制度得到有效执行却是一个棘手的事情。因此,智慧图书馆规章制度的制定与执行还存在很大的改进空间,需要根据情况不断完善。
三、智慧图书馆信息安全问题原因分析
大数据环境下智慧图书馆信息安全问题产生的原因很复杂。就其构成因素来说,有客观环境的因素,也有主观人为的因素,有设备的原因,也有技术的原因,还可以说有管理上的原因。在笔者看来,智慧图书馆信息安全产生的原因兼具以上各种因素,只是它们的占比不同而已。
就智慧图书馆信息服务的具体操作来说,“信息安全隐患在信息的搜集、处理和传输过程中都可能会出现数据丢失、篡改、泄露的问题”[5],或者说图书馆的业务流程,自始至终都存在信息安全问题。
首先从信息搜集的流程分析。图书馆根据读者需要搜集信息时,图书馆工作人员如果因工作疏忽、技术水平或操作流程不当,没有对目标信息进行必要的安全检测,可能收集隐藏病毒或木马的文件或信息,这样势必造成信息读写错误、数据被篡改、甚至文件丢失,从而影响信息的使用和系统安全。
其次从信息的处理过程分析。信息处理是智慧图书馆提供精准服务不可缺少的流程,是一个复杂且耗时费力的计算过程,特别是对于一些高价值的信息,在进行数据分析处理时如果缺少必要的安全防范手段,难免会出现信息被盗用、删除、篡改或遭病毒感染,导致信息处理的响应速度和结果大打折扣。
第三从信息的传输过程分析。信息的传输过程也容易产生信息安全问题。随着数字化资源的大量普及,各种类型的数据库竞相成为图书馆固定的馆藏资源,图书馆通常采用包年和镜像的方式访问这些数据库,数据库的更新无需人工干预由系统定期自动更新。包年用户数据库更新过程有时可能出现数据传输延迟而使服务暂时中断,但后台一般会有技术人员及时回复处理相关问题。由于多数智慧图书馆云存储系统开放程度较高,允许用户根据规则上传数据信息,同时也能快速共享其他用户信息,云端信息的传输给用户的需求带来了便利,但同时也容易激发信息安全隐患,因为用户处于云端的信息无法完全保证不被他人所获取。
四、智慧图书馆信息安全构建途径
随着数字经济的蓬勃发展,智能技术加快融入国人的日常生活已是大势所趋,智慧中国描绘的美好蓝图不再是遥不可及的梦想。智慧图书馆融入智慧校园建设,实现与智慧城市整体发展相统筹,使读者、图书馆、馆藏资源之间形成互通有无的良好局面,更好地体现智能图书馆的社会价值。为此,智慧图书馆应当把信息安全防护作为一项常态化的工作来抓,并采取积极有效的措施应对各种挑战。
(一)加强信息安全宣传和教育,提高读者安全意识
智慧图书馆信息安全的构建不仅要依靠先进的技术手段加以实现,还要重视宣传和教育,结合相关事例加强舆论引导使其了然于心,切实提高读者及图书馆工作人员的安全防范意识和网络道德意识,从精神层面确保信息安全。同时积极引导读者养成文明上网、绿色上网、安全上网的习惯,规范读者上网行为。告知读者在图书馆等公共场所尽量避免使用陌生的WIFI;不在电脑或手机上接收并打开可疑文件或链接;登录注册各种网络平台、社交媒体、手机APP时避免使用同一个ID和密码登录多个软件,注意密码要定期修改。切记随时绷紧信息安全这根弦,不在网络上泄露过于详细的身份信息及其他个人隐私。
(二)采取不同策略,保障大数据存储安全[6]
信息社会,数据的存储已经成为人们生活与工作再常见不过的一项应用,随着人们对数据的依赖程度越来越大,公众对数据存储安全也日益重视起来。事实上安全向来都是相对的,没有绝对的安全,存储安全也一样,数据存储安全的基本目标就是防止任何因素导致的信息泄露或破坏,同时保护所有数据链中相关敏感信息。数据存储安全因采取的安全策略算法不同分为静态存储与动态存储两种模式。静态存储根据AES-256区块加密标准,通过HTML5的API接口获取拟上传的数据,然后对上传的数据进行相应的加密处理,需要注意的是,大数据环境下对图书馆存储的大量数据进行加密操作时,要将对称和非对称加密算法结合起来使用。对于数据动态存储操作,注意数据传输过程使用SSLVPN文件传输协议,确保存储数据传输的安全。
对于图书馆来说,存储的数据资源容量较小时,数据的备份与恢复相对比较容易,当图书馆拥有数据量达到PB(千万亿字节)级规模时,用传统的方法备份或恢复如此庞大的数据就是一件很艰难的事情。Hadoop是当前一种较为成熟可靠的存储大数据集软件系统,它用高带宽的程序流式来处理存储的大数据集,HDFS(Hadoop Distributed File System)分布式文件系统负责提供分析和传输大数据的框架。实际应用中,智慧图书馆数据存储大多使用HDFS自带的备份和恢复机制,对于图书馆的核心业务数据,HDFS还应同步启动远程容灾备份程序,并根据实际需要,合理调整数据备份和恢复的存储空间。
为了避免图书馆云端用户数据信息遭恶意泄露、破坏,存储服务访问机制应具备灵活的用户访问授权设置功能,控制不同访问对象和内容,必要时能够即时隔断非法访问、获取数据等任务进程,同时对特殊会话进行监控。
(三)加强技术应用,修补系统漏洞,提高智慧图书馆系统信息安全
智慧图书馆作为一个具有人工智能的有机体,可以有效地将技术、资源、服务、馆员和用户(简称五要素)集成在一起,充分发挥图书馆的价值功能和功能。构建智慧图书馆信息安全环境和安全体系是一项长期性、专业性的工作,需要综合运用各种技术手段保障图书馆各种应用系统、资源、设备、服务等正常可用,切实满足读者的应用体验。
1.坚持使用正版软件,规避版权风险
图书馆可以通过构建正版软件服务平台(genuine platform)向馆内计算机提供Windows操作系统及Office办公软件等资源与服务;利用KMSpico(KMS)激活工具将盗版软件激活为正版,就能有效保护计算机操作系统的稳定运行,降低系统维护成本,保护知识产权,避免相关法律风险,满足智慧图书馆用户对信息资源管理、软件学习和使用的不同需求[7]。对于正版操作系统,图书馆技术人员还要及时关注其官网的更新情况,通过打补丁方式提高系统的安全性。微软公司早在2014年4月就已经停止Windows XP的补丁更新,从信息安全和病毒防护的角度考虑,图书馆的计算机从即日起应避免安装使用Windows XP系统,全面推广使用正版操作系统和办公软件,例如Windows 7 /8 /8. 1 /10,Office 2010/2013 /2016等。其他的应用软件和智能手机APP应用程序则到相应的官网下载使用。
2.安装防病毒软件,保护系统安全
安装合适的防病毒软件是保障系统安全最简单、最有效的方法。防病毒软件一般分单机版和网络版两种,不同厂家的防病毒软件在功能上也是大同小异,具体选择应根据实际应用环境来定。一般来说,单机版防毒软件的管理功能相对较弱,是个人用户的首选,从网络管理和病毒监控的角度来说,网络版防毒软件则更适合智能图书馆系统。因此,我们在选择网络防毒软件时要重点考察软件以下几点功能:第一,能够支持当前主流操作应用平台,具备软件安装、配置、升级集成管理;第二,病毒防护软件要支持目前常见的互联网协议及不同邮件系统,兼容性、可扩展性较强;第三,病毒库更新及时,具有强大的防护功能,能对不同类型信息数据、程序软件提供不同等级的保护。根据实际使用效果和用户反馈情况来看,BitDefender(比特梵德)、Kaspersky(卡巴斯基)、瑞星、360杀毒都是不错的杀毒软件。
3.设置网络访问策略,保障信息安全
大数据社会,网络数据量的增长速度难以想象。图书馆信息资源存储量变得日益庞大,网络平台的各种原创性数据也是飞速增长,尤其是对云端数据的存储访问变得更加复杂,需要综合运用实名身份认证、数据加密存储以及数据灾备等技术手段保障系统稳定运行,确保信息资源的安全与完整。
(1)身份认证。身份认证又称“验证”“鉴权”,是指根据一定的技术手段(密钥、人体生物特征等)完成对用户身份的确认。为了实现对智慧图书馆云端信息资源快速高效获取和利用,提高读者用户访问图书馆信息系统的安全性,充分发挥智慧图书馆信息综合管理能力,需要构建一套统一高效的单点身份认证登录系统,只有认证通过的用户才有权限获取智慧图书馆提供的各种信息服务。例如,湘南学院图书馆采用的是H3C网络SAM+实名认证准入准出机制,记录读者个人上网认证信息(用户名、IP地址、上下线时间、在线时长等),同时图书馆的有线和无线网络均采用Web认证,用户访问外网时自动跳转到认证页面完成实名认证。目前,该校实名认证系统注册用户已超4万人,主要是校内师生及部分临时用户。
(2)关闭不需要的服务和端口[8]。图书馆各类服务器是对外提供信息服务的关键设备,根据读者应用需要对服务器进行科学合理的参数配置才能发挥服务器的最佳工作性能。对于服务器操作系统默认启动的服务,图书馆技术人员要能做出准确判断,及时关闭或停止那些占用系统资源、增加系统安全隐患的服务。比如对提供外部网络服务的服务器,只需开放HTTP端口(80)即可,而FTP端口(21)、TELNET端口(23)一般选择关闭。
(3)加密存储技术。一种数据库安全技术,在数据库主程序启动时加载扩展插件,可以实现:①数据写入存储介质前将数据进行加密,实现数据的存储加密;②从存储介质加载数据到内存前进行数据解密,实现数据的解密使用。存储加密技术原理包含两个运算过程,一是根据应用需求选择加密算法生成密钥,二是利用密钥对数据资源进行加密存储或者解密读取。
(4)数据灾备技术。云计算作为一种新型分布式计算方法,其数据容错及灾备能力比较突出,智慧图书馆管理系统综合利用云计算、分布式技术与虚拟化技术即可方便地实现信息资源多点备份、冗余数据异地存储、云节点信息自动灾备分级等功能。图书馆数据灾备系统的应用可以最大程度地在灾变发生后迅速恢复系统灾备前的功能,尽力保障系统数据信息的完整以及服务的延续。各图书馆可以通过合作构建一套统一的馆际共享存储平台,建立多个图书馆云存储数据中心,让读者和各个业务部门共享数据信息。
(4)落实信息安全法律,加强信息安全管理
实践表明,网络信息安全的落实需要通过相应的法律实施来保障。1994年2月国务院颁布实施的“《中华人民共和国计算机信息系统安全保护条例》就明确规定计算机信息系统实行安全等级保护”[9],同时出台相应的安全等级保护细则及管理办法。为有效应对日益严峻的互联网安全形势,2017年6月国家又正式实施了《中华人民共和国网络安全法》。这些法律法规的颁布与实施对图书馆信息安全体系的构建具有精准的指导作用和现实意义。图书馆上下要从思想认识上牢固树立网络信息安全意识,准确把握信息安全法律、条例、标准,根据智慧图书馆建设定位、要求及具体方案建立一套可操作、易推广的信息安全管理制度。严格遵循信息安全领域里普遍认可的“三分技术,七分管理”这条金规铁律,真正提高智慧图书馆信息安全“管理”所占的比重。建立严密的符合管理需求的信息安全管理体系,不仅可以降低信息安全管理的成本,而且能够在现有技术条件的基础上提高图书馆信息安全的防护等级。