智慧图书馆大数据安全问题研究*
2020-01-09王维秋刘春丽邱宇红王雯霞
王维秋 刘春丽 邱宇红 王雯霞
(中国医科大学图书馆,辽宁 沈阳 110122)
随着智慧地球、智慧城市、智慧图书馆等概念的提出,物联网、WIFI、RFID、大数据技术的飞速发展,人类社会快速进入了智慧时代、大数据时代。“智慧图书馆”(Smart library)一词是2003年由芬兰奥卢大学图书馆学者艾托拉在人机交互设备国际研讨会上首次提出的,他认为“智慧图书馆”是能被人们感知的,不受空间约束的,移动式的图书馆[1]。智慧图书馆离不开大数据技术,大数据技术给图书馆运营模式、服务理念、读者需求及服务环境都带来了巨大变化。如何采集、存储并利用读者身份数据、阅读行为、个人爱好等隐私数据,并将采集到的数据进行整合、分析与挖掘,进而根据分析结果进行精准的文献资源采购、读者服务工作,成为图书馆提高服务水平、读者满意度和图书馆影响力的关键。目前,大数据技术以及云计算技术已逐步运用到图书馆的各个环节。如何确保数据采集、存储、传输与分析等过程中数据安全,是智慧图书馆大数据安全面临的新问题。
1 智慧图书馆大数据安全问题现状及风险
大数据信息安全问题及风险,主要来自于人员管理、计算机硬件、软件管理3个方面。
1.1 人员管理
1.1.1 图书馆各级别人员的访问权限监管不到位。图书馆管理系统应该针对各部门工作内容和人员职责的不同,为每个部门、每名馆员设定不同的访问权限,以此规避非所需权限人员任意访问越权信息的风险。但据笔者调查发现,有些图书馆各部门馆员对数据的访问权限相同,这种不限定的访问权限对于数据安全管理存在巨大风险,容易泄露重要数据信息。
1.1.2 人员的素质问题。人员素质问题主要有两个方面,一是主观恶意,如:受到利益的驱使,利用手中的权限出卖大数据内容;二是主观无意,如由于数据主管人员能力的问题等,在网络服务过程中或业务操作过程中操作不规范而引发数据安全问题。
1.1.3 信息安全培训较少。图书馆技术部门应该针对信息安全管理相关内容对馆员及读者开展相应的培训工作。可以聘请专家开展业务讲座,增强全体馆员及读者的信息安全意识。但目前图书馆这方面培训工作开展较少,有的图书馆甚至没有这方面的培训。
1.1.4 忽略离馆人员数据信息安全的影响。无论是公共图书馆还是高校图书馆,每年都有馆员与读者离职或退证,这些人员的信息数据是否还保留分析,对于现有数据的实效性、准确性都是有影响的,同时,这些人员的信息存在极大的不可控性风险。
1.1.5 备份工作人员管理严重缺失。目前,大多数图书馆的数据备份都是数据中心交换机每天的自动备份,有利的方面在于机器自动备份,不存在人为忘记。不利的一面在于彻底疏忽了备份管理的关键问题,没有强调人的主观作用。图书馆应该对各种数据备份有严格的制度,数据备份的日期、数据内容、操作者姓名等都应该做好登记。此项管理工作的缺失,如果遇到系统崩溃等问题,存在数据全部丢失的风险。
1.1.6 读者个人信息及行为轨迹管理制度缺失。为提高图书馆的资源建设质量及服务工作质量,图书馆需要收集读者的全面数据信息,掌握读者的身份特征、行为轨迹、兴趣爱好及消费习惯等隐私数据。个人身份信息一般是由读者的身份注册中得来;行为轨迹、兴趣爱好等信息一般是由图书馆的集成管理系统及全天候监控设备得来。这些信息也可由第三方增值服务运营商的数据共享得来。大数据时代,在图书馆集成管理系统及现代化技术的监控之下,对于读者各种数据采集都是在读者完全不知情的情况下完成的,因此,对于读者的个人信息及行为轨迹数据来说,毫无隐私可言[2]。
1.2 硬件设施管理
1.2.1 图书馆固定存储设备管控不力,大数据存储设备存在安全隐患。固定存储设备的安全隐患主要有两个方面:一是设备本身的质量问题,如主机及电脑的品牌、使用寿命、自身缺陷等,有可能造成数据不可逆转的丢失;另一方面就是设备所处的环境问题,环境的温度、湿度等,长期存储大量的数据存在丢失的风险。
1.2.2 图书馆对移动存储设备及网络传输文件缺乏管控。一般情况下,图书馆系统内数据信息在没有馆领导同意的情况下,禁止使用移动存储设备拷贝或通过QQ、微信等方式进行传输。但是由于管控制度缺失、数据安全意识淡薄以及移动存储设备拷贝数据、QQ及微信等网络传输数据的便捷性,导致很多部门员工随意使用移动存储设备或QQ、微信等拷贝或传输数据,加大了图书馆数据信息泄露的风险。
1.2.3 图书馆云环境下数据存储的安全问题。据数据认证中心(IDC)2015年的报告,企业会优先选择云架构来进行数据的存储、备份和恢复,并且有55%的企业正在使用或者计划在未来的一年内使用外部云架构服务[3]。云计算环境下,图书馆与第三方云服务租赁者通过存储空间虚拟的方式共享云空间,从而大幅度提升了存储的灵活性并降低了存储成本,但这样一来,图书馆数据会与其他租赁者存储在同一物理空间,该数据可能会被其他用户通过获取超级权限的方法非法访问。此外,云存储空间的使用改变了图书馆传统的安全防护边界,云服务商的数据安全管理水平、制度的科学性和法规遵守的有效性,将直接关系图书馆在云空间存储大数据的安全性[4]。
1.3 软件设施管理
1.3.1 网络环境安全风险。大数据时代图书馆的数据传输以互联网为基础,并利用各种先进技术为用户提供多样化服务。而互联网的开放性与便捷性,使得数字化资源成为不法分子攻击的目标[5]。图书馆蕴含的海量开放数据——数据库、图书、期刊等图书馆必备资源,读者个人基本资料信息,图书馆应用系统内的借还书数据,读者行为轨迹数据及涉及隐私数据等敏感数据,很容易吸引更多的攻击对象。黑客发动在线网络攻击,可以同时控制多台计算机,窃取图书馆各方面的大数据,从中获取经济利益。部分黑客还将APT(Advanced Persistent Threat)高级持续性威胁攻击代码隐藏于大数据中,导致计算机系统无法监测识别,加剧了图书馆开放数据的风险。
1.3.2 系统漏洞及病毒软件的攻击风险。互联网业务支撑系统经常要进行网络漏洞的修补,如果存在未修复的安全漏洞,就会给病毒、恶意软件等侵入图书馆计算机网络留下可乘之机,对业务系统的信息安全造成很大威胁[6]。特别是病毒木马的威胁,很多木马程序病毒不断更新换代对网络数据实施攻击,窃取用户信息,直接威胁信息安全。
1.3.3 大数据采集、存储、使用、销毁过程中的泄漏风险。互联网环境下,在大数据采集、存储、使用、销毁的过程中,各种交互、交易信息都是通过网络传输完成的,同时有些业务平台在处理信息的各个环节未建立保护信息的有效机制,致使信息很容易出现泄露风险,包括传输过程中采用未加密协议,数据包被截获还原;存储与使用数据信息时加密级别不够导致的数据泄漏等[7]。
2 智慧图书馆大数据安全问题产生的原因分析
2.1 图书馆领导层对数据信息安全管理的意识不强
图书馆领导层对数据安全管理工作不重视,直接导致了员工的数据安全意识淡薄,更是没有管理制度的约束。笔者网上查阅了公共图书馆及高校图书馆的网站,在国内,没有发现图书馆网站上公示了数据安全的管理制度与条例。偶有数据库资源的使用限定,一般是IP范围内使用、账号漫游使用等。没有对馆内其他重要数据及敏感数据使用的安全限定,使得数据安全没有制度约束。
2.2 信息安全管理体系不完善,一些管理员工素质偏低
目前,图书馆数据安全管理体系文档内容大多是网上下载整理而成,缺少一个健全的管理体系,缺少防范措施及出现问题的问责追责方案,具体工作责任人不明确,存在无人负责问题。同时,由于管理体系不完善,一些素质低下的管理员工及服务商为了追求经济利益非法出卖用户数据信息,特别是用户的隐私信息数据。
2.3 缺少正版的防病毒管控软件
图书馆大数据安全风险的一个方面是来自外部的病毒攻击。图书馆现有的防范措施是制定上网管理制度,对使用者浏览内容随机监控,敏感网站用IP开关控制上网及下载等。但是,即便是员工及使用者遵守上网管理制度,面对网络病毒的恶意攻击,非IT部门人员在没有安装“安全卫士”等正版的防病毒管控软件对信息过滤技术的智能识别下,仅凭管理制度及员工的能力无法保障数据信息的安全,无法阻挡黑客、病毒的攻击[8]。
2.4 缺乏云环境下的行业标准
目前,多数图书馆在使用云平台进行数据的存储利用,而云计算平台缺乏统一的行业标准。微软及IBM等运营商都各自有服务器的技术标准,导致云环境下数据信息安全技术标准混乱,缺少统一的安全标准体系,影响了数据安全技术的发展[9]。
3 智慧图书馆大数据安全问题解决方案
3.1 加强人员管理
3.1.1 完善管理制度。首先,图书馆界应该制定一个通用的数据安全管理制度,对数据采集、分析、存储等做出程序规定。可参考《中华人民共和国计算机信息系统安全保护条例》《通信网络安全防护管理办法》《关于信息安全等级保护建设的实施指导意见》《信息安全技术:信息系统安全等级保护基本要求》《信息安全技术:信息系统安全管理要求》《信息系统等级保护:安全建设技术方案设计要求》《互联网安全保护技术措施规定(公安部令第82号)》《计算机信息网络国际联网安全保护管理办法(公安部令第33号)》等文件。其次,针对不同业务部门、不同管理员的权限需求,制定符合部门业务及人员权限的工作流程与管理制度,该管理制度由图书馆信息安全管理委员会审议通过后实施。
3.1.2 加强馆员培训及管理。对于馆内现有员工,加强信息安全管理的相关培训。同时,对于新进员工,图书馆应该提高人才引进标准,引进信息安全技术的专门人才,从招聘、入职到离职都着重于数据安全层面的工作。入职前,对入职资格进行资格验证,包括毕业学校、所学专业等。入职后,对其进行信息安全培训并签署数据安全保密协议。工作后,将数据安全工作的执行情况列入阶段性考核并与绩效工资挂钩。离职或工作变更后,及时收回或调整其数据信息的访问及管理权限。
3.2 优化硬件设备及技术支持
3.2.1 主机设备系统。主要包括服务器及相关的存储设备,是图书馆整体系统的基础硬件,是黑客攻击及盗取数据的重点对像。服务器的安全主要是通过集群技术与虚拟技术来解决,应用集群技术主要为了防止某处单点故障而引起整个系统瘫痪,有利于图书馆数据库与核心业务系统管理;虚拟技术是把中央处理器、虚拟内存、硬盘等资源集成为动态资源存储地,用于安装图书馆各项业务系统,系统间互不干扰,从而达到提高资源利用率及安全管理的目的。存储系统是数据安全保护的核心,应该与服务器系统联合规划。一般采用直连式存储、网络附加存储及存储区域网络等方式与服务器连接,对数据进行存储时可利用存储集群技术在多个存储系统上同时保存数据,防止单点数据丢失而带来的数据危险。
3.2.2 网络系统安全。主要是通过系统准入控制、网络边界设计、入侵检测及网络行为管理来解决。系统准入控制是指根据本馆数据的重要程度规范管理人员的准入权限,防止非法授权访问。网络边界设计与入侵防范是在网络通道上配置入侵防御系统,在服务器前端部署高性能防火墙,以防止黑客入侵及病毒攻击。在网络管理方面,规范用户上网行为,对使用者进行审核并做好使用记录。同时,配备技术管控软件,如上网时间的自动限定、恶意访问的自动退出、上网流量限定等软件[10]。
3.2.3 数据处理的技术管控。主要是加强对数据的清洗,图书馆采集、存储的读者数据中,有很大一部分与读者行为轨迹分析、图书馆建设及读者服务是不相关的。其中包含了与图书馆无关的读者隐私数据,同时,这部分数据也造成了图书馆大数据平台负载激增,应尽量过滤、删除,以提高大数据的价值及安全性[11]。
3.3 应用软件、图书馆集成应用管理系统数据安全管理
图书馆整个数据中心的运转,都是靠软件去支持的。软件是否安全,直接关系到整个图书馆电脑运转及全部数据信息的安全。因此,图书馆应该主动购买各种正版软件,包括系统软件和应用软件,特别是防病毒软件。图书馆集成应用管理系统是图书馆每天要使用的管理平台,包括馆藏资源的查询、文献资源建设、读者服务等,每天都会产生大量的重要数据。该系统的安全与稳定,对于图书馆数据中心而言,就是重中之重。目前,国内约有半数以上的图书馆使用的是汇文文献信息服务系统,该系统各模块功能相对完善和稳定。
3.4 加强图书馆数据安全管理的评估与改进
数据安全管理制度是否真正建立健全,是否得到认真贯彻落实,相关制度、程序和举措是否符合数据安全管理的体系标准,针对这些问题,图书馆应该制定科学的评估机制,对数据安全管理制度与具体实施方案的适用性和执行情况进行全方位的评估打分。评估工作要每年进行一次,从评估目的、评估范围等方面进行全方位规划。最后,针对评估中所发现的数据安全管理制度漏洞、管理执行漏洞等提出整改措施并限时整改。
4 结语
大数据环境下,智慧图书馆大数据及隐私数据的安全保护直接关系到智慧图书馆的建设与发展,关系到读者对智慧图书馆的美好向往及信任程度。如何保护数据安全并提高数据价值是目前图书馆界关心的一个重要问题。为了有效应对大数据安全威胁,图书馆应在管理制度、硬件设备、软件防护技术等方面加大投入,同时,加强人才队伍的管理与培养,这样才能确保大数据安全,为智慧图书馆建设提供可靠的大数据获取和应用服务。