大数据环境下数字图书馆个人信息的安全保护研究
2016-04-12姚志红银川市永宁县图书馆宁夏银川750100
姚志红(银川市永宁县图书馆,宁夏银川750100)
大数据环境下数字图书馆个人信息的安全保护研究
姚志红
(银川市永宁县图书馆,宁夏银川750100)
[摘要]简要介绍了大数据与数字图书馆个人信息,分析了大数据环境下数字图书馆个人信息泄露的主要途径,以及数字图书馆个人信息存在安全威胁的原因,提出大数据环境下数字图书馆个人信息的安全保护策略。
[关键词]大数据数字图书馆个人信息安全保护
[分类号]G250.76
大数据时代的到来在提升信息处理效率的同时,也让个人隐私问题成为舆论关注的焦点。数字图书馆服务与个人信息密不可分,而个人信息属于个人隐私的重要部分。数字图书馆通过对用户信息进行收集、分析、整理,能够制定符合不同层次用户需求的服务策略。大数据时代多样化的技术提升了信息存储与传播效率,让个人信息的获取与利用变得更加简单,但也加大了维护个人信息安全的难度。数字图书馆若无法有效处理与利用个人信息,极易出现个人隐私被泄露或侵犯的问题。当前数字图书馆应该不断完善个人信息保障机制,为用户提供全方位的个人信息安全保护。
1 大数据与数字图书馆个人信息分析
1.1大数据的概念
大数据是随着高新科技发展逐渐形成的,目前还没有统一的定义,属于较为抽象的概念。Gartner根据大数据的特征,将其解释为采用全新的数据处理模式形成的,增长速度快、决策力强、优化能力强的信息资产。而一些研究者认为,大数据就是数量庞大,超过常规数据处理工具处理容忍度的数据集。总之,大数据规模巨大,类型丰富,蕴含极大的数据处理能力与较高的应用价值。
1.2数字图书馆个人信息
数字图书馆服务中涉及很多个人信息,大致分为账号信息、行为信息、基本信息以及私密信息等(见表1)。其中用户个人信息主要用于身份识别,也包括图书借阅、参考咨询以及馆际互借等信息。这些信息对于读者而言比较重要,应用价值也较高[1]。用户在数字图书馆访问网络资源产生的信息就是用户行为信息,包括浏览网页、聊天记录、位置信息等,这些信息能够在一定程度上反映用户的兴趣爱好、阅读习惯等。用户存储于云端的个人信息,以及邮件、日记等信息比较私密,称作私密信息,若泄露将给用户带来极大的困扰。
类别
用户基本信息
描述
可识别个人身份特
征的信息
用户行为信息用户账号信息用户私密信息
网络行为记录账号、密码等信息私密的沟通信息
特征
包括姓名、性别、工作单位、借阅记录等,处于半公开状态访问网站、应用软件等网络操
作生成的信息支付账号、社交网站账号等较为私密不愿公开,或者涉及
个人名誉的信息
2 大数据环境下数字图书馆个人信息泄露的主要途径
大数据环境下数字图书馆的信息管理,主要包括对数据进行存储、分析、收集等,数据是数字图书馆服务的重要支撑。但是数字图书馆在对个人信息进行管理的同时,也应该关注隐私保护问题,了解个人信息泄露的途径与原因,进而制定有针对性的防护措施。
2.1数据管理活动中的泄露
数字图书馆通过分析、处理大数据,能够获得清晰、直观的报表,明确各项设备、资源的使用情况。同时数字图书馆借助数据管理,还能够发现运营中存在的问题,得到相应的服务诊断,或者为完善业务流程、信息安全预警机制提供参考,以提升数字图书馆的信息服务质量。但在数字图书馆开展数据管理的过程中,若出现操作失误,或任何一个环节出现纰漏,都很容易导致用户个人信息泄露。同时数字图书馆目前还存在部分无法确定管理权的数据,若对这些数据进行处理,很容易与用户隐私产生冲突,也增加了个人信息泄露的风险。例如,一些图书馆为了催促用户尽快还书,将用户信息公布在图书馆网站上,这种做法是不可取的。
2.2公权行使与信息服务阶段的泄露
国家信息安全管理部门出于执法的需要,有权要求信息机构或个人提供数据信息,并且可以在法律允许的范围内对个人信息进行监控。数字图书馆作为公益性信息机构,自然需要配合政府部门的工作。例如,美国自2001年制定《爱国者法案》后,就赋予了FBI对各大图书馆的运营情况进行监督的权利。但是在政府部门行使公权的过程中,很容易引发数字图书馆个人信息泄露。用户个人信息是数字图书馆的基础性资源,也是数字图书馆改善组织、服务机制的重要依据[2]。数字图书馆通过分析特定群体的个人信息,能够了解他们的特点与信息需求,进一步提升服务质量。但是在这个过程中,由于大数据存在复杂的关系与结构,若挖掘过度将增加个人信息被窃取的风险。
2.3恶意攻击引发的泄露
数字图书馆个人信息中存在较多敏感因素,这也是吸引黑客攻击的原因。近年来,国际社会频频出现由于黑客攻击导致信息泄露的事件。黑客可以利用图书馆网络系统中存在的漏洞,对个人信息进行拦截、修改或窃听。也可以避开系统安全防护体系,从管理后台窃取用户数据库,或者采用植入木马的方式长期窃取个人信息。数字图书馆在引入先进技术提升服务效率的同时,也增加了用户个人信息的安全威胁。例如,数字图书馆引入云存储技术以提高用户信息存储容量,但在将个人信息迁移至云服务器的过程中,很容易给黑客可乘之机。此外,用户使用的智能终端也可能导致个人信息泄露。黑客可以对手机等智能终端进行远程控制,进而拦截用户的传输数据或个人信息。目前很多用户喜欢借助手机访问数字图书馆网页,若此时被恶意攻击,很容易导致邮件、通信记录等信息丢失。
3 大数据环境下数字图书馆个人信息存在安全威胁的原因
大数据时代各种信息处理技术的应用,以及物联网、云计算技术的发展,让人们的所有轨迹均可以数据的形式记录并存储下来。通过大数据技术能够迅速掌握用户的爱好与需求,进而对服务与产品进行优化调整。但是大数据环境下各种先进技术的应用,在描述社会发展形式、分析用户行为特征的同时,也增加了个人信息曝光的风险。
3.1用户个人信息被全方位监控
大数据环境下出现了各种先进技术,如信息检索、电子监控、物联网等。多样化数据信息的交叉、集成与互联,也逐渐形成了“全视之眼”。借助大数据技术可以对人们的行为举止等进行数字化处理,并变成能够长期存储的数据[3]。若大数据技术被不法分子利用将给恶意攻击提供机会,也增加了个人信息的安全威胁,如图1所示。数字图书馆为满足信息服务需求,需要对用户信息进行搜集整理,以形成系统、全面的信息数据库。一方面,大数据环境下数字图书馆收集用户信息的方式更加多样化,收集范围更加广泛,收集内容也更加丰富,包括视频、音频以及图片等。另一方面,数字图书馆通过与其他信息机构合作,能够获取更多用户信息,以提升数据的使用价值。但是数字图书馆的这种数据管理与运作状态,导致用户个人信息处于全方位监控中,极大地增加了被暴露、拦截或窃取的风险。
图1 大数据环境下个人信息的安全威胁机制
3.2用户对个人信息的管控能力减弱
根据我国网络信息安全中心提供的数据,2014年遭遇信息安全问题的网民超过70%。大部分网民对如何保障个人信息安全毫无办法,甚至在出现个人信息泄露后也不知道如何补救[4]。大数据的出现让信息变得越来越透明,而公众也逐渐失去了对个人信息的管控能力。数字图书馆在大数据环境下并没有明确规定个人信息的使用、监督与管理权,这就容易引发用户个人信息滥用等问题。数字图书馆在收集整合个人信息后,若这些信息被第三方机构控制,如企业、社会信息机构等,将很难保障个人信息的安全性。
3.3个人信息的商业用途增多
个人信息中存在商业基因,并且与商业决策、商业活动等存在一定联系。目前出现了很多专门从事个人信息等数据研究的机构,以为产品销售、市场预测等提供参考。数字图书馆作为非营利性机构,对用户个人信息的收集整理本是非功利性的,但不排除被不法分子用于谋取私利的可能。此外,一些与数字图书馆合作的企业、社会机构希望掌握用户信息,进而在分析用户行为、需求的基础上获取更多利润,也增加了信息泄露的风险。
4 大数据环境下数字图书馆个人信息的安全保护策略
大数据改变了数字图书馆的信息服务环境,但也让个人信息面临巨大的安全威胁。数字图书馆在引入数据存储、数据挖掘等大数据技术的同时,也应该重视对用户个人信息的保护,制定有针对性的安全保护策略。针对大数据环境下数字图书馆信息服务的特点,笔者认为可通过健全法律法规、制定有针对性的保护措施以及提高馆员安全意识等方式,并加强各方面的配合,以形成综合性的个人信息安全保护体系(如图2)。该体系将用户个人信息置于中心,构成了三道安全防护壁垒,让数字图书馆用户毫无顾虑地获取信息服务。
图2 数字图书馆个人信息安全保护体系模型
4.1健全个人信息安全保护法规
数字图书馆要想真正保护个人信息安全,必须有相关法律法规的支持,这也是完善个人信息安全保护体系的基础。大数据环境下,个人信息保护已经成为全球共同关注的问题[5]。国外一些国家十分重视对个人信息的保护,并且制定了完善的图书馆法规与个人信息保护法规。例如,英国于2000年出台的《信息自由法案》,要求图书馆在为读者提供信息服务时应加强个人信息保护。通过对英国数字图书馆门户网站进行调查,发现有超过140家数字图书馆在网站首页给出用户个人信息保护声明。我国目前在图书馆个人信息保护立法方面涉及较少,但是公众对个人信息保护的愿望十分强烈。这就需要我国加快立法步伐,结合国情及时制定有针对性的行政法规,遏制由于公众信息泄露而引发的不良事故,为数字图书馆用户提供有力的法律保障。2015年两会期间我国出台了关于个人信息保护法的议案,相信很快就会形成健全的个人信息保护法。此外,数字图书馆也需要依据行业规范与个人信息保护法规,制定相应的个人信息保护措施,切实落实个人信息安全保护工作。
4.2提高馆员的用户信息保护意识
无论是数字图书馆制定的规章制度还是国家制定的相关法律法规,都难以解决所有的问题,更多的是需要道德机制的约束与配合。数字图书馆在个人信息安全保护方面,不仅需要依靠法规政策,还需要依靠道德约束,即人的自律性。这就要求数字图书馆提升馆员的个人信息安全保护意识,增强他们的自律能力,并从道德修养的角度对馆员的服务行为进行约束。一些国家在制定图书馆规章方面,也突出了个人信息保护的重要性。如英国制定的图书馆行为守则中就规定“图书馆员不得泄露或默许他人泄露读者信息”[6]。首先,数字图书馆应该努力强化馆员的法律意识,充分尊重读者权益,进而自觉做好用户个人信息保护工作。其次,数字图书馆应该树立以保守用户信息为荣的理念,让馆员在潜移默化中增强意识,在实际工作中根据需要调用用户资料,严格控制用户资料的使用范围,做到不随意收集、丢弃或者泄露用户资料。第三,要求图书馆员提升业务能力,避免由于业务不熟练或由于操作不当引发的用户个人信息泄露。
4.3选择有力的保障措施与技术手段
数字图书馆应该引入强有力的技术手段,以减少个人信息威胁,强化个人信息的安全保护。积极引入有线网络、无线网络安全防护技术,如用户身份认证、PET隐私技术等,并且通过信息安全培训,让馆员了解数据备份、加密以及限定存储等隐私保护技术的具体应用方法。同时数字图书馆可以借鉴美国在个人信息认证方面的经验,构建个人信息认证监督机构,专门负责对数字图书馆的个人信息进行监督、审核、评估等。对于达到要求的网站设置个人信息保护认证标志,对侵犯个人信息的网站进行屏蔽,避免用户访问时发生信息泄露。这样不仅可以帮助数字图书馆用户识别网络资源,减少出现个人信息泄露的概率,也可以提升数字图书馆的信用水平。此外,数字图书馆应该结合大数据环境下的信息服务特点,制定科学的数据管理策略,赋予用户个人信息知情权,对敏感度高或比较私密的个人信息,可以鼓励用户参与监督。对于识别度较高的个人信息,数字图书馆可以采用数据过滤技术,将其从大数据中过滤出来单独进行存储管理,以避免泄露。也可以将用户个人信息提交至云存储端,依据个人信息的密级进行分类存储,实现物理与逻辑的隔离。
5 结语
大数据时代为数字图书馆提供了良好的发展机遇,也促进了数字图书馆的服务转型。但是个人信息安全保护、知识产权保护等问题,极大地影响了数字图书馆信息服务质量的提升。当前数字图书馆应深入分析大数据环境下用户数据流的特点,借助各种隐私保护技术与防护措施,在提高信息服务质量的同时保障个人信息安全,进一步提升用户对数字图书馆的信任度。
参考文献:
[1]张建中,钟慧敏.基于云计算的图书馆云服务及其安全问题浅析[J].高校图书馆工作,2012(2):67-69.
[2]冯登国,张敏,李昊.大数据安全与隐私保护[J].计算机学报,2014(1):246-258.
[3]廖晓虹.云计算对个人信息保护的法律风险研究[J].特区经济,2013(6):143-146.
[4]易斌.高校图书馆读者隐私保护现状实证研究[J].图书馆论坛,2013(3):65-68.
[5]孟小峰.慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013(1):146-169.
[6]邵丽萍,杨笛.大数据时代的用户隐私保护方法探讨]J].北京电子科技学院学报,2014(3):20-24.
姚志红男,1965年生。大专学历,助理馆员。研究方向:数字图书馆信息安全研究。
收稿日期:(2015-11-18;责编:王天泥。)