APP下载

智慧图书馆模式下读者隐私技术保护研究

2020-10-09安蓓

科学与信息化 2020年26期
关键词:智慧图书馆

安蓓

摘 要 智能技术的开发和应用使得图书馆数据价值得以充分转化,但是数据价值在挖掘时也导致读者的隐私被侵犯。对于智慧图书馆而言,在数据挖掘时建立读者隐私保护十分重要,其是智慧图书馆提供优质服务的基础。基于此,本文就智慧图书馆下读者隐私技术保护展开研究,首先阐述了数据安全、智慧服务和数据价值之间的关系,其次对智慧图书馆下读者隐私面临的风险进行分析,最后提出了读者隐私技术保护措施,旨在提高智慧图书馆的隐私保障水平。

关键词 智慧图书馆;读者隐私;隐私保护技术

近年来,随着大数据等技术的发展应用,数据安全问题备受重视,用户信息泄露已经成为常态。尽管当前各国已经就个人信息和隐私保护制定了相关的法律、政策,但是,效果并不好。为了能够解决数据利用时用户隐私被侵犯的问题,相关人员致力于建设社会隐私政策和技术方法结合的隐私保护机制,使数据挖掘和隐私保护能够得到平衡。智慧图书馆下,不仅需要明确读者需求,同时也需要保护读者隐私,在不侵犯读者隐私的情况下充分挖掘相关数据,提供智慧化服务,这是智慧图书馆的发展重点。

1数据安全、智慧服务和数据价值

1.1 数据安全和智慧服务

数据作为基础资源,其是重要生产力。大数据的价值不仅体现在宏观全面性上,同时也体现在微观精确性上,其具有及时性、准确性以及个性化等特征[1]。智慧图书馆通过挖掘读者数据价值,进而为其提供学科服务,以提高服务的精确性。作为智慧服务基础,数据本身的安全和稳定对于智慧图书馆的服务效果有着直接的影响。大数据时代,数据的真实可靠和准确稳定能够为宏观决策提供帮助,也能够将业务动态和社会现象等微观方面反映出来。因此,数据的安全稳定更加重要,用户也十分关注数据的隐私。

1.2 数据挖掘和数据价值

数据挖掘主要是为获取用户在线行为中的真实需求,进而为图书馆开展个性化服务以及相关的管理决策提供有效的参考。例如,图书馆广泛使用的数据统计方法是在线分析处理(OLAP),其特征为设定所需监测数据维度,继而实现动态分析,该处理工作是基于数据库实现的,其与数据挖掘有着不同的适用性,主要差异就在数据挖掘时需要进行假设,OLAP需要验证这些假设[2]。如图1。

为了满足业务分析需求,使用者先设定问题或场景,之后利用OLAP对这些问题进行验证。例如,图书馆管理系统中,借阅信息、资源统计、远程访问等方面的分析都是根据时间轴将借阅量、访问量以及下载量等数据呈现出来的。但是,OLAP的应用也有缺陷,例如业务管理者受到主观影响,无法从整体上将数据规律挖掘出来。在不设定规则的情况下,OLAP无法从多维度上将数据挖掘出来,而人们受制于自身条件,经验主义导致数据挖掘无法得到大创新,因此,围绕大数据挖掘体系建立的数据挖掘与OLAP结合能够实现数据关系模型的新发展[3]。智慧图书馆不仅需要获得OLAP多维度统计保障,同时还需要图书馆业务数据挖掘帮助。智慧图书馆是基于数据价值获取建立的,数据价值和智慧服务形成正向关系。数据价值需要数据安全作为保障,而数据安全中又包含了用户信息隐私,也就是数据隐私。因此,为保证数据隐私,良好的智慧图书馆服务系统需要具备健全的用户隐私保护机制。

2智慧图书馆模式下读者隐私面临的风险

读者隐私包含个人信息和使用记录。其中,个人信息主要包括姓名、性别、年龄、电话等身份信息以及学历、单位、专业等身份信息。使用记录包括了读者的借阅记录、访问的IP地址以及下载和浏览记录等。地理位置信息包括了读者使用的图书馆位置、参与的相关活动以及家庭住址等信息。

2.1 网络图书馆读者隐私风险

(1)数据收集风险

读者利用网络平台访问图书馆,获取资源,并享受相关服务。在此过程中,读者需要登录内部系统,其所提交的信息以及在使用时读者检索和下载的信息都被记录在系统中,这些都是读者隐私信息,其在读者不知情的时候已经自动被后台记录,这就产生的读者隐私安全威胁[4]。一方面,读者在没有被告知且系统也没有给予任何收集信息提示的情况下,读者的个人信息被收集;另一方面,读者缺乏控制权,尽管可以从其他渠道了解到自己信息被系统收集,但是没有可供选择的权利,导致读者无法控制自身信息收集。

(2)数据挖掘风险

智慧图书馆的管理服务实现需要通过数据挖掘技术处理收集的数据,通过数据过滤、组织和挖掘来处理。而图书馆为了能够为读者提供更好的服务,需要跟踪读者的信息以了解读者实际需求,对读者喜好进行预测,这就导致读者需求和行为可能被提前预知,暴露了自己的隐私,进而产生隐私安全风险。

(3)数据传输风险

智慧图书馆平台中,读者在注册或请求服务时,其个人信息、检索信息、浏览和下载记录等信息都会在网络上传输,而网络具有公开性特征,读者信息在传输过程中可能会被非法攻击者窃取、破坏等,进而导致读者隐私安全被威胁。

(4)访问交换风险

智慧图书馆平台中,读者在提出请求、服务器回馈请求时,需要皮肤南存储数据,这些数据就包括读者个人信息。若是网络终端缺乏身份认证和访问控制系统,设备防御性就会下降,攻击者可以操纵木马病毒非法进入到程序,读者隐私就会出现泄漏现象[5]。隐私风险不仅表现在不法分子私自访问系统盗取读者隐私数据上,还表现合法授权的读者无法控制访问权限,导致读者信息出现任意修改现象,使得读者信息不够完整,影响读者使用。

2.2 实体图书馆读者隐私风险

(1)RFID技術管理风险

智慧图书馆中的门禁、考勤等系统都需要RFID技术作为支撑,但是该技术也使得读者隐私面临风险。攻击者利用RFID标签获取其中的信息,了解读者的位置、爱好、身份等信息。攻击者通过采集RFID标签特征获取读者信息。同时,除跟踪读者物理位置,攻击者通过长期观测会建立读者位置的移动轨迹,对用户个人行为进行预测。

(2)监控风险

智慧图书馆为了方便管理,会在实体图书馆中设置全方位的监控系统。在馆内,其会完整将读者的行为习惯和活动情况记录下来,一旦监控系统被非法入侵,或是管理人员自身管理不当,就会使读者隐私被泄露。

3智慧图书馆模式下读者隐私技术保护措施

3.1 网络图书馆读者隐私技术保护

(1)数据收集隐私技术保护

针对该隐私威胁,可以通过建立读者隐私协商保护机制来实现。该技术能够收集读者信息类型、方式等,读者通过自身情况选择保护参数。当前使用的协商机制为EPAL语言以及P3P标准[6]。前者为XML形式化语言,读者能够直接使用标记语言定义隐私保护规则以及策略,描述隐私策略,具有较强的专业性,读者操作难度大,适用于对隐私要求高的人员。后者尽管王福安对隐私策略做出详细的描述,但是能够清楚网站所收集的读者信息和处理方式,同时能够为个人隐私提供保护,读者可以选择收集、处理的信息类型,操作简便,可以用于对隐私要求不高的人员。

当前,智慧图书馆可以应用P3P系统,其能够与网页浏览器绑定,读者利用该浏览器访问内部系统,P3P会在后台自动启动收集用户信息。该系统包括服务器端、客户端两部分。读者利用网站访问图书馆资源,服务器端会按照网站要求生成测量,并用XML形式发送到客户端,之后再传给读者,读者按照需求设定隐私偏好。该系统在默认条件下不可收集读者信息,一旦有收集行为就会禁止该站点进入,或是提醒读者相关的收集和处理情况。如果读者进行了自行设定,系统会对比站点收集的信息和读者设定的标准,一旦有不符行为,会提醒读者,读者可以将隐私设定修改,或是拒绝直接进入该网点。

(2)数据挖掘隐私技术保护

数据挖掘时,为了能够完成信息挖掘和隐私保护双重任务,可以匿名化处理所收集的数据,降低数据发布精度。匿名处理的信息将个性化特征去掉,无法准确定位读者个体,读者个体也会在群体中被隐藏起来,这样不仅能够实现信息挖掘,同时也能够保护讀者隐私。当前普遍使用的匿名技术有K-匿名技术、L-多样性技术。

K-匿名技术就是在信息发布时,先记录发布的信息和已发布的信息,明确二者连接属性,同时将其定位成准标识符QI[7]。之后通过泛化操作准标识符值,准标识符上,每条数据记录都记录了不少于k个的不可区分记录,其构成了QI组。因此,在数据发布之后,其能够连接外部数据,外部数据各个实体会将数据发布到对应的QI组,攻击者需要从中确认隐私信息的概率就会下降,继而起到隐私保护目的。但是,该技术容易被一致性和背景知识所工具,对此,可以增加各等价类敏感值与个体链接难度。

(3)数据传输隐私技术保护

读者信息在网络传输中极易出现非法窃取现象,对此,需要极大传输隐私保护。当前使用的数据加密技术主要为非对称和对称两种加密技术。其中,对称加密是加密与解密秘钥一致,广泛使用的对称加密为DES、3DES、RC2等算法,其运行速度与安全强度有所不同,使用范围也不同,但是大多数使用的都是本地大数据。非对称加密则是加密和解密秘钥不一致,其秘钥分为公开和私有两个,如果公开秘钥加密数据,解密则需要私有秘钥,反之亦然[8]。广泛使用的非对称加密算法为RSA、Elgama等算法,其可以应用在网络通信加密中。

上述两种加密算法相对成熟,但是也有不足,图书馆需要根据实际情况适当选择。

(4)访问交换隐私技术保护

采用身份认证以及访问控制两个技术结合的方式来保护访问隐私。其中,身份认证就是通过对读者身份的炎症是授权读者能够进入到系统中,阻止未经授权的读者进入到系统中。而方位控制则是适当控制合法读者访问权限,进而保护读者隐私,其能够对读者的信息访问范围进行控制,限制相关的操作权限,在保证读者使用系统的同时能够防止隐私被侵犯。

身份认证根据密码设置分成静态密码认证和动态密码认证两种。其中,静态密码认证是用户自行设置的密码,只需要登录时输入即可。动态密码则是由短信密码和动态口令组成的,安全性较高。图书馆可以根据情况选择相应的身份认证方式。访问控制包括入网安全、权限安全、属性安全等多个控制。智慧图书馆下,可以采取入网安全和权限安全这两种方式来确保读者隐私。

3.2 实体图书馆读者隐私技术保护

(1)RFID技术管理隐私技术保护

保证RFID标签安全可以通过改变标签和读者之间的关联实现标签匿名化,例如可移出式(修改式)标签隐私保护技术等。同时也可以随机变化标签ID号确保标签信息不固定,以解决隐私问题。此外,采用访问控制技术授权控制RFID标签读写器,进而读取标签信息,避免不法分子读取信息[9]。也可以通过法拉第网罩来保护读者隐私,利用金属网罩隔离标签,进而保护读者隐私。

(2)监控隐私技术保护

首先,通过图像加密技术对两步等敏感信息进行模糊处理,以保护读者隐私,但是视频处理不可逆。其次,利用隐私信息擦除技术,将其以水印的方式传输进视频内,此过程可逆,原始视频可以被恢复。当前应用广泛的为可逆视频水印技术,该技术通过无损方法在视频信息中嵌入水印,秩序提取水印就能够恢复原始视频,但是在监控视频中用户只能够看到不固定人员信息,只能够在 特殊情况下且经过安全许可授权才能够利用秘钥将水印提取出来,进而恢复原始视频,查看相关信息。智慧图书馆下,该技术可以应用在借阅纠纷中。

4结束语

智慧图书馆下,读者隐私已经成为重点研究问题,本文就读者面临的隐私风险进行分析,进而根据信息安全和网络安全,分析了隐私风险,进而从数据收集、数据挖掘、数据传输、访问交换、RFID技术管理、监控等方面提出了技术保护措施。

参考文献

[1] 陆康.智慧服务环境下高校图书馆读者隐私保护研究[J].图书馆理论与实践,2019(3):18-24.

[2] 王亚莉,马艳玲.智慧图书馆背景下高校图书馆读者服务重塑研究[J].中国多媒体与网络教学学报(上旬刊),2020(2):73-76.

[3] 曹树金,刘慧云.以读者为中心的智慧图书馆研究[J].图书情报工作,2019,63(1):23-29.

[4] 王世伟.未来图书馆的新模式——智慧图书馆[J].图书馆建设,2011(12):1-5.

[5] 储节旺.智慧图书馆的建设及其对技术和馆员的要求[J].图书馆情报工作,2015(15):27-34.

[6] 黄阳.智慧图书馆建设背景下读者服务模式思考[J].传媒论坛,2019,2(6):138-139.

[7] 孙明溪,孙晓宇,刘春琦.云环境中图书馆读者隐私保护技术模型的构建研究[J].科技资讯,2017(27):8-11.

[8] 徐梅.图书馆读者隐私保护探究[J].图书馆研究,2014,44(4):119-121.

[9] 侯松霞.众创空间下图书馆智慧服务模式研究[J].天津商务职业学院学报,2018,6(1):84-87.

猜你喜欢

智慧图书馆
基于新技术的图书馆阅读推广研究
“智慧校园”平台下的高校图书馆智慧化发展研究
基于“互联网+”视阈下的智慧图书馆用户服务
Beacon技术在图书馆信息服务中的应用研究
以人为本的智慧图书馆服务浅析
智慧图书馆样本书库管理的思考
智慧型图书馆中知识服务模型研究
论智慧图书馆的三大特点
公共图书馆弱势群体智慧信息服务模式探析
RFID技术在我馆的应用及其局限性探讨