基于区块链的智慧图书馆用户隐私保护
2019-08-01
当前,大数据、物联网、人工智能、“互联网+”以及无线射频识别(Radio Frequency Identification,RFID)等智能技术陆续兴起,推动了图书馆向智慧化方向发展。用户对图书馆的知识需求日益广泛,如学习交流、信息定制、虚拟参考和知识管理等,促使图书馆向个性化、主动化、智能化和智慧化的深层次信息服务转型,智慧图书馆应运而生,智慧服务随之而来。
智慧图书馆为图书馆界带来生机的同时,也存在许多用户隐私方面的安全隐患。一方面用户必须要向智慧图书馆提供个人基本信息,另一方面智慧图书馆为了能够提供个性化的服务,需要对获取的用户信息进行过滤、分析和挖掘,识别用户的需求倾向。无论用户主动提供的显性信息,还是智慧图书馆通过处理得到的隐性信息,极有可能被不法分子通过网络攻击盗取,进行非法使用和销售,如果不能妥善保存、合理利用,容易导致用户的个人隐私受到侵犯。因此,如何有效保护智慧图书馆用户的个人隐私,提高用户对智慧服务的信赖和支持,具有重要的实际意义。
1 智慧图书馆及用户隐私保护研究现状
1.1 智慧图书馆研究现状
智慧图书馆以提供泛在智慧服务为主,是继数字图书馆、复合图书馆后图书馆发展的一个更高级的形态[1]。智慧图书馆的概念最早由芬兰奥卢大学图书馆的Aittola提出,他认为智慧图书馆是一个不受空间限制,可以被感知的移动图书馆[2]。随着“智慧地球”、“智慧城市”、“智慧社区”和“智慧校园”等智慧概念的提出,我国在智慧图书馆领域开始了更深层次的研究。在内涵上,乌恩认为,智慧图书馆融入了智慧馆员的知识服务,是对高校图书馆的各种信息资源、开放获取资源以及个性化的知识资源等进行深度知识挖掘以及具有分析用户需求功能的专家式的系统服务,是一种高品质、高价值、深内容的高层次服务[3];在特点上,谢芳对智慧图书馆的先进性和开放性、系统化和智能化等进行了详细的阐述[4];在构建模式上,吴娟等人从逻辑架构和物理架构两个层面论述了基于智能服务的智慧图书馆平台[5];而在用户隐私保护上,相关研究极少,只有王家玲对智慧图书馆模式下读者隐私技术进行了研究[6]。综上所述,现阶段对智慧图书馆的研究大部分集中在其内涵特点和服务模式上,只有极少文献探讨了用户隐私保护问题,因此研究智慧图书馆模式下的用户隐私保护问题十分必要。
1.2 用户隐私保护研究现状
图书馆用户隐私保护是指图书馆界对用户在与图书馆有关的活动过程中所产生的个人隐私信息进行人为的和技术上的管理,以便对该用户的隐私安全进行保护,防止隐私信息外泄[7]。现阶段,图书馆用户隐私的保护问题可从法律、技术和图书馆自身3个层面进行研究。在法律层面上,我国与美国等发达国家相比仍有差距,还有待提高。魏翠翠[8]分析了美国各州图书馆法中用户隐私保护条款的内容和特点,认为我国应从“加紧立法进程”“内容上完善”和“时间上与时俱进”3方面建立健全图书馆的相关法规和规章。在技术层面上[9-10],主要有访问控制技术、数据加密技术、差分隐私模型等数据挖掘算法以及身份认证技术等方面的研究。在图书馆自身层面上,彭华杰[11]提出在图书馆设立“隐私馆员”和“算法师”等职位,对用户个人数据开展专业化的管理,并承担解决隐私权争议的任务。国内学者还分别对大数据环境下[12]、云环境下[13]、“互联网+”环境下[14]、数字图书馆模式下[15]的用户隐私问题进行了研究,提出了相应的保护策略。
2 区块链的内涵及其在隐私保护领域的应用
2.1 区块链的内涵
区块链(Blockchain)产生于2009年1月3日,创始人为中本聪[16],是近年来最具颠覆性的新兴技术之一。2016 年,国务院印发的《“十三五”国家信息化规划》首次将区块链技术纳入其中,为区块链技术的发展提供了政策引领[17]。区块链是一种按照时间顺序将数据区块以链条的方式组合成特定数据结构,并以密码学方式保证的不可篡改和不可伪造的去中心化共享总账,能够安全存储简单的、有先后关系的、能在系统内验证的数据[18]。区块链中每个数据区块主要由区块头和区块体组成,区块与区块之间按照时间先后顺序链接成一个完整的链条,即为区块链。每创建一个新区块,即可通过哈希算法与前一个区块相连,这样就创建了一个区块的链条。该链条可以逐个增加区块,同时该区块也可回溯之前的交易信息,以确保数据的安全。区块链是分布式数据储存、点对点传输、共识机制及加密算法等计算机技术在互联网时代的创新应用模式,具有去中心化、去信任、开放性、自治性、信息不可篡改和匿名性等特点,能够通过运用数据加密、时间戳、分布式共识和经济激励等手段,在节点无需互相信任的分布式系统中实现基于去中心化信用的点对点数据共享、协调与协作,为中心化机构普遍存在数据存储不安全及用户隐私易于泄露等问题提供了解决途径[19]。
2.2 区块链在隐私保护领域的应用
随着区块链技术的兴起,隐私泄露问题得到了解决。区块链具有去中心化、匿名性和信息不可篡改等特点,在隐私保护方面具有突出的优势。黄永刚提出区块链技术可使信息由数据转移向价值转移,讨论了医疗在去中心化、隐私保护、基因测序方面的应用并构想相关场景,为电子档案建设带来新的研究思路[20];王继业等人构建了基于区块链的数据安全共享网络体系,实现了企业内部及企业间的数据安全共享[21];章宁等人针对互联网租车场景中个人隐私保护问题,提出了一种基于区块链的个人隐私保护机制[22];陈捷等人以区块链智能合约在智能家居隐私保护中的执行模式为例,证明了区块链在物联网隐私保护中的优势及可行性[23]。在智慧图书馆用户隐私保护问题上,尚无学者结合区块链技术进行研究。本文将区块链技术应用于智慧图书馆用户隐私保护研究,具有一定的创新性。
3 基于区块链的智慧图书馆用户隐私保护方案
3.1 智慧图书馆服务模式及其用户隐私内涵
3.1.1 智慧图书馆服务模式
智慧图书馆的服务模式体现在实体图书馆和虚拟图书馆两方面。信息技术的不断革新为实体图书馆的发展提供了动力,物联网、人工智能、云计算、大数据、可视化及RFID等前沿技术的发展带动了图书管理系统、门禁系统、座位管理系统、自助借还设备以及后台监控系统的实现和运行,为用户提供了各项智能服务;用户需求的不断提升,引领了虚拟图书馆的创新发展,用户可以通过各种网络终端进行知识导航、一站式检索、虚拟参考咨询等,智慧图书馆通过对用户浏览、搜索、下载等个体行为数据的采集和分析,进行精准预测,针对不同用户提供个性化服务。
3.1.2 智慧图书馆服务模式下的用户隐私内涵
关于智慧图书馆服务模式下的用户隐私,主要是针对个性化用户进行研究的,智慧图书馆为用户提供的如信息定制、虚拟参考咨询、知识管理等智慧服务,都是面向用户的实际需求,努力提升用户满意度的服务项目。美国图书馆协会将图书馆用户隐私定义为图书馆有能力对用户的想法、情感、信仰、恐惧、计划、想象和控制等个人信息在不能与别人分享时给予保护[24]。
智慧图书馆模式下的用户隐私主要包括用户的基本信息和行为信息,用户基本信息主要包括用户的学号、证件号、姓名、性别、年龄、联系方式、学历、部门及婚姻状况等。用户的行为信息是指用户在使用图书馆的过程中留下的痕迹,包括用户访问图书馆网络平台的时间、浏览及下载记录,借助自助设备进行的图书借还记录、选座及惩罚记录,进行参考咨询服务过程中的Cookies网站数据存储,以及使用各种数字移动终端服务APP时填写的信息及获取记录等。
3.2 基于区块链的用户隐私保护架构模型
根据智慧图书馆的服务模式及其用户隐私内涵,提出了基于区块链的用户隐私保护架构模型。该模型的体系结构由用户、智慧图书馆和第三方服务商3类主体构成,称为“智慧链”。根据区块链的基础架构,可将智慧链系统分为数据层、网络层、共识层、激励层、合约层和应用层[25],各层的隐私保护机制如图1所示。
图1 智慧链系统隐私保护机制
3.2.1 数据层
数据层封装了智慧图书馆获取的底层数据区块,系统为智慧链创建创世区块(区块链的初始块)。网络节点对带有交易行为的数据块进行验证,运用哈希函数检测前一个区块的信息的完整性,并加盖时间戳,按照时间顺序链接到主链上,形成不可篡改和不可伪造的智慧链数据库。在数据层中,Merkle可信树负责组织智慧链中的交易,基于Merkle可信树的数字签名方案在安全性上仅依赖于哈希函数的安全性,且不需要太多的理论假设,这使基于Merkle可信树的数字签名更加安全、实用。
3.2.2 网络层
智慧链各个区块之间的网络通信是在网络层完成的,网络层主要包括各类网络传输协议及验证机制等。智慧链是一种P2P网络(点对点网络),所有区块共享所拥有的资源。这些资源通过网络提供服务和内容,区块之间可以在去中心化的环境中直接互访,自由交易。
3.2.3 共识层
智慧链中所有的节点在链接之前,分散在去中心化的系统中,因此需要一种有效的共识机制保证这些节点维护的全局账本是相同的。共识层中常见的共识机制包括工作量证明机制(Proof-of-Work,PoW)、权益证明机制(Proof of Stake,PoS)和股份授权证明机制(Delegated Proof of Stake,DPOS)等。本文选取PoW机制负责使智慧链节点的有效性达成共识,并保证区块链的安全性。PoW机制的核心思路是设置一个数学难题,让参与节点求解难题,在求解过程中付出最大工作量(算力)的节点将被选择为记账节点,由此节点生成新的区块,其他节点通过接受此区块更新自己的全局账本[26]。
3.2.4 激励层
激励层主要指经济激励的发行和分配,制定一定的激励措施,激发区块参与智慧链中的安全验证工作。在智慧链中必须激励遵守规则参与记账的节点,惩罚不遵守规则的节点,从而保证系统的良性循环。
3.2.5 合约层
合约层主要包括各种脚本代码、算法机制以及智能合约等。脚本和算法用于智慧链上的区块进行编程,智能合约支持区块之间自动触发执行合约条款,无需人工干预。
3.2.6 应用层
应用层封装了智慧链的应用场景——智慧图书馆的用户信息循环模型,包括数据感知、数据传输和数据管理(图2)。
图2智慧图书馆用户信息循环模型
3.2.6.1 数据感知
数据感知即用户信息的采集和量化过程。这些信息主要包括用户的基本特征数据、网络日志存储的用户行为数据,以及通过RFID技术和智能传感设备获取的用户信息等。
用户使用智慧图书馆后,生成用户数据,智慧图书馆对用户数据进行运算,生成哈希函数,然后用用户的私钥对哈希函数进行签名,生成智慧链上的原始数据,并创建数据存储交易进行广播。同时,用对称秘钥对用户数据和签名后的哈希函数进行加密,然后用用户的公钥对加密秘钥加密,形成消息后发送给用户。
3.2.6.2 数据传输
数据传输是将智慧图书馆通过数据感知采集的数据经光纤网络、无线局域网、RFID网络和蓝牙网络等上传到智慧图书馆数据存储库的过程。用户从智慧图书馆得到自己的数据消息后,验证图书馆的签名,并用私钥解密出智慧图书馆的加密秘钥,从而解密出原始数据,生成新的加密秘钥后重新加密,生成区块数据,然后传输到智慧链上,保证传输的安全性。
3.2.6.3 数据管理
数据管理是指智慧图书馆根据设定的算法和规则,对数据资源进行运算,实现智慧化利用的过程,包括规律发现、行为预测、精准查询、智能定位和数据价值挖掘等。用户设置个人隐私的访问控制权限,任何人要想使用都必须经过用户授权。智慧图书馆(包含第三方服务商)对用户信息管理之前,首先需要请求获取数据的公钥及数据管理需求,用户创建访问控制交易,并向智慧链网络广播该交易,智慧图书馆收到交易信息后,即可获取对数据的应用权限,从而为用户提供智慧服务。
4 结语
本文将区块链技术应用于智慧图书馆的用户隐私保护问题的研究,构建隐私保护模型,运用时间戳、哈希函数、Merkle 可信树及共识机制等技术保证了智慧链的防篡改、隐私加密和安全存储。智慧图书馆模式下用户隐私保护问题的研究意义深远,期待智慧图书馆建设者和区块链技术人才不断创新,研究出更有效的用户隐私保护机制,同时探索区块链技术在智慧图书馆其他领域的应用。