基于区块链的高校图书馆数字资源共建共享模型探析
2021-11-10王柯文杨亚梦
王柯文,杨亚梦
(郑州航空工业管理学院信息管理学院,河南 郑州 450046)
1 引言
近年来,云计算、大数据、人工智能、区块链等信息技术的不断发展,为数字图书馆带来高速发展的机遇。馆藏数字资源是图书馆的重要组成部分,也是图书馆的服务之本。目前,数字资源的所有权一直控制在出版商或数据库商手中[1],尤其是外文数据库存在严重垄断情况,图书馆每年要花费高昂的成本购买各种数据库,完全处于劣势地位。另外,数字图书馆由于管理理念、体系架构、服务机制的不同,缺乏信息资源的合作,造成显著的“信息孤岛”现象[2]。因此,解决数字资源垄断以及打破“信息孤岛”现象,实现数字资源自由流通与共享仍是当前数字图书馆发展中需要解决的问题。
区块链概念一经提出,就受到社会各界的关注,已是目前信息技术发展最前沿应用。目前,区块链技术应用已从货币金融领域扩展到医疗卫生、教育、文化等领域。本文将区块链技术与数字图书馆相结合,利用公有链、私有链以及联盟链构建高校图书馆数字资源共建共享整体架构,分析图书馆数字资源的购买方式以及资源安全共享的有效途径,以期为解决数字资源建设问题提供新思路。
2 区块链技术概述及其在图书馆领域应用的研究
2.1 区块链技术概述
2008年,中本聪发表的论文《比特币:一种点对点的电子现金系统》[3]中首次提出区块链的概念。区块链涉及数学、密码学、互联网和计算机等多种学科,是分布式数据存储、时间戳、共识机制、非对称加密算法、智能合约等计算机技术的新型应用模式[4]。相比其他的信息技术,区块链技术具有去中心化、去信任化、匿名性、安全性、开放性、不可篡改等特征[5],它实现了不需要一个中心机构或者第三方监管机构来协调、验证交易活动,能够在多利益主体参与的场景下以低成本的方式构建信任基础。也正是区块链的这些特性能为数字资源建设与共享带来新思路。
目前,区块链技术按照开放程度可以分为公有链、私有链、联盟链等类型[6]。公有链是指任何个人或团体都能自由参与,且能够获得区块链的有效确认,任何人都可以参与其共识过程;私有链的写入权限仅限于组织内部,可以是一个公司,也可以是个人,读取权限有限开放;联盟链的参与主体由构建区块链群体内部指定,其他任何人可以通过区块链开放的API进行限定查询。
2.2 区块链技术在图书馆领域的研究与应用
目前,图书馆领域不少学者针对区块链做了一系列研究与探索。区块链虽然诞生于货币金融领域,但区块链技术在图书馆领域同样也有发展潜力且优势明显,“图书馆+区块链”是发展的新方向[7]。牛勇等人基于区块链从数字资源、纸本资源、知识产权角度分析图书馆的资源建设[8];柳子琳等人探讨了区块链技术对于个人信息保护的适用性[9],并且能帮助图书馆移动用户行为大数据挖掘实现从网络信息服务向价值服务的转变[10],进一步推动图书馆服务升级[11]。
从具体的应用层面看,张忠林等人分析了区块链技术在信息共享、版权保护、身份认证、资源存储、网络众筹五大应用场景[12]。可见学者针对区块链技术在图书馆各业务领域的应用进行了积极探索,涉及图书馆的各个方面。在服务方面,学者探讨了图书馆基于区块链技术阅读云平台的构建[13]、智慧阅读平台的构建[14]、智慧服务的应用[15]、隐性知识采集[16]、机构数据库中的应用[17];在资源共建共享方面,学者探讨了基于区块链的高校图书馆馆藏资源建设[18]、文献采购[19]、电子书出版交易[20]45、基于联盟链的信息资源共享[21];在信息保护方面,学者探讨了基于区块链技术数字版权管理[20]46、用户隐私保护[22]等方面的应用。
上述研究成果为研究区块链技术在高校图书馆数字资源共建共享的应用提供了借鉴,但现有关区块链技术的数字资源共建共享方面研究在整体上较为分散,没有将图书馆数字资源的建设与共享结合起来研究,本文将高校图书馆数字资源的建设与共享相结合,构建图书馆数字资源共建共享整体架构,为数字图书馆的建设提供新思路。
3 基于区块链技术的高校图书馆数字资源建设
本文将区块链技术与数字图书馆相结合,构建高校图书馆数字资源建设的整体架构(如图1所示):该架构从数字资源的公有链、高校图书馆私有链以及高校图书馆的联盟链三个方面进行研究。
图1 高校图书馆数字资源建设的整体架构
3.1 数字资源公有链
数字资源公有链是用于整合高校图书馆的数字资源信息。公有链去中心化的特点,可以实现作者直接与图书馆完美对接,图书馆可以通过区块链实现“图书馆-作者”购买模式(如图2所示),向作者直接购买,无须任何第三方的参与。作者在完成创作后,可自行上传至公有链。公有链基于智能合约技术对其内容、格式、结构以及版权等进行审查,对于审查不通过的予以退回,并告知作者,以保障数字资源质量。对于审查通过的资源进行版权登记确认,资源登记确认后自动传输给知识产权管理部门备案,并将资源加盖时间戳存储在数字资源数据库中。
图2 “图书馆-作者”购买模式
3.2 高校图书馆私有链
私有链具有完全中心化的特点,适用于机构内部数据管理,中心机构控制写入权限,选择性对外开放读取权限,并且能够防止数据被篡改。高校图书馆私有链数字资源管理机制如图3所示。
图3 高校私有链数字资源管理机制
将购买的公有链数据库中的数字资源加密上传至高校图书馆私有链上,写入权限归高校图书馆所有。同时,图书馆还可以通过智能合约选择性地对资源使用者开放读取权限。如高校图书馆可以选择仅对本校师生开放读取权限,或者对全体社会人员开放读取权限等。用户接入图书馆私有链首先进行权限验证,符合图书馆开放读取权限的用户持密钥和私有链上的元数据向高校图书馆中心机构发送请求,中心机构通过对请求中资源信息解密并在数据库检索,之后将真实资料提取给用户。另外,高校图书馆还能将使用本馆数字资源用户的相关行为数据存储在私有链上,这些数据包括用户检索数据、浏览数据、下载数据等。这些行为数据指导本馆馆藏资源采购、管理,是图书馆大数据分析的基础。通过对用户的行为数据分析,为用户提供更好的个性化服务。
3.3 高校图书馆联盟链
联盟链的参与主体由构建区块链群体内部组织或个人确定,通过确认后的新节点才能加入联盟链,它具有部分中心化的特点。过多的高校图书馆加入联盟链会影响联盟链整体运行效率,因此可以按照地域划分选出每个地域具有代表性的高校作为高校图书馆联盟链的成员。为保证数字资源安全共享,高校图书馆将数字资源的元数据上传至联盟链上,将真实数字资源储存至数据库。其他高校图书馆要获得该数字资源,需要通过身份认证之后发送请求至数字图书馆联盟服务层,服务层通过对请求中资源信息解密生成哈希值,根据哈希值在数据库检索,获得真实数字资源存储位置,提取资料,整理传给需求方,从而获取真实数据资源,再将真实数字资源存储在高校图书馆私有链上,有效保障数字资源在高校图书馆间安全共享。其数字资源共享过程如图4所示。
图4 数字图书馆资源共享过程
4 模型优势分析
4.1 扩大数字资源来源,降低采购成本
该模型利用区块链技术实现图书馆直接向作者购买数字资源,图书馆充当了为读者实现联合资源购买的角色。同时,公有链开放性的特点能够有效扩大数字图书馆数字资源的来源量,并且利用智能合约技术有效保证资源质量,更好地为读者服务。图书馆可以根据本馆的特色购买特定的资源,打破传统“打包”购买模式,降低了图书馆采购资源的成本。此外,数字图书馆还可以从数字图书馆联盟链获取本馆所需数字资源,无须采购,只要按照联盟链上的协议进行操作即可,极大降低了图书馆的采购成本。
4.2 保护数字资源版权,保障所有者权益
该模型利用区块链技术能够很好地解决数字资源版权问题。首先,不管是接入公有链的作者、接入高校图书馆私有链的用户还是接入高校图书馆联盟链的高校,其身份信息必须公开透明,且不可篡改,保证了身份信息的真实性和准确性。其次,作者提供的数字资源在进行版权确认登记后,所有用户均可见版权信息,保证数字资源版权的独特性与权威性。另外,通过时间戳保证链上数字资源可追溯,避免重复资源的上传登记以及传统资源交易中出现的版权纠纷问题,从而保障资源所有者权益。最后,在私有链和联盟链上,只有被授权的用户才能通过密钥解密出真实资源,获取真实数字资源,有效保护数字资源版权。
4.3 保障数字资源安全性
数字资源的安全性体现在数字资源的完整性、不可篡改性等方面。区块链采用分布式存储技术能够实现图书馆数字资源多重备份,这样极大保证了数字资源的完整性。另外,区块链上出现的交易信息均是由建立在非对称加密算法之上的分布式共识机制来完成的,使数据信息一旦写入就无法篡改。而私有链和联盟链真实数据资源访问开放权限由高校图书馆和联盟链成员控制,没有其授权信息无法从数据库提取出真实数据资源,从而保证了数字资源的安全。
4.4 保障馆间元数据互操作性
数字图书馆元数据互操作性是指由不同的组织制定与管理且技术规范不尽相同的元数据环境下,要向用户提供一个统一的数据检索界面,确保系统对用户的一致性服务[23]。而该模型中的联盟链很好地解决了这一问题。联盟链中的数据共享是通过哈希值来进行的,查找真实数字资源位置是通过哈希值计算来识别对应交易区块的。哈希值能够将不同描述体系的元数据统一起来,实现不同元数据体系下元数据之间的交换。这就使得异构图书馆元数据方面达成统一标准,保证数字图书馆馆间互操作性,从而打破“信息孤岛”现象。
5 结语
本文基于区块链技术构建了图书馆数字资源建设共享整体架构,利用区块链分布式存储、共识机制、智能合约等技术以及去中心化、不可篡改等特点,满足作者与高校图书馆资源之间购买关系需要以及高校图书馆和资源使用者之间、高校与高校之间的数字资源自由流通、安全共享,打破“信息孤岛”。