区块链在图书馆中的应用研究
2022-05-24王跃虎天津理工大学图书馆
王跃虎(天津理工大学图书馆)
2016年,区块链成为技术应用的研究热点,并作为战略前沿技术被写入国家信息化规划[1],区块链的应用也从金融行业向图书馆等其他行业渗透。目前,区块链在图书馆中的应用研究涵盖了图书馆的发展、建设、管理、业务和服务等主要方面,并扩展到知识产权法规、公共服务体系、知识生态系统等方面。区块链的兴起使图书馆有机会重新认识自身,对推动图书馆发展意义重大。这种认识升华在图书馆发展史上有过多次:在计算机、数字文档兴起后,重新认识图书馆并提出了无纸图书馆、电子图书馆等新概念;在互联网和Web兴起后,对比Web1.0、Web2.0模式提出图书馆1.0、图书馆2.0模式;在云计算、移动互联网、智慧城市等兴起后,重新认识自身并推出了移动图书馆、智慧图书馆等新式图书馆。
但是,相关研究也有不足。图书馆行业对区块链的功能、特性和运行把握不够充分,多侧重原理的介绍和应用设想,还停留在泛泛而谈的层面[2];对比区块链系统,图书馆行业还未形成对图书馆本质、服务和发展的新认识,这是决定图书馆未来能否在区块链推动下变革发展的关键;图书馆行业尚在探索区块链的应用场景和方式,缺乏实验支撑,与区块链在金融、物联网、供应链、存证等领域的火热应用状况相比,国内外鲜有图书馆主导开发、实施并落地的区块链项目。以上这些原因制约了区块链与图书馆的融合,阻碍了基于区块链的新型图书馆的应用和建设。因此,本文将研究区块链在图书馆中的应用方式,以期为构建基于区块链的图书馆发展奠定基础。
1 区块链的分类及其功能应用分析
1.1 区块链的分类
区块链是一种分布式总账、一个去中心化的数据库,是由记录有交易数据的区块,按时间顺序首尾相连而形成的链式数据结构[3]。区块链系统基于对等网络(P2P),由共识机制生成区块并保证区块数据不可更改,且通常拥有代币。
区块链系统分为区块链1.0、2.0、3.0三个发展阶段,即数字货币、智能资产和以去中心化自治公司(DAC)、去中心化自治组织(DAO)等构成的智能自治社会[4-5]。按照开放程度、管理方式可将区块链系统分为公有链、联盟链和私有链:公有链也称非许可链,对所有人开放,无须授权便可加入,不受任何人控制、管理,常用于去中心化;联盟链和私有链属于许可链,对许可的组织和人员开放,需授权才能加入,联盟链由若干个组织共同参与、控制和管理,链上数据的读写权限按照联盟协议和规则分配,私有链由某个组织控制和管理,链上数据的写权限被限定在该组织内[6]。
区块链系统的完整架构包括数据层、网络层、共识层、激励层、合约层、应用层,前三层为底层,是形成区块链所必需的,后三层是上层,并非必须[7]。一个区块链系统若无激励层,即无代币及其发行和分配机制,缺少激励系统有效运行和持续发展的内生动力;若无合约层,即无各类脚本代码、算法机制、智能合约,无法通过编程实现丰富的应用功能;若无应用层,即无应用的场景和实现,不能体现系统的巨大实用价值。
按照共识机制,可将区块链系统分为五类:基于工作量证明(POW)的区块链,如比特币区块链,交易速率慢;基于权益证明(POS)的区块链,如以太坊2.0区块链,交易速率较快;基于股份授权证明(DPOS)的区块链,如初期的EOS区块链,交易速率很快;基于PBFT/SBFT、PAXOS/RAFT等算法的区块链,如Hyperledger Fabric区块链,交易速率很快;基于其他共识机制的区块链,如重要性证明(POI)、参与度证明(POP)、资产证明(POA)、烧毁证明(POB)、验证池(Pool)、有向无环图(DAG)等共识机制[8],交易速率较快;基于混合共识机制的区块链,即同时采用了两种及以上共识机制,如采用BFT+DPOS的新版EOS区块链。共识机制决定了系统的去中心化、安全性、交易速率等关键特征和性能,并影响代币性质。按照脚本系统,区块链系统分为区块链1.0和2.0,前者的脚本系统是非图灵完备的,功能较弱,为类似Forth的基于栈的脚本系统;而后者的脚本系统是图灵完备的,功能较强,为可执行智能合约的虚拟机。脚本系统决定了区块链系统的适应性、灵活性,区块链3.0与2.0在脚本系统上相同。此外,也可按照代币种类划分区块链系统类型[9]。
1.2 区块链的功能分析
1.2.1 区块链的功能特征
(1)区块数据不可更改,即区块经最终确认上链之后,区块数据只能查,而不能做增、删、改等编辑操作。区块数据的不可更改是由共识机制及其实现保证的,任何人都不可更改,与其他信息系统中由角色和权限实现的数据不可更改本质不同。若处在运行的区块链系统之中,则无法控制区块链,无法修改区块数据。
(2)区块按顺序单向一维递增。新增数据以新区块的形式追加到链尾,区块链不断增长,成为记录历史的链条。运行中的区块链具有顺序性、持续性、单向一维性、不可逆、不受控制等与时间相同的特性。不受控制的、顺序单向一维递增的区块链是一种虚拟世界中的人造时间,当不依赖现实世界而单独在虚拟世界中描述事物及活动时,须借助此类时间,从而使虚拟世界中的价值及其度量等与区块链相关联。一个区块链系统必须是时间系统,其代币才有潜力成为某种货币,而是否为时间系统取决于共识机制及其实现。
(3)区块形成交互大数据。区块链主要记录用户之间交互的信息而非交互的内容。有别于Web网站、博客、微博等内容分享系统,eMule、BitTorrent等P2P文件分享系统,QQ、微信等即时通信系统,区块链系统更像一个简单记录用户之间通话情况的通信系统。区块链系统是基于结构化数据的P2P交互大数据系统,与具备多样、大量、高速、价值、真实性等特征的经典大数据系统有所不同[10]。
1.2.2 区块链的控制
要控制区块链,就要控制区块链系统,利用其共识机制、分叉机制,主动采用共识攻击方法等,以重建主链方式间接达到编辑区块数据、更改和控制区块链的目的[11]。
作为时间系统的区块链系统,其参与者、开发者、社区等都无法控制区块链系统。要控制区块链系统,就要控制其赖以运行的整个底层环境,使其成为运行在局部的可控环境中的信息系统。对于全球范围内参与、运行的公有链,难以使其运行环境局部化、可控化,因此其极难被控制;对于局部范围内参与、运行的联盟链、私有链,其运行环境是局部的、可控的,因而可以被相关联盟组织、机构或个人控制。所以,公有链与许可链本质不同,公有链不受控制,不属于任何人,其持续正常运行须依赖自身的某种激励机制,激励机制的核心是代币及其价值的产生、发行和分配,而许可链能被控制,属于相关联盟组织、机构或个人,其持续正常运行可不依赖代币,而依赖于控制者、管理者。
1.3 区块链的应用分析
1.3.1 区块链的应用
区块链推动互联网从“信息互联网”向“价值互联网”变迁[12],区块链系统的基本应用就是作为价值传递工具实现价值交换、流动。典型例子是实现商品交换中的价值交换(见图1)。
图1 区块链实现价值交换
区块链系统实现线上的价值交换,而非线下的商品实际交付。利用这类工具能形成基于区块链的交互信息系统。
区块链系统的深层应用,是作为分布式自动化工具实现分布式自动化服务。区块链2.0是典型的分布式自动化工具,合约账户、智能合约及执行合约的虚拟机是其三个关键部件[13]。利用这类工具开发去中心化应用(DApp),能形成分布式自动化服务系统,进而形成不同层次和自治程度的DAC、DAO(见图2)。其中,线下的实体智能资产也可以是线上的数字智能资产。
图2 区块链实现分布式自动化服务
1.3.2 区块链的应用模式
区块链有三种应用模式,P2P应用模式、B2C应用模式、数据库应用模式(见图3)。
图3 区块链的三种应用模式
P2P应用模式即C2C应用模式,是区块链的原生应用模式,是一个对等的开放系统,最能体现区块链的特征和优势;B2C应用模式是区块链适应C/S、B/S等中心化应用环境而形成的模式,此时区块链系统是一个分层开放系统,在服务者与消费者之间存在由权限形成的层次边界;数据库应用模式,是将区块链当作一个安全可靠的分布式数据库,此时区块链系统是一个与外界隔离的内部底层系统。
2 图书馆分析
2.1 图书馆的分类
抽象地看,静态的图书馆是一定质量和数量的文献集合,动态的图书馆是可支配文献的借阅。在组成上,馆藏文献是图书馆的核心,决定图书馆的分类和演化;在行为上,馆藏文献的借阅服务是图书馆的核心功能。提供服务而非产品,将图书馆同书店等区分开来。按照馆藏文献的形式,图书馆分为实体图书馆和数字图书馆。就系统而言,实体图书馆量变形成的数字化图书馆是一个包含信息流和实物流的、线上线下两部分的混合信息系统;而数字图书馆是一个仅包含信息流、只有线上部分的单纯信息系统(见图4)。两者是抽象图书馆的不同实现,必然会影响区块链在图书馆中的应用。
图4 两类图书馆
2.2 图书馆的位置
馆藏文献通常来自图书采购,在由作者、出版商、发行商、零售商和图书馆、读者构成的图书产业链中,图书馆处于下游位置。以图书馆为基准,图书产业链为B2B2C商业模式(见图5)。这对实体图书馆、数字图书馆均适用。
图5 图书产业链的商业模式
2.3 图书馆的模式
图书馆与读者形成B2C商业模式,反映在图书馆信息系统上就是C/S、B/S结构应用系统。图书馆是典型的中心化服务机构,并从图书馆1.0向2.0、3.0持续发展。理论上来讲,图书馆1.0、图书馆2.0分别符合Web 1.0、Web 2.0[14],若有图书馆3.0,则应符合Web 3.0。
Web 1.0模式是指Web与用户之间为单工通信模式,用户仅是消费者,用户之间不能经由Web交互;Web 2.0模式是指Web与用户之间为半双工通信模式,用户交替担当消费者和服务者,用户之间经由Web并借助内容的生产、存储间接交互,比如博客、微博系统。由此趋势推断,Web 3.0模式应该是指Web与用户之间为双工通信模式,用户同时是消费者和服务者,用户之间应经由Web直接交互,不借助内容存储。HTTP协议基础上的Web系统很难实现双工通信模式,难以在用户之间实时地直接通信、交换数据和文件,而QQ、微信等即时通信软件以及eMule、BitTorrent等P2P应用软件,都已经实现。因此,Web 3.0模式不再是Web应用,而是P2P应用。Web 3.0基础上的图书馆3.0,实际应该是P2P基础上的图书馆3.0——连通文献服务者和消费者的P2P服务平台。以虚拟化和分布式技术为基础形成的云服务,将大量的服务端聚集到云服务平台,使云服务平台成为服务中心的中心。
3 图书馆中的区块链应用
3.1 应用的目的和范围
将上述分析结果结合应用区块链的目的和范围,可获得区块链在图书馆中的应用方式,并就应用方式来探讨现实问题。
图书馆应用区块链有两个目的:①利用区块链改进图书馆信息系统,提升某个功能及性能,此为浅层应用,区块链系统仅是子系统;②利用区块链重构整个图书馆信息系统,即构建基于区块链的图书馆,实现图书馆3.0,此为深层应用,区块链系统是主系统。
从图5可知,图书馆应用区块链有五个不同范围:实现图书馆各部门的联结和交互;实现图书馆之间的联结和交互;实现图书馆与读者的联结和交互;实现图书馆与出版商、发行商的联结和交互,若图书馆涉及出版[15],则还包括作者;实现包括读者在内的整个图书产业链的联结和交互。它们对应着区块链在图书馆
中的五种应用方式。
3.2 五种应用方式及初步实现
(1)区块链被完全封闭在图书馆内,符合区块链的数据库应用模式。该区块链是典型的私有链,用于记录馆内各部门之间的交互,如图书、设备、工具等在部门之间的流转,这些交互均为馆内交互,不涉及所有权和价值转移,所以对交易速率、共识机制无特别要求,通常无须代币,只需实现区块链底层即可,用合适的区块链开源代码就能很好地实现,可选择的区块链较多。在这种应用方式中,区块链系统位于图书馆信息系统的数据层,读者不能直接访问。
(2)区块链被限制在图书馆联盟内,符合区块链的P2P应用模式。该区块链是典型的联盟链,用于记录各馆之间的交互,如馆际互借、文献传递等。由于各图书馆有联盟协议约束,对交互速率无特别要求,但涉及价值转移,所以最好有代币,从而利用合适的区块链开源代码也能方便地实现,可选择的区块链较多。在这种应用方式中,区块链系统是联系各个图书馆信息系统的纽带。
(3)区块链延展到图书馆外,符合区块链的B2C应用模式。该区块链是典型私有链的变体,形成分层区块链系统,用于记录读者与图书馆的交互,如图书借还等。这些交互影响着图书馆服务的效率和品质,所以对交易速率和共识机制要求较高,应当选择基于POS、DPOS、PBFT等共识机制或经扩容技术改进的交易速率快的区块链。因为涉及价值转移,所以必须有代币。在这种应用方式中,区块链系统可被读者直接访问,并围绕借还服务重新形成图书馆信息系统。其中,读者无权记录交易,这可以通过限制读者仅拥有轻节点和轻钱包客户端实现,图书馆拥有完全节点、钱包服务器节点、挖矿节点、路由节点等全部类型的节点,从而拥有全部权限,提供受控环境。在这种应用方式中的图书馆能被图书馆联盟替代,实现各馆的图书、阅读工具的借还,此时的区块链是典型联盟链的变体。
(4)实现图书馆后端B2B部分。此时图书馆实际为消费者角色,所以这种应用符合区块链的B2C应用模式,是典型私有链的变体。第四种应用与第三种应用的区别是:前者由C端主导实现,用于服务或资源聚集,出版商、发行商的权限被限制;后者由B端主导实现,用于服务或资源分发,读者的权限被限制。这种应用在实现时对区块链的要求和选择类似于第三种应用,而图书馆信息系统中的图书采购子系统会被区块链系统取代。这种应用中的图书馆也能被图书馆联盟替代,此时区块链是典型联盟链的变体。这种应用还有变体,即图书馆或图书馆联盟同上游企业共建共享区块链系统,形成典型的联盟链。
(5)区块链覆盖包括读者在内的整个图书产业链,且不受图书馆、图书馆联盟等控制,符合区块链的P2P应用模式,该区块链是典型的公有链。这种应用中作为文献、信息、知识中心的图书馆,由于区块链的去中心化而消失,取而代之以无中心的公有链系统,该公有链系统作为图书提供者和读者交互的平台,承载图书馆的基本职能和服务,重构了图书馆及其信息系统。在这种应用方式中,要求区块链支持快速实时交易,共识机制与第三种应用类似,并要求代币具有货币属性。这种应用的实现是技术问题,也是营销和社会问题。
总之,图书馆通常是中心化服务机构,拥有基于Web的典型的中心化、实名制信息系统。区块链的第一、二、四种应用是对图书馆中心化信息系统的部分改进,不涉及图书馆本质,只是原图书馆有所改变;第三种应用是对图书馆本质的新实现,将图书馆中心化信息系统重构为分层去中心化信息系统,原图书馆勉强保留;第五种应用也是对图书馆本质的新实现,将图书馆中心化信息系统重构为去中心化信息系统,原图书馆消失。
3.3 实现当中的关键问题
3.3.1 图书出租的实现
区块链支持匿名交易,因此对区块链及其应用的分析和探讨均基于读者匿名制。
在实体图书馆中,基于读者实名制实现图书出租很简单,而基于读者匿名制实现图书出租,即图书借还,则是个问题。读者匿名条件下,纸质图书借还可利用代币来实现,用押金驱动读者还书,即借书时读者向图书馆支付一定数量的代币作为押金,还书时图书馆向读者退还一定数量的代币,这就要求代币具有货币性质,否则不能驱动读者还书。此外,可将纸质图书包装成智能资产并注册到区块链上,图书馆拥有其所有权,然后编写并部署图书智能资产的租用智能合约,读者可向该智能合约支付代币触发合约执行,从而获得对应图书智能资产的使用权,租期结束后该图书智能资产重新锁定以待再次出租。这就要求区块链系统至少支持智能合约,且图书能包装成智能资产。
在当前条件下,数字图书的出租与零售均为生成并发送数字拷贝的过程,所以在读者匿名条件下,数字图书借还比纸质图书借还更容易实现,只需读者向图书馆支付图书出租费用,图书馆向读者发送数字图书拷贝即可。也可以将数字图书包装成智能资产,实现真正的数字图书借还。目前,馆藏纸质图书的数字化、信息化、智能化程度处于条码+磁条+RFID芯片阶段[16],将其包装成智能资产很困难,而馆藏数字图书更易包装成智能资产,加之智能合约的限制,因此在实体图书馆中深度应用区块链比在数字图书馆中更难。
读者匿名结合实名也能实现图书借还。在许可链中,可将读者在区块链上注册的匿名账户与在图书馆中注册的实名账户进行关联,读者的匿名账户就变成实名账户的化名账户,无须代币就能方便地实现图书借还。这相当于在读者实名制基础上实现图书借还,此时区块链被实名化、中心化,其优势、应用的价值和意义就被削弱了。
3.3.2 图书的存储和检索
馆藏纸质图书由图书馆存储并在线下流通,借出后由读者保管;智能资产化的纸质图书是智能自治对象,由图书馆和读者存储、保管,在线下受控流通;馆藏数字图书则不同,由图书馆存储并在线上流通,须在线存储、检索、访问。由于区块链只存储交互的信息,数字图书无论以智能资产或以数字文档形式存在,都不适合存储在链上,而应当存储在链下。在链下,数字图书可由所有者存储在本地或第三方联网存储系统中,如云存储空间、星际文件系统(IPFS)等。相应的区块链客户端较复杂,是区块链钱包和P2P数字图书共享客户端的集成。
以智能资产形式存储的数字图书是唯一的、可识别的和可控的,但是无法有效区分以数字文档形式存储的数字图书的原本和拷贝,也不能有效区分出租原本和出售拷贝行为,即数字图书馆和数字书店的模式和行为难以区分。因此,在数字文档式数字图书的基础上应用区块链实现数字图书馆,要求区块链客户端在检索数字图书时,应能定位到该数字图书的原本而过滤掉其他读者保留的拷贝,否则整个系统将无法最大限度地保护数字图书版权方的权益,且会与知识产权方面的现行法律法规发生冲突。而在传输数字图书时,仍然能利用该数字图书的全部拷贝为传输提供便利,但区块链客户端中该检索功能的实现是个难题。
3.3.3 代币分发及系统运转
单由区块构成的区块链仅是一种数据结构,需融入共识机制、激励机制等才能形成区块链系统并运转起来,而借助代币在参与者之间实现价值传递,区块链系统才能有效运转和自激发展。区块链系统运行,初始为如何分发代币,后续为如何维持代币流动,都须仔细考虑。在区块链的五种应用方式中,第一种无须代币,其余四种都涉及代币,且第五种必须有代币。获取代币有三种途径:参与挖矿或铸币;提供服务或产品,消费者支付;用法币兑换[17]。当然,他人赠予也能获得代币。
图书馆与读者为服务者与消费者关系,读者向图书馆购买服务并支付货币,免费服务是收费服务的特例。区块链系统中的交易是收费的,即便免费服务,也需消耗某种代币。以区块链的第三种应用为例,在图书馆构建的变体私有链系统中,读者受约束,不能以挖矿、铸币而获得代币,目前,用法币兑换代币是读者获得代币的主要途径,因而实现第三种应用还须有代币交易机构。类似地,要实现第四种应用,也须有代币交易机构以便图书馆用法币回购代币。在第五种应用中,公有链系统上的每个参与者都能通过挖矿、提供图书出租服务、兑换等途径获得代币,而提供图书出租服务是多数参与者获取代币的主要途径。若代币价值稳定,则系统就在持续有效运行基础上平稳发展;若代币升值,则会刺激系统在持续有效运行基础上迅速发展。
3.3.4 交易种类的规制
区块链五种应用方式中的前四种中的交易是固定的、受控的,这也是许可链的特点,许可链限制了参与者及其权限,也限制了交易种类;而第五种中的交易是多样的、不受控的,这也是公有链的特点,公有链不限制参与者,也不限制交易种类,是对具体交易的高度抽象。因而,借助以太坊区块链等公有链或者主导构建公有链来实现第五种应用,交易种类都会超出图书借还,且难以规制,交易信息上链后也无法删除修改。这个难题需利用数字内容的链下存储并结合其他方面来统筹解决。因此,最好在智能资产基础上实现区块链的第五种应用,但即便这样,实际中仍然可能存在不适当的违法交易。
4 区块链应用的再分析
各大公有链的实际运行中都存在某种中心化现象,存在形成核心网络及分层体系的趋势。从区块链的应用发展来看,受制于“不可能三角”,即安全性、高效性、去中心化三者不可兼得[18],区块链系统从单层网逐渐转化为两层网,即顶层的支持货币与代币兑换、货币流通的货币区块链和底层的支持商品、服务实时交易的交易区块链,如比特币区块链及其分化出的闪电网络,以太坊区块链及其上的DApp网络,主链及其上锚定的侧链,母链及其子链等。区块链的完整应用体系正在形成(见图6)。
图6 区块链的完整应用体系
货币区块链只有一个,以安全性、去中心化为特征,应为公有链或联盟链,其上的代币才是货币。而交易区块链为数众多,以高效性、去中心化为特征,多为由B2C模式实体转变成的许可链和一些用作具体交易的公有链。一个参与者至少在一个交易区块链上作为服务者获得代币,而在其他交易区块链上作为消费者支出代币,交易区块链之间的协调和代币兑换由货币区块链自动完成。货币区块链还可能分层,形成若干局域的货币适配区块链,在货币区块链和交易区块链之间做性能适配。
图书馆中应用区块链将形成交易区块链,未联结货币区块链,相应跨链技术也不成熟、规范,并且读者只参与一个支出代币的交易区块链系统,所以还须有代币交易机构等辅助设施,且须考虑代币初始分发和持续流动问题,并涉及货币、金融、经济等方面的政策法规,从而提升应用区块链的难度。在非金融领域中应用区块链,大多都面临这种状况,显然当前普遍应用区块链的社会环境尚未成熟。
5 结语
区块链系统是由价值驱动的去中心化的自激励信息系统,原生支持P2P或C2C商业模式,其形成、运行和发展都充分利用了技术和经济两种手段。图书馆是基于可支配文献及其出租的中心化服务机构,符合B2C商业模式。在图书馆中应用区块链就是在B2C模式中应用P2P模式,而区块链的B2C应用模式就是在P2P模式上实现的B2C模式。对图书馆而言,第三种应用的实践价值和意义最大,最值得图书馆尝试;对区块链而言,第五种应用的实践价值和意义最大,能整合整个图书产业链,直接打通图书供给和消费,系统更易形成、运转和发展。就区块链在图书馆中的应用及未来基于区块链的图书馆而言,对数字图书馆会比对实体图书馆的影响更大。当前,在图书馆行业及图书产业链之外,已有一些组织在推动数字内容交易相关的区块链项目,如LBRY、IPFS的Filecoin、YOYOW等,尝试将内容生产者、内容所有者、内容消费者等联结起来,在功能和定位上涵盖了区块链在图书馆中的第五种应用。实现区块链在图书馆中的应用,应当特别关注IPFS,IPFS是一个基于P2P的分布式版本文件系统,本身与区块链无关,可作为数字文档、数字智能资产等的理想存储。将区块链与IPFS结合,有望解决链下数据的存储、检索和传输问题,在P2P网络中形成“区块链+数字内容”的融合结构,支持并简化区块链系统的实现。
当前国内图书馆缺乏应用区块链的真正尝试,更没有主导构建公有区块链系统用以重构整个图书产业链。宏观原因在于普遍应用区块链的社会环境不成熟,构建有代币的区块链系统风险很大。中观原因在于对区块链的掌握和对图书馆的认识不足,找不准区块链与图书馆的融合点,另外应用区块链重构图书馆信息系统代价大而收益小,且缺乏推广和运营区块链系统的经验。微观原因在于区块链技术仍在快速发展,如共识机制、智能合约、扩容技术、跨链技术等,并由此造成技术更迭、淘汰及出现各种伪区块链,给技术选定带来困难,其次区块链应用中也有技术需要突破,如智能资产、检索功能、交易规制等的实现技术。数字化图书馆、数字图书馆分别是混合信息以及单纯信息系统的典型代表,区块链的三种应用模式和在图书馆中的五种应用方式,以及应用中的几个问题,都能推广到其他非金融行业和相应产业链中。