区块链技术在图书馆数字资源版权保护中的应用*
2022-04-26张龙
张 龙
(黑龙江省图书馆,黑龙江 哈尔滨 150090)
大数据时代的到来全面影响着人们存储信息、传递信息的方式。图书馆结合形势,将工作重心转移到提供多元化资源和服务中,大规模、高质量数字资源库的建设,三微一端等多渠道服务模式的普及都极大地提升了读者对数字资源的需求。
区块链是近些年来极为热门的前沿技术名词,区块链技术被认为是未来十几年对金融、物联网、医疗等诸多领域产生影响最大的“黑科技”之一。据《2020-2021年中国区块链产业发展研究年度报告》显示,即便2020年遭受新冠疫情的冲击,我国区块链产业增速仍为33.7%,远超全球区块链产业增速,是全球区块链产业发展最大的国家之一[1]。2021年我国政府工作报告明确提出“加快数字化发展,打造数字经济新优势”。区块链作为数字经济发展的基础设施之一必将发挥重要作用,而图书馆作为率先应用新技术的知识服务行业,定会深受影响。充分利用区块链的技术特性,在网络环境中更好地保护图书馆数字资源版权,具有重大的现实意义。
1 区块链应用于图书馆数字资源版权保护的技术特性
对于区块链,各个领域并没有统一的定义,最早关于区块链的描述出现在2008年由化名为中本聪所撰写的比特币区块链白皮书中,该文献重点讨论比特币系统,实际上并没有明确提出区块链的定义和概念。从技术的狭义角度定义,区块链指的是一种通过哈希指针构建的数据结构;从组织形式角度定义,区块链是一个去中心化的数据共识协议;从现实应用角度定义,区块链是多种技术有机整合后的应用模式[2]。
总体而言,区块链是通过密码学、点对点网络通信、共识算法、智能合约等多种技术的有效组合,构建数据存储、流转和处理的新型分布式计算架构,保障在不通过第三方中介机构信用背书条件下,实现数据的不易篡改、不易伪造、可追溯、可审计等特点。
1.1 去中心化的分布式结构
区块链构建在分布式网络基础之上,在图书馆数据中心,如图1所示,不是由第三方权威机构来负责记录进而管理,而是分散在网络中的每一个节点,如图2所示。每一个节点都有一个该资源的副本,所有副本同步更新,体现了去中心化的特点。这样一来,即便某个节点遭受攻击,网络依然可以继续运行,确保了数字资源的安全性。
图1
图2
1.2 智能合约
智能合约就是一套以数字形式定义的承诺,参与方需要依据这个承诺来执行,这里的执行不需要人为的第三方权威或中心化代理服务的参与。在图书馆数字资源版权保护应用场景中,读者在使用的时候,不需要等待图书馆机构的确认就可以完成相关的权利,大大提升了服务的效能。由于智能合约所有的条款和执行过程都是提前制定好的,并在计算机的绝对控制下进行,因此所有的执行结果都是准确无误的,不会出现不可预料的结果。除此之外,也恰恰是因为合约的不可篡改,在资源访问的过程中任何人都不能为了自己的利益而恶意毁约,保证了数字资源的合法性、唯一性。
1.3 非对称加密
作为现代密码学历史上最伟大的发明,非对称加密技术很好地解决了对称加密算法需要提前分发密钥的问题。非对称加密过程中,加密和解密分别对应公钥和私钥,公钥公开,人人可以获取,比如数字资源的基本信息;私钥个人自己持有,不能被他人获取,比如资源创作数据信息。加密机制如图3所示。虽然加密速度慢,但是在图书馆具体应用中,读者和资源持有者之间不需要通过建立一个安全信道来进行密钥的交换,密钥空间小,降低了密钥管理的难度。
图3
2 区块链技术在图书馆数字资源版权保护中的应用
随着数字图书馆的发展,大批量优质的数字资源对读者免费开放,其中不乏极具地域特色的原创性资源,而大多数原创作者的版权并不会被登记。虽然知道盗取作品的事经常发生,但由于传统版权登记费用昂贵、流程复杂,所以其作品通常处于一种无保护的状态,导致侵权行为频频发生,原创作者的作品时刻处于被盗取的风险之中。区块链可使著作权的获得、授权、追踪、保护、回溯、评估变得简单直观[3],密码共识机制借助于密码授权和区块链存证等功能,可以进一步对数字资源的确权和版权保护提供更有效的服务,因此,数字资源版权保护也是近年来区块链落地应用的重要领域。
2.1 时间戳记录和保护数字资源版权
与传统的版权登记相比,申请时间戳保护省去了复杂繁琐的登记流程,缩短了申请的周期,它是一个能够证明原创作者的作品在一个时间点已经存在、完整、可验证、具有法律效力的电子凭证。时间戳好比数字资源的“电子身份证”,有助于对原创作者的作品“验明正身”。对于原创作者来说,一方面,可以宣示作品的主权,有效震慑恶意盗取版权的人;另一方面,能够作为维权举证的重要利器。
具体操作中,原创作者可以通过计算机或者手机等智能设备登录网站,然后将已经完成制作的数字资源进行上传,或者在资源创作的过程中登录网站,这样网站会记录下每一次修改,这些修改记录也会作为唯一的凭证存储在区块链系统数据库中。首先利用哈希运算将数字资源生成哈希值,即y=hash(x),因为区块链的特性是隐藏原始信息的,在每个节点的交易过程中,只需要验证各个节点的信息值,不再需要对原始的数字资源进行验证,只需要传输哈希值即可。虽然计算量大,但函数参数为string类型,且固定大小输出,计算高效。其次利用用户的私钥对哈希值进行加密生成数字签名,然后将哈希值、数字签名和身份公钥一起记入到一个区块中并加盖时间戳。如果这个时候有人想篡改某一个区块的某一个数字资源,那么根据哈希函数,哈希值也会发生相应变化,这样后面所有的哈希值都需要重新计算,那么需要把篡改之后的每一个节点的打包密钥都破解,而破解密钥是一件难上加难的事情,如图4所示。
图4
原创作者申请时间戳保护以后,每一个数字资源都会获得唯一的凭证,也可以申请可信时间戳将资源登记备案,同时为数字资源生成唯一的二维码。将二维码附着到图书馆官网相应资源的页面,亦或是微信平台资源板块,读者通过扫码就可以了解到原创作者的信息以及资源创作的数据,也更有利于将数字资源进行推广。
2.2 智能合约完成数字资源使用授权
图书馆数字资源在得到有力保护的前提下,更应发挥其传播价值,这也是图书馆作为文化传播中心的职能所在。作者完成数字资源的版权登记以后,通过区块链技术下的智能合约来完成资源的自动化授权,这里的授权是结合图书馆读者的角色来进行区分的。针对于青少年读者,平台会将适合儿童使用的资源开放,并提供阅读、下载、分享等权限,将其他资源隐藏,或是仅供部分阅读;针对于老年读者,平台会在资源库中筛选出健康、养生相关的主题资源,同时提供相应的权限;针对VIP读者,平台则不会做出限制。所有具体的使用方式,由图书馆进行统一管理。合约规则的明确,避免了资源的作者与使用者因为沟通不当而导致的矛盾,同时保证了创作者的资源不被非法使用,读者的需求得到满足。在这一过程中,每一个资源的访问都会有记录,极大地保障了数据的安全性。
在具体的操作中,首先每个读者或是作者都需要注册成为区块链的用户,区块链会返回给用户一对公钥和私钥,公钥就是用户的账户地址,私钥则为操作该账户的唯一钥匙。其次,读者和原创者根据需要会签订一份承诺,承诺中会涵盖各方的权利和义务,利用智能合约语言将其数字化,并编码。在这里所有的用户需要用各自的私钥进行签名,以确保智能合约的有效性。最后将签名后的智能合约通过P2P网络扩散并部署到区块链上。当有用户发出使用指令即智能合约满足触发条件以后,将自动执行数字资源的访问方式,且使用过程同步记录,实现数字资源版权使用的公开透明,不可篡改。
2.3 非对称加密实现版权交易
在图书馆数字资源版权保护中,焦点问题是版权不明。清晰的版权是数字资源服务大众的基础,非对称加密则使得版权变得明晰。在图书馆与原创者之间的版权交易主要运用了区块链的非对称加密技术,凭借非对称密码,区块链系统能够在不泄露私钥的前提下,让私钥持有者拥有地址所代表的数字身份,并用私钥对这个地址的交易行为进行签名授权,这从根本上解决了大规模去中心化系统的决策问题,实现了从原创者到图书馆的点对点版权交易,最后将交易指令、签名通过互联网广播出去,一传十、十传百,几秒钟整个网络都会传遍,交易内容无法篡改且公开透明,在保证资源安全的同时也简化了交易流程,降低了交易成本。目前我国已构建出诸多基于区块链的版权交易平台比如“原本”平台、“人人链”平台、小犀版权链等。以“原本”平台为例,作品只要在“原本”平台中保存,“原本”会快速生成八位字符构成的“原本DNA”。“原本DNA”基于非对称加密技术、数字签名技术及可信时间戳技术,能够对原创作者的作品权进行认证。如果原创作者的作品被侵权,“原本DNA”可以很容易地指出作品的最早发布时间及最早发布作者,成为作者进行维权申诉证据,从而保护原创作者的版权,为原创者赢回利益和保障。
3 区块链在图书馆数字资源版权保护中的挑战和建议
3.1 挑战
3.1.1 区块链自身问题
不可否认,最近几年区块链技术得到了长足发展,尤其是很多区块链创业公司的探索应用,都在市场上取得了不错的效果,但需要承认的是,作为新兴技术的区块链必然有诸多不成熟的地方,亟待自我完善和理性质疑。
首先,区块链最为人诟病的一点无疑是对于资源的严重浪费,在图书馆数字资源版权保护领域表现的更为明显。一般比特币区块链的一笔交易清算与结算需要10分钟,对于记录了所有版权登记和交易更庞大的信息量,10分钟肯定会让大笔交易被积攒[4]。对于公共图书馆来说,世界读书日期间在微信平台以及官网推介自己的品牌资源,这个时候资源的访问量是惊人的。对于高校图书馆来说,每年的毕业季大量的毕业论文需要上传,短时间信息量的急剧增加无疑会造成网络拥堵。对于图书馆来说,存储资源的区块节点的体积越来越臃肿,带来的存储和计算负担自然也会越来越重。
其次,如前文所说,在图书馆数字资源版权保护的具体应用过程中,我们在区块链上存储的并非是真实的加密数据,而是存储哈希值,用这些哈希值来等价代表链上的数字资源。此方法操作简单,可以追踪数字资源所有权,不可篡改,有效保护隐私,因为数据本身是链下的,网络节点并不能看到。但缺陷是数据会被加密存储,这使得数据的读取和查询灵活性欠佳,如果有人做了不被允许的调整,那么只能通过对比链上和链下的哈希值,才知道数据有问题。另一个缺陷是商业逻辑和数据许可不能在链上执行,只能链下,这给数字资源的实际保护带来了一定不便。
3.1.2 监管与政策的制约
区块链技术正处于概念和理论的高峰期,仍未大规模正式应用,尤其在我国图书馆界。图书馆是文献资源建设中心、行业发展指导中心、专业人才培训中心,更是一个地域历史文明与科学文化成果的传承中心[5],需要更安全、更成熟的技术体系来支持,而区块链的安全性与成熟度都有待检验,并没有相应的技术标准可供参考,也没有充分的市场竞争来验证。同时,对于区块链技术,监管层的态度尚不明朗,在发展过程中需要政府支持与引导的区块链,暂时还缺乏一个“强力推动者”。区块链在我国图书馆数字资源版权保护中的标准仍没有建立,例如国内首个将区块链技术应用于版权行业的“原本”应用平台,国内首家数字产品交易平台“人人链”,首个联合版权局、公证处和产业基金组建的版权链联盟等。各平台对数字资源版权未达到统一标准,使得资源的公信力降低。
3.2 建议
3.2.1 加快区块链标准制定
随着区块链应用趋于广泛,制定统一的区块链标准已经成为各界的普遍共识。2016年9月,ISO成立了专注于区块链领域的标准技术委员会ISO∕TC307,中国、英国、美国、日本、德国等国家都在区块链国际标准化方面做了一系列工作。我国工信部同年发布了《中国区块链技术和应用发展白皮书2016》,明确了区块链标准化建设的相关意见,2017年工信部又发布了《区块链和分布式账本技术参考架构》,这是政府指导下国内第一个区块链技术基础标准[6]。虽然工信部在制定区块链行业标准上已取得初步进展,但区块链技术开发和部署缺乏标准化引导等问题仍然十分突出,尤其在图书馆数字资源版权保护领域,加快建立图书馆区块链标准委员会,更好地为我国图书馆数字资源产业服务势在必行。
3.2.2 完善相关体系建设
在法律法规方面,由于对区块链技术缺乏充分认识与预期,政府相关法规和制度的建立较为滞后,导致当今市场发展盲目,缺乏监管,基于区块链的图书馆数字资源保护缺乏必要的政策保护与法律规范。我国公共《图书馆法》第四十条已有明确规定,国家构建标准统一、互联互通的公共图书馆数字服务网络,支持数字阅读产品开发和数字资源保存技术研究,推动公共图书馆利用数字化、网络化技术向社会公众提供便捷服务。区块链在数字资源版权方面的应用与已颁布的图书馆法相结合,能够切实解决行业中的痛点,保证区块链技术在图书馆领域落地。
数字资源版权保护仅仅依靠法律手段还远远不够,图书馆也应加强体系建设作为补充保障。各图书馆应制定数字资源版权保护规章,通过制度约束读者资源使用行为,并在馆内设立专门的版权保护部门,由懂技术、知规范、有责任的图书馆员来负责日常的版权保护工作,保障各种工作的有序开展。
3.2.3 加大技术研发投入
尽管从长期来看区块链拥有光明前景,但目前仍处于初级发展阶段,距大规模应用还有一段距离,还需要在共识机制、智能合约、安全算法、隐私保护、扩容和速度优化等相关技术领域实现持续创新和突破。除此之外,还应该加强图书馆数字资源版权与区块链技术的复合型研究,这样才能为图书馆数字资源版权保护提供理论支撑。
3.2.4 强化版权保护意识
各级图书馆要充分意识到数字资源版权保护的重要性,将版权保护工作加入日常工作中,并量化到单位年度考核,尽最大努力避免数字资源侵权行为,从而保护版权人的合法利益。除此之外,要利用图书馆的宣传优势,结合馆内讲座、特色展览、专题书展、电子宣传演示、三微一端推送等方式,多渠道、多角度推广版权保护的重要性,促使广大读者和作者共同遵守法律法规,营造良好的阅读环境。