基于区块链的数字音乐版权管理系统
2021-04-20张国潮唐华云陈建海何钦铭黄步添
张国潮,唐华云,陈建海*,沈 睿,何钦铭,黄步添,3
(1.浙江大学计算机科学与技术学院,杭州 310027;2.中央国债登记结算有限责任公司,北京 100033;3.杭州云象网络技术有限公司,杭州 310012)
0 引言
数字产品版权是数字化时代的产物。随着信息技术的不断发展,越来越多的诸如音乐等数字化的作品在网络中被传播、存储与使用。近年来,数字版权侵权纠纷现象频发,引起人们的广泛关注。数字版权就是作品创作者对于数字作品在网络环境下执行存储复制、发行等操作的权利。版权的取得主要有两种途径,一种是自动取得,另一种是登记取得。根据我国的著作权法规定,作品一旦完成就自动拥有版权,即自动取得。为了解决著作权纠纷问题,通常会采用版权登记的方式来明确版权归属[1]。然而,由于网络环境下,音乐等数字作品的传播渠道多、侵权成本低、侵权手段隐蔽等原因,导致目前我国的数字版权行业存在着诸多难题[2-3]:
1)版权确权难。在国家的版权保护中心进行作品的登记周期较长,一般需要20~30个工作日。并且,版权登记需要一定的专业知识,登记者常常需要支付额外的费用委托中介机构进行处理。
2)侵权监控难。在互联网时代,采用人工监测的方式识别版权侵权几乎不可能,而目前的一些自动化监测技术水平有限且侵权网站频繁改头换面,难以跟踪。
3)维权取证难。网络环境下的侵权具有虚拟性、隐蔽性和无空间时间限制性,这让维权取证变得十分困难。
4)版税结算难。在版权利益分配体系中,平台方占据着主导地位,而作品创作者无法在利益分配中获得符合其作品真正价值的等额收益[4]。
2008 年中本聪在一篇比特币论文提出的区块链技术引起广泛关注[5],为解决数字版权难题提供有效解决方案。作为比特币底层的关键技术,区块链是一种由点对点传输、密码学以及共识算法等技术融合组成的新兴互联网技术,这些技术的组合使得区块链上的数据具有不可篡改、公开透明、防伪可溯源的优势特性。区块链已经在金融、供应链、版权保护等领域得到越来越多的关注与应用[6]。区块链技术和数字版权保护具有天然的契合之处。首先,区块链可以建立用户地址和数据对象的硬链接,实现数据确权明确权益归属;其次,链上数据不可篡改、防伪可溯源的特性能为数字作品提供存证性证明以及实现证据固化;最后,自动执行的智能合约可保障交易的安全公平。
当前基于区块链的数字版权保护在学术界已有一定的研究。比如,文献[7]设计了一种基于区块链技术的数字版权保护与交易系统,使用联盟链技术提供数字内容版权登记、跟踪、鉴证、查询、交易等全流程服务的数字版权保护与交易服务;但该文献中仅提及将数字内容的特征值存入区块链,并未针对不同类型的作品说明采用何种数字内容特征值提取技术。文献[8]借助区块链技术并结合数字版权交易场景,设计了一个基于联盟链的数字版权交易系统模型,做了版权注册和版权交易的实现,能够保证版权信息不可篡改性和可溯源性;但该文献主要关注版权交易部分,对于版权登记并无过多的描述。文献[9]针对互联网生态下数字版权问题,在区块链技术基础上提出了一种基于超级账本的数字版权登记模型,主要针对的是以文本形式作为载体的作品登记并且聚焦于版权登记部分。文献[10]基于星际文件系统(InterPlanetary File System,IPFS)与区块链技术建立了一个数字媒体版权和内容保护系统,设计了反映数字媒体文件特点的数字指纹,并将指纹记录到Fabric 区块链中,确保了数字媒体作品的不变性和出处;该文献主要聚焦于版权登记部分,但在系统设计中将数字指纹存储到区块链中会带来区块链的存储问题。文献[11]提出了一种基于改进实用拜占庭容错算法(Practical Byzantine Fault Tolerance,PBFT)的联盟式音视频版权区块链系统。实验结果表明,改进后的新共识算法使系统在共识速度与数据通信次数方面得到了优化;但该文献主要叙述了改进的PBFT,对于音视频版权保护方面叙述较少。文献[12]提出了一种基于区块链信用体系的分布式数字版权管理(Digital Right Management,DRM)机制,主要针对版权交易过程,实现了版权交易过程的不可逆加密记录并对分布式账本的数据结构做了轻量级调整。文献[13]提出了一种基于联盟区块链技术和星际文件系统的去中心化音乐共享模型,实现了音乐的可信存储以及用户的购买等功能。
总体而言,上述研究工作虽然取得了一定进展,但仍存在一些局限。主要表现如下:
1)没有细分作品类型。现有的基于区块链的数字版权保护文献中大多停留在数字版权这个层面进行研究,但数字作品包括了文字、图像、音频、视频等类型,不同类型的版权登记处理方式是不同的,现有文献大多简要叙述,未进行细分。而对于音乐作品的版权保护的文献就更少了。
2)没有全流程的版权服务。大多的文献还是聚焦在数字版权登记这个方面,还有较少的文献包含了版权交易,而对于版权的侵权监控与取证维权则很少出现。
3)没有考虑数字作品的传播推广。现有文献大多采用联盟链技术实现版权保护,虽然剔除了平台方,让作品创作者与购买者点对点交易解决了作品创作者利益分配不公平的问题,但与此同时也失去了平台所起的传播推广作品的作用。这很少在基于区块链的数字版权保护系统文献中被提及。
为了解决当前数字音乐版权管理的问题,本文提出并实现了一个基于区块链的数字音乐版权管理系统。该系统具有以下特点:
1)仅针对音乐领域。本文系统聚焦于数字音乐版权的管理,采用Shazam 算法作为音乐文件的特征指纹提取与相似性比对算法,该算法能够很好地防止盗版作品的上链登记以及识别侵权作品。
2)全流程的版权服务。本文系统包含了版权登记、版权交易、侵权监测、证据固化、音乐生态以及用户管理六大功能模块,涵盖了版权管理的主要环节,让作品创作者能够全方位地管理版权作品。
3)激励机制。本文系统基于VNT Chain 公有链进行构建,公有链具有Token 经济,利用Token 经济结合传统的推广手段能够激励系统用户推广作品,让作品更好的传播。而音乐众筹则可解决音乐创作者前期资金紧缺的问题,激励创作者创作,让整个音乐行业更加繁荣。
本文系统对于规范数字音乐版权管理,激励音乐创作者创作以及繁荣整个音乐行业具有重要意义。
1 关键技术
1.1 VNT Chain
区块链可分为公有链、联盟链与私有链[14]。在公有链中,所有的矿工均可参与共识协商,在联盟链中仅有被选择的节点才可参与共识协商,而私有链的共识协商则是被一个组织完全控制。公有链对所有人开放,能够吸引更多的用户,社区也比较活跃;联盟链可以应用于很多业务场景;私有链则主要被用于公司内部业务。
VNT Chain[15]由全球领先的区块链技术服务商——云象提供技术支撑,采用聚合链架构,包括联盟链、公有链以及跨链三个部分,能够实现数据服务体系与资产服务体系的相互协同和发展。VNT Chain 公有链采用了一种全新的Vortex 共识算法,可达到10 000 TPS(Transaction Per Second)以上。高TPS 可以让系统产生的交易更快地打包并验证上链,为用户提供更好的DAPP 体验。同时VNT Chain 也具备Token 经济,这在系统开发过程中可以实现一些激励机制,让用户更愿意参与进来。
1.2 星际文件系统
星际文件系统即IPFS,它是一个可以创建持久且分布式存储和共享文件的网络传输协议,致力于解决现有超文本传输协议(HyperText Transfer Protocol,HTTP)的不足。IPFS 在存储文件时会先将文件等大小分块,再构建各块的Hash 值并构建文件检索表,这样就可将文件分块存储在分布式的服务器上。在查找时只需输入存储文件时返回的Hash值,IPFS就会根据文件检索表和内部的路由表自动查找并合并各文件块组成原始文件[16-17]。
存储在IPFS 上的数据由于是分布式的具有一定的安全性,且能够较好解决区块链无法存储大数据的问题,但是它需要结合区块链的激励机制来使用户愿意分享它们的磁盘空间,并且发布IPFS 上的内容是被设定为公开的,任何拥有内容Hash 的人都可以访问这些内容,这就带来了一些隐私方面的问题。这些是在基于IPFS 进行系统开发时所需考虑的问题。
1.3 智能合约
智能合约是可以自动执行预先定义规则的一段计算机程序代码,它能够实现价值的存储、传递、控制和管理。在基于区块链技术的系统中,一般采用智能合约来编写业务逻辑并将智能合约部署到区块链上,通过交易命令触发并调用执行[18-19]。
VNT Chain 的智能合约采用C 语言进行编写,提供了Bottle 工具实现智能合约的编译以及JavaScript 语言的API 实现智能合约的部署与调用执行[20]。
1.4 Shazam算法
每一个正版的音乐文件是唯一的,需要用一个唯一的数据去映射音乐文件。目前针对音乐文件唯一性的处理主要有三种方式:1)Hash 算法;2)数字水印;3)数字DNA(Deoxyribo Nucleic Acid)。第一种Hash方式虽然可以唯一地标识一个音乐文件,但是无法做到文件的相似度匹配,也就无法识别出盗版的音乐文件;第二种数字水印方式通过将水印信息嵌入到音乐文件中来确定一个音乐文件,该种方式确实能够防止音乐盗版,但是水印信息的嵌入将会影响音乐的质量以及带来音乐文件存储空间的增加;第三种数字DNA 方式通过提取音乐文件的DNA(数字特征/特征指纹)作为音乐文件的唯一性标识信息,通过DNA 的相似性比对可以防止盗版音乐的版权登记以及实现侵权监测。
本文主要采用数字DNA 方式来对音乐文件进行唯一性确定。基于数字特征的DNA 技术主要依据的数字特征大多是梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC),将MFCC 作为音乐文件的唯一性标识,再对音乐文件之间的MFCC 矩阵进行相似性比对。而基于指纹的DNA 技术主要分为三类:Echo print、Chroma print 和Landmark[21-23]。其中,Landmark 类指纹DNA 技术主要采用的特征指纹算法是Shazam 算法,它是Shazam 公司2003 年提出的。该算法包含了音乐特征指纹的提取与相似性比对两个部分,主要涉及如下三个模块[24]:
1)星状图。星状图可以理解为音乐文件的特征数据。Shazam 算法通过保留音频的频谱极大值将一张复杂的频谱图简化为离散的星状图。频谱的极大值是时频区域内那些值大于所有邻居的点。
2)快速组合哈希。如果直接拿星状图进行音乐文件之间的相似性比对也是可以的,但是速度非常慢。为此,Shazam算法提出了一种以空间换时间的快速组合哈希方法来提高相似性比对的速度。运用该方法后,Shazam 算法将生成真正的音乐特征指纹数据。
3)检索和打分。Shazam 算法会提取用户上传的音乐文件的特征指纹数据,在检索数据库中的指纹数据进行相似性比对并得出相似性分数。最终选择分数最高的音乐作为匹配项。
2 系统需求
2.1 功能需求
基于区块链的数字音乐版权管理系统利用区块链技术为音乐作品提供存证性证明,利用Shazam 算法为音乐作品提供原创性证明。智能合约、链上数据不可篡改且防伪可溯源的特性能够保障交易的安全执行以及侵权证据的真实性,而公有链特有的Token 经济则有利于音乐生态的繁荣发展。本文系统按照业务内容进行模块化分类可分为用户管理、版权登记、版权交易、侵权监测、证据固化以及音乐生态六大模块。各模块及其子模块功能如图1所示。
用户管理模块负责对与用户相关信息的统一管理,包括用户在本文系统的登录注册、完善个人信息以及查看个人相关信息。版权登记模块负责实现用户对自己原创作品的著作权登记,用户可在该模块中对自己的原创作品进行著作权登记或者下载登记好的著作权证书以及原创音乐文件。版权交易模块负责实现用户之间的版权交易,用户在该模块中可出售自己的版权或在版权商城中查看自己感兴趣的版权并进行购买。侵权监测模块与证据固化模块可结合起来使用:侵权监测模块用于帮助用户发现网络中出现的盗版音乐,用户可在该模块中上传网站上的音乐文件进行相似性比对确定是否疑似侵权,如果用户发现网站侵权则可以通过截图、录屏等方式提取侵权证据文件;证据固化模块负责将用户持有的侵权证据文件进行上链存储,为后续的司法维权提供有力证据。音乐生态模块能够实现整个音乐行业的繁荣,解决在去除第三方平台后而失去平台推广音乐作用的问题,对于普通用户可以通过对音乐的推广来获得音乐版权收益的分红,而对于音乐创作者则可以通过出售待创作音乐的部分股权来众筹获取音乐作品前期创作的资金。推广与众筹的行为都可当作一种交易而被记录上链。
图1 基于区块链的数字音乐版权管理系统功能模块Fig.1 Function modules of digital music copyright management system based on blockchain
2.2 非功能需求
一个系统除了为用户提供应有的功能外,还要关注必要的非功能需求,为用户提供良好的使用体验与安全保障。本文系统主要的非功能需求包含如下内容:
1)高效。系统对于用户请求的处理要在较短的时间内完成,响应时间越短,用户体验越好;同时系统在单位时间内可成功传输一定量的数据。
2)安全。系统需要具备一定的攻击防护手段,如IP 限制。对于系统的数据则需要保证机密的数据不被窃取以及非法篡改,同时还要保证合法用户能够正常地使用系统。
3)可扩展。模块化的开发系统有利于系统功能的扩展以及代码的复用。
4)可靠。系统在恢复故障后能够较容易恢复到正常运行。
5)易用。系统界面设计要美观,符合受众的喜好,且系统操作要简易。
3 系统设计
3.1 架构设计
基于区块链的数字音乐版权管理系统的架构可分为三层,分别是前端系统、后端系统以及底层存储,如图2所示。
1)底层存储。系统一共有三种存储引擎,分别是区块链平台、IPFS以及数据库,它们各有优缺点。存储在区块链上的数据具有不可篡改且防伪可溯源的特性,它能够作为司法存证的依据;但在公有链上存储数据是需要消耗燃料的,也就是公有链上发行的数字货币,所以仅把最重要的数据上链存储。本文系统将用户个人信息、音乐版权信息、版权交易信息、维权证据信息以及与音乐生态有关的交易信息存储在VNT Chain 区块链平台上。IPFS 将文件分块进行分布式存储具有一定的安全性,且能够较好地解决区块链的数据存储问题,但任何拥有地址Hash 的用户都可获取该Hash 值所寻址的内容,具有一定的隐私风险。本文系统将音乐文件的特征指纹数据以及用户的维权证据文件存储于IPFS 上。MySQL 作为传统的数据库具有操作简单、访问高效的特点;但是中心化的数据库容易出现单点故障的问题,相较于前面两个存储引擎,具有较高的安全隐患。本文系统将用户的音乐文件存储于本地,并在MySQL 数据库中存储音乐文件的存储路径,这样能够提高音乐文件的读取速度。
2)后端系统。后端系统是底层存储与前端系统的桥梁,实现了系统的业务逻辑,包含智能合约实现与非智能合约实现两个部分。系统业务逻辑的智能合约实现包括用户管理合约、版权登记合约、版权交易合约、证据固化合约以及音乐生态合约;而系统业务逻辑的非智能合约实现包括侵权监测功能的实现以及Shazam 算法的实现,版权登记功能与侵权监测功能的实现需要用到Shazam算法。
3)前端系统。前端系统通过良好的交互界面直接面向用户提供服务。本文系统采用Web 作为前端,主要通过Vue.js框架、Element UI 框架进行构建,并通过Axios 访问后端系统提供的RESTful接口。
图2 基于区块链的数字音乐版权管理系统架构Fig.2 Architecture of digital music copyright management system based on blockchain
3.2 功能模块设计
本文系统一共有六大功能模块,包括用户管理模块、版权登记模块、版权交易模块、侵权监测模块、证据固化模块以及音乐生态模块。除了侵权监测模块外,其余功能模块都需要借助智能合约实现重要数据在VNT Chain 区块链平台上的存储与读取。VNT Chain的智能合约采用C语言进行编写,每个智能合约都需要导入vntlib.h 头文件。本文系统一共有5 个智能合约,包括用户管理合约、版权登记合约、版权交易合约、证据固化合约以及音乐生态合约。下面将对系统的各个功能模块进行详细介绍。
3.2.1 用户管理模块
用户管理模块主要是对用户相关信息进行统一管理,方便用户对这些信息的查看,如图3 所示。其中用户管理合约中记录了与用户相关的个人信息,包括用户在VNT Chain 平台上的钱包地址、用户的版权人姓名以及手机号。用户需先在VNT Chain 官方网站[25]注册钱包,注册完成将会得到KeyStore 文件、密码、私钥、账户地址等信息,这些信息十分重要,用户需要妥善保管。用户在登录系统时需要上传KeyStore 文件以及注册时填写的密码,系统会对用户的信息进行校验,仅当校验成功才允许用户进入系统使用系统提供的服务。
用户在首次登录到系统后需要完善个人信息,主要是版权人姓名以及手机号。版权人姓名用于在版权登记时与音乐文件的标签信息进行比对,以此来初步判断该音乐文件是否是当前用户原创的;而用户的手机号则是在系统出现某些问题时能够与用户取得联系,及时地通知用户。如当存储在IPFS 上的音乐特征指纹数据被破坏时,系统需要通过该手机号联系用户进行音乐文件的重传,以此恢复音乐特征指纹数据;又如当用户在购买版权后可以下载音乐文件,如果系统在校验该音乐文件的内容Hash 与存储在区块链上的值不一致时,则说明系统上的音乐文件已被破环,这时同样需要通过该手机号联系用户进行音乐文件的重传,等等。
图3 用户管理模块流程Fig.3 Flowchart of user management module
3.2.2 版权登记模块
版权登记模块用于实现用户对自己原创音乐作品的登记确权、音乐版权证书的下载以及原创音乐文件的下载,如图4所示。当音乐版权信息存入到区块链后就具备了存证性证明,而本文系统对于音乐作品的原创性证明则采用了三阶段校验:
1)校验音乐文件的内容Hash 是否已在本文系统存在。该阶段是为了防止用户拿已在本文系统登记过的音乐进行版权登记。
2)比对音乐标签信息与上传用户的版权人信息是否一致。音乐标签信息是音乐在制作完成后,音乐创作者嵌入到音乐中的信息,通过比较音乐标签中的音乐创作者信息可以初步确认该音乐是否是用户的。由于音乐标签信息是可以随意修改的,所以系统只能初步进行判断,不能认为音乐标签信息中包含了用户的姓名,该音乐就是用户的。
3)利用Shazam 算法提取部分音乐片段的特征指纹数据与系统的特征指纹库进行相似性比对,判断系统是否已存在较高相似性的音乐文件。该阶段是为了防止用户拿已在本文系统登记过的音乐进行非法修改并进行版权登记。
观察这三个阶段的校验可以发现,系统并不能完全证明用户上传的音乐就是他/她自己原创的,这也是当前区块链无法解决的一个问题,即无法验证用户上链前数据的真实性。本文系统更多地是为用户提供一个在某个时间点拥有该音乐作品的证据,如果有人提出系统中的某件音乐作品是自己被别人非法存证了,那么他/她可以提供更早拥有该件音乐作品的证据,并对非法存证的系统用户提出法律诉讼,如果系统用户真的是拿别人的音乐作品进行非法存证,那么他/她在本文系统不可篡改的存证信息将成为被侵权者依法维权的有利证据。
仅当三个阶段的校验都通过后,系统才允许用户对该音乐文件的存证确权。这时用户可以选择添加该音乐作品的协作者并设置每个人的音乐股权占比,该占比将决定后期的音乐作品收益划分,如果没有协作者,那么用户将独占该音乐作品的股权。
设置好音乐作品协作者之后,系统会利用Shazam 算法提取音乐文件全部的特征指纹数据并存入IPFS 中,之后构造音乐版权信息存入VNT Chain 区块链平台,最后将音乐文件保存到本地并通过MySQL 数据库进行管理,方便版权交易模块中用户的试听以及音乐生态模块中音乐的推广等。除了版权登记外,用户还可在该模块中下载登记证书以及音乐文件。
图4 版权登记模块流程Fig.4 Flowchart of copyright registration module
3.2.3 版权交易模块
版权交易模块通过智能合约实现用户之间的版权交易,如图5 所示。版权的交易可分为版权转让与使用许可两种,前者是音乐创作者将自己的音乐一次性无期限地转让给购买者,后者则是在一定的时间内允许版权购买者使用自己的音乐实现盈利。对于使用许可有以下三种基本形式:
1)独占许可。在独占许可中,版权所有人在许可的时间内不得再使用该版权,更不能再次将版权授予第三方。
2)排他许可。在排他许可中,版权所有人仍保留继续使用该版权的权利,但不能将该版权授予第三方使用。
3)普通许可。在普通许可中,版权所有人仍保留继续使用该版权的权利,也可以将该版权授予任何第三方使用。
为了较好地进行版权交易处理,本文系统按照版权的转让与独占许可方式进行版权交易的设计。版权交易模块可分为版权的出售与购买两个部分。在版权出售中,用户需要先选择要出售的音乐版权以及出售的方式,包括版权转让与使用许可两种,当用户选择使用许可后还需设置出售的许可使用时间。用户在设置好版权出售的金额后即可确定版权出售。系统会调用版权交易合约将版权出售信息存储至VNT Chain区块链平台上并在版权商城中展示。在版权购买中,用户可以先浏览版权商城中出售的版权并进行音乐试听,之后即可选择想要的版权进行购买,系统会检测用户的余额是否足够,仅当余额足够才会执行转账操作并将购买信息存入该版权音乐的版权交易合约中。在转账之前,系统会检测该音乐版权是否经过众筹,如果是则按照股权的分配比例进行转账;否则将检测该音乐版权是否拥有协作者,如果是则按照协作的股权占比进行转账,否则将全部的购买金额转给版权所有者。购买后用户即可下载该音乐文件进行聆听欣赏或者使用该音乐去盈利,如将该音乐作为视频的背景音乐进行视频创作等。当用户以独占许可方式购买的版权到期后,系统将对用户购买的版权进行回收。
图5 版权交易模块流程Fig.5 Flowchart of copyright trading module
3.2.4 侵权监测模块
侵权监测模块用于帮助用户发现网络上的盗版侵权音乐,如图6 所示。该模块有自动监测与手动监测两个部分。自动监测针对比较大型的系统内部设置的音乐网站,用户在选择开启侵权监测功能并设置监测周期后,系统会每隔一段时间爬取这些默认网站上有关用户已进行版权登记的音乐,之后对爬取的每一首音乐进行相似性比对。手动监测则是针对一些小型的网站,用户可以从这些网站上下载相关音乐,并在系统中上传进行相似性比对。如果进行相似性比对的音乐与自己版权登记的音乐存在较高相似性,系统会给出疑似侵权的提示。后续本文系统还将引进律师角色帮助用户进一步确认版权音乐是否被侵权。如果该音乐文件是侵权的,则用户可通过截图、录屏等方式保存比对结果以及网站的页面信息,之后将这些信息在本文系统进行证据固化,方便后续的司法维权。
图6 侵权监测模块流程Fig.6 Flowchart of infringement monitoring module
3.2.5 证据固化模块
证据固化模块与侵权监测模块可以结合起来使用,它们负责将用户的维权证据上链存储,方便后续的司法维权,如图7所示。
图7 证据固化模块流程Fig.7 Flowchart of evidence solidification module
首先用户需要选择被侵权的版权音乐,之后可对此次侵权事件进行文字描述,最后需要上传维权证据文件,如网站未经授权提供音乐下载的截图、系统侵权监测的相似性比对结果等。当用户操作完成后,系统会将维权证据文件存储到IPFS 上,并将构造好的维权证据信息存储到VNT Chain 区块链平台。当用户在后续司法维权时,可以提取存储在区块链上的维权证据数据作为强有力的维权依据,维护自己的合法权益。后续系统将会引入公证机构以及律师角色,公证机构用于对用户的维权证据进行公证,而律师则可以帮助用户进行维权诉讼。
3.2.6 音乐生态模块
音乐生态模块本质上也是一种交易,是一种以音乐创作者为主导的交易,是为了繁荣整个音乐生态、帮助音乐作品更好的流通而存在,如图8 所示。音乐生态模块可分为三个部分,即音乐推广、音乐众筹以及音乐生态市场。在音乐推广中,用户可以选择要进行推广的音乐,在描述好推广任务以及设置好任务完成金额后,即可发布音乐推广需求,系统会将音乐推广信息存储至VNT Chain 区块链平台并在音乐生态市场中展示。在音乐众筹中,用户需要先对待创作的音乐作品进行描述,在设置好众筹金额以及相应的音乐股权比例后,即可发布音乐众筹需求,系统会将众筹信息存储至VNT Chain 区块链平台并在音乐生态市场中展示。而普通用户则可在音乐生态市场中浏览需求,既可以选择接受推广任务赚取费用,也可以接受众筹需求为音乐创作者的前期创作提供资金支持,当该版权进行交易获取收益时,将会按照股权分配比例进行金额的划分。通过音乐的推广与众筹,既能帮助音乐推广,让更多的人知道,又能为音乐创作者筹集前期创作的资金,这不仅能为平台的用户获取收益,更能促进音乐创作者创作的积极性,从而带来整个音乐行业的繁荣发展。而为了保障音乐推广与众筹的安全性,所有的交易信息将被记录至VNT Chain 区块链平台上,用户可以进行溯源查看,当发生某些纠纷时,可以提取区块链上的信息作为证据。
图8 音乐生态模块流程Fig.8 Flowchart of music ecology module
4 性能测试与分析
为了验证系统的性能,本文系统采用的测试环境是配置为CPU Intel Core i5-7300HQ 2.50 GHz 和内存16 GB 的Windows 10 操作系统,安装了VMware 虚拟机搭载Ubuntu16.04系统。系统一共有六大功能模块,其中的版权登记模块是最核心且最基本的功能,该模块是最耗时的,也是最耗存储空间的,因为涉及到了Shazam 算法处理音乐文件以及对音乐特征指纹数据的存储。接下来将对系统的版权登记模块进行测试。
本文系统基于VNT Chain 测试网进行搭建,根据Shazam算法原论文[20]描述的性能测试,10 s 的音频片段已可取得很高的置信度,所以本文系统在进行相似性比对时,将会截取待比对音乐文件10 s 片段的特征指纹数据,而系统构建的特征指纹库则需要提取完整音乐的特征指纹数据。
本文系统对从网上随机下载的50 首不同的音乐依次进行版权登记,这50 首音乐中成功进行版权登记的有45 首,成功率为90%,版权登记失败的5首音乐的文件编号分别是10、22、23、25、27。这5 首音乐都是在通过音乐文件相似性比对后才失败的,所以准确率是100%。版权登记失败的原因都是在提取整个音乐文件的特征指纹阶段无法分配足够的内存导致的系统错误。分析这5 首音乐可知道,音乐时长均在5 min左右,提取全部的音乐特征指纹会很大,这样就会触发系统的过量处理模式,禁止为变量创建该大小的内存空间。后续可通过修改系统配置扩充虚拟内存、将特征指纹数据分批次存储等方式解决该内存问题。
此次测试一共成功将45 首音乐在本文系统进行版权登记,每首音乐所花费的登记时间如图9所示。
在图9中,版权登记花费总时长的斜率约为1.95,也就是说系统每登记确权一首音乐,后续音乐的版权登记时间大约会增加1.95 s 的时间。系统提取音乐文件10 s 时长的特征指纹所花费时间的斜率是0.002 9,这主要是系统性能波动的原因,系统提取10 s 时长的特征指纹大约花费1 s 的时间。系统提取音乐文件全部的特征指纹所花费时间的斜率约为-0.025 3,这同样是系统性能波动所导致的,即每首音乐提取全部特征指纹大约需要花费22 s的时间。系统进行相似性比对所花费时间的斜率约为1.95,与版权登记总时长的斜率几乎一样,也就是说相似性比对所需花费时间的增加是导致整个版权登记时间增加的原因。最后,每首音乐大约需要花费7 s 的时间进行其他辅助处理,除了系统性能波动的原因,有些音乐文件需要更多的处理时间是因为系统在提取音乐特征指纹之前,会检查音乐文件的采样率是否是44.1 kHz 以及MP3 格式,如果不是,则会利用FFmpeg 工具对音乐文件进行转化再提取特征指纹。
相似性比对所花费时间的增加导致了整个版权登记时间的增加,而导致相似性比对花费时间增加的因素如图10所示。
图9 版权登记时间花费情况Fig.9 Time spent on copyright registration
图10 版权登记时间增加的因素Fig.10 Factors of copyright registration time increase
观察图10 可知,图中四条线的斜率相加约为1.95,即是图9 中相似性比对所花费时间这条线的斜率。从版权登记合约中获取特征指纹在IPFS 上的地址与排序特征指纹的Hash值(一个音乐文件对应一个特征指纹,一个特征指纹包含几万的Hash 值)所带来的时间增加相对来说是比较少的,而匹配特征指纹的Hash值系统目前采用的是多进程+二分查找的方式进行匹配,而二分查找的时间复杂度是对数级别的,当数据量越来越大时,其时间增加步伐会越来越小。所以这四个因素中,最主要的因素其实是从IPFS 上获取全部的特征指纹数据,每成功版权登记一首音乐,就会多一个特征指纹在IPFS上存储的Hash 地址,而获取该Hash 地址的数据大约需要1.1 s 的时间。后续将对数据的存储以及传输进行优化以此缓解登记时间的上涨趋势,从而增加系统的实用性。
在这成功版权登记的45 首音乐中,每首音乐提取的特征指纹数据在IPFS上消耗的存储空间如图11所示,每个特征指纹包含的Hash值个数如图12所示。
在这45 首音乐中,每首音乐平均消耗的IPFS 空间大约8 MB。虽然8 MB 是原音乐文件2~3 倍的大小,但这正是Shazam 算法以空间换时间的思想体现,通过增加存储空间来提高特征指纹相似性比对的速度,这是值得的。
图11 特征指纹在IPFS上消耗的存储空间大小Fig.11 Storage space size costed by each feature fingerprint on IPFS
图12 特征指纹中的Hash值数量Fig.12 Number of Hash value in each feature fingerprint
最后将本文系统与前人提出的系统进行比对后可得到表1,可以看出本文系统的功能更加全面,能够提供全流程的版权服务,帮助用户更高效地管理音乐作品的版权。
表1 系统功能模块对比Tab.1 Comparison of system function modules
5 结语
随着人们生活水平的提高,越来越多的人喜欢聆听音乐或是创作自己的音乐。然而,现有音乐版权行业存在的诸多问题将极大阻碍音乐行业的发展。区块链技术的出现为音乐版权管理提供了良好的解决途径。本文主要针对现有音乐版权行业的问题,基于区块链技术搭建了一个数字音乐版权管理系统,该系统具备六大功能模块,可满足音乐版权管理的大部分需求,同时音乐生态模块的引入不仅能够激励用户去分享音乐作品,更能帮助音乐创作者募集前期创作的资金,有助于创作者的持续创作以及整个音乐行业的繁荣。当然系统还有一些不完善的地方,比如版权登记所花费时间的增加,侵权监测中待引入人工智能技术进行优化等。后续将会对本文系统进行进一步的改进。