基于区块链的数字资源确权与交易方案研究
2022-02-13谢人强张文德
□谢人强 张文德
一、引言
数字经济是以数字化的知识和信息为关键生产要素,以数字技术创新为核心驱动力,以现代信息网络为重要载体,通过数字技术与实体经济深度融合,不断提高传统产业数字化、智能化水平,加速重构经济发展与政府治理模式的新型经济形态。数字经济引领中国经济发展,发展数字经济是党和国家制定的重要发展战略。党的十九届五中全会指出:“发展数字经济,推进数字产业化和产业数字化,推动数字经济和实体经济深度融合”。发展数字经济,不仅有利于强化市场动力和产业支撑作用,而且有利于强化国内循环与国际循环间的纽带,是加快形成新发展格局、推动实现高质量发展的重要途径。
数字经济的发展,要以数据要素为抓手,加快数据要素市场的培育。党的十九届四中全会首次提出将数据作为生产要素参与收益分配,探索建立健全由市场评价贡献、按贡献决定报酬的机制。2020年3月,中共中央国务院印发了《关于构建更加完善的要素市场化配置体制机制的意见》,就扩大要素市场化配置范围、促进要素自主有序流动、加快要素价格市场化改革、健全要素市场运行机制等方面进行部署。数据是一种资源,“数据要素参与收益分配”是一个全新的且重要的理论与实践课题。探讨数字经济中数据要素如何参与收益分配的问题,首先需界定数据要素的产权归属。明确数据产权归属,有助于管理数据资源,保障数据权利,规范数据市场秩序,促进数据产业可持续发展。我国当前数据的产权界定规则尚未建立,造成了数字资源管理与交易等活动存在着困难,进而导致数据要素市场发育迟缓。因此,研究数字资源产权界定的相关问题具有重要的理论与实践意义。区块链技术具有分布式存储、不可篡改、智能合约自动执行等特点,有助于解决数字资源产权界定及交易的相关问题。利用区块链的特性,使得链上的数字资源从创作到交易、流通的每一步都有据可依,从而实现对数字资源的确权。区块链的智能合约通过代码的自动执行,促进了数据资源权利的行使与追溯。
本文的主要贡献体现在于:第一,提出“元数据+云存储”的方案来实现区块链网络中数字资源的访问与存储,并且基于都柏林核心元素集及PREMIS保存性元数据设计思路,设计了数字资源链上的元数据信息表。第二,构建了数字资源确权与交易方案实施框架,设计了应用层中确权与交易的业务流程,提出采取NPOS作为区块链的共识机制,并认为NPOS共识机制能够提高区块链的安全性。本文后续的内容安排如下:第二部分将是相关文献的梳理,主要是关于数字资源产权的归属与区块链对数字资源的产权界定的研究成果的梳理。第三部分对传统方式下数字资源产权界定问题进行了探讨,并阐述了区块链环境下数据确权与交易的原理。第四部分设计了基于区块链技术的数字资源确权与交易的存储方案、方案的实施框架,并从科学性、安全性及可行性等方面对方案进行分析。第五部分是总结部分。
二、文献综述
数字资源版权保护是信息资源管理与服务的关键问题,也是信息资源管理领域研究的热点问题。关于数字资源版权的归属,文禹衡(2019)认为,人类干预产生的数据如个人的原始数据、企业经营的原始数据等,其所有权属于产生这些数据的用户,机器生产数据如从大数据中析出衍生的数据,其所有权属于生产出这些数据的企业。朱宝丽(2019)认为,公共数据产权归属国家,自然人或企业自身参与市场活动产生的显名数据产权归属于数据产生者,互联网平台双边或多边交易产生数据的产权依照约定或法律规定归属一方或多方共有,清洗脱敏、匿名的增值数据产权归付出劳动的用户。王颂吉等(2020)认为,数据要素的产权应划归数据要素生产者,但同时需要借助政府之手对提供原始数据信息的市场主体做出合理补偿,等等。总体而言,对数字资源产权的界定存在着一些分歧,有些学者认为数字资源的产权应归属原始数据的提供者,应加强数据隐私的保护,而另一些认为数字资源产权应归属数据的生产者,应充分发挥数据要素的使用效率。
关于区块链对数字资源的产权界定,宁梦月和刘东苏(2020)基于区块链技术的异构多链模型,提出了数字资源产权保护方案。张洁梅和孙浩宁(2020)从价值主张、价值创造、价值网络和价值获取四个核心要素的视角对现有企业基于区块链的数字版权商业模式进行梳理和分析,并提出了区块链技术更好地赋能数字版权价值体系的对策建议。王海龙等(2018)基于区块链技术和数字水印技术,提出了一种大数据确权方案。该方案为大数据的所有权界定提供了一种新的技术思路和方法,但该方案的研究对象是数字资源集合,而非单一的数字资源。华劼(2018)对区块链技术与智能合约在知识产权确权和交易中的运用及其法律规制进行了探讨,重点探讨的是区块链确权与智能合约交易中的相关法律问题,等等。
综观现有的相关文献,数字资源的产权的归属问题,目前尚未定论,尤其是基于用户的原始数据,进行清洗脱敏后的产权归属问题,如何划分数据主体、控制者、使用者的产权边界,各方莫衷一是。关于区块链在资源确权方面的研究,学者普遍认为区块链技术有助于数字资源或知识产权的确权或保护,有较多的文献阐述了区块链技术用于知识产权保护的意义,提出了将区块链技术应用于知识产权保护的优越性。然而,现有的研究结论基本上基于区块链“链上”数据的这一前提假设。对于已在区块链上存在或交易的数据,由于区块链具有分布式、去中心化、不可篡改等属性,可以较易得出区块链有助于链上数据的确权和保护的结论。而对于“链下”的数据,当这些资源准备“上链”时,如何借助区块链技术对这些资源进行确权,数字资源在区块链中如何存储?本文将针对这些问题,试图研究如何将链下的数字资源上链,并分析区块链技术如何保护这些数字资源。
三、基于区块链的数字资源确权与交易原理
(一)传统方式下数字资源产权界定探讨
当前,数字资源的产权界定尚未在理论界达成广泛共识。一般而言,个人数据包括个人的姓名、性别、年龄、电话、地址等信息,法人机构的经营内容、经营场所等信息,自然人或法人在网站平台上用户注册的会员名、发布的各种信息、创作的各类数字作品,这些数据的所有权属于个人(包括法人)。这样的权属划分,争议较小,基本可以形成一致的定论。公共数据包括经济与社会发展的数据、医疗教育健康等数据、行政执法过程中产生的数据信息等,其产权属于数据的收集或持有方,即属于政府的相关部门,这样的划分也可以基本被接受。而平台商业数据产权的归属问题则争议较大,有些学者认为这些数据的所有权应属在平台上产生行为的用户,因为这些数据是基于这些用户产生的;也有学者认为,这些数据的所有权应属平台,因为是平台对这些数据进行了处理,让原本没有价值的数据产生了价值。
由上述讨论可知,数字资源的产权界定问题总体较复杂,尤其是涉及多个主体参与或进行了各种形式变化的数据。在传统方式下,多主体数据的来源或各主体在数据价值中所作的贡献,在很多情况下很难准确判断与衡量,因此给数据资源产权界定带来巨大的困难。
(二)区块链环境下数据确权与交易的原理
区块链技术有助于准确判断数字资源的主体及衡量各主体在数据价值中的贡献。区块链技术源于Satoshi Nakamoto(2017)提出的Bitcoin系统,本质上是一个开放性、去中心化的数据库,不依赖任何第三方,通过自身分布式节点进行网络数据的存储、验证、传递和交流,具有公开透明、共同维护、去信任化、安全可靠、不可篡改、可追溯等特性。区块链数据区块包含区块头与区块体,区块头包含前一个区块(父区块)的哈希值(PreHash)、本区块体的哈希值(Merkle根)以及时间戳(TimeStamp)等信息,区块体主要包含在区块链中的具体交易详情。由于区块链每个当前区块都存储有前一区块的哈希值,这样所有的交易记录就形成了一个链式分布式存储结构。典型的区块链结构如图1所示。
图1 典型的区块链结构
区块链的时间戳、Hash加密、用户的公私钥对、链式存储结构等技术和特点为数字资源的确权提供了基础。用户将要登记的数据用Hash加密算法进行加密,与其他操作数据打包,同时加上时间戳等信息形成区块数据。区块中数字资源登记操作有完整的记录时间,并用用户的私钥对数据进行签名。用户的私钥确认了用户的身份,时间戳记录了数字资源上链或在链上产生的时间,由此实现了数字资源在区块链的登记确权。若区块链的某一区块确权登记信息的被篡改,则该登记信息的Hash值就会发生改变,进而影响到当前区块的根Hash值。由区块的存储结构可知,当一个区块Hash值被篡改,所有的区块的Hash值都会随之改变,这样做的工作量巨大且不易实现,从而使区块链拥有了其不可篡改的特性,为数字资源的交易与侵权维权提供了保障。
区块链记录了数字资源的产生过程,也记录了各主体所作的贡献。在记录过程中涉及的各主体间的利益分配、数字资源产权变更的活动,可以通过区块链智能合约自动执行。智能合约最早是由计算机科学家、加密大师Nick Szabo于1994年提出,是执行合同条款的计算机协议。后来,Mark S.Miller等人进一步提出用代码编写智能合约。区块链智能合约是指部署在区块链网络上的传统合同的数字化版本,当协议条款的执行条件被满足时,数字化合同将会被自动执行。数字资源的版权交易广泛借助区块链的智能合约进行实现,区块链链上的数字资源,当欲购买者账户余额、出价等信息符合资源的交易条件,就会触发智能合约的执行,实现交易金额的转账及版权的变更。
四、基于区块链的数字资源确权与交易方案
(一)区块链数字资源存储方案设计
由于大量的数字资源存在着较大的容量,若将这些数字资源全部通过区块链来存储传输,将会影响区块链的性能。本方案采取“元数据+云存储”的方案来解决上述问题,即将数字资源的元数据的Hash值存储在链上,而将数字资源的具体内容通过链下云存储的方式进行存储。链上用户通过元数据了解数字资源的基本信息,通过元数据相关的云存储来获取数字资源的具体内容。数字资源的基本存储方式如图2所示。
图2 数字资源存储方式
元数据主要是描述数据属性的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。本文的数字资源元数据主要是通过在区块链上描述数据属性,让其他用户知悉相应的数字资源信息。参考都柏林描述性元数据核心元素集以及借鉴PREMIS保存性元数据设计思路,设计数字资源链上的元数据信息如下表所示。
表 数字资源元数据
其中:Identifier是资源的唯一标识,如URI(统一资源标识符)、URL(统一资源定位符)、DoI(数字对象标识符)、ISBN(国际标准书号)、ISSN(国际标准刊号)等;Storage是资源存储的服务器;Format表示资源的格式,包括媒体类型或资源容量(数字资源所占空间的大小);Price表示资源的价格,若为免费资源则其值为0。
(二)区块链确权与交易方案实施框架
本文的数字资源确权与交易方案的系统架构有6层,分别为:数据存储层、网络层、共识层、激励层、合约层、应用层,各层的主要作用及涉及的操作如图3所示。
图3 数字资源确权与交易方案实施框架
各层的主要功能如下:
1.应用层
实现数字资源的确权与交易的界面操作及相应的功能。数字资源产权所有人在确权操作时,先进行身份验证,通过后,对数字资源进行原创性检查。若要确权的数字资源的元数据与已有资源的相似度小于一个已设定的阈值,则认为其原创性较高,将数字资源元数据存储到资源所有权登记库中,完成确权操作,否则回滚相关操作。若用户要购买相关数字资源,则先查询资源所有权登记库,然后进行支付购买,资源所有者按照约定分成的比例获得相应的收益,之后区块链完成所有权变更。上述的交易过程通过智能合约自动完成,即资源所有者在同意用户购买资源后,便触发了智能合约,自动执行交易流程。数据资源的确权与交易流程如图4所示。
图4 数字资源确权与交易流程
2.合约层
数据确权阶段有身份验证规则和资源查重规则,按照这两项规则完成对原创人的身份验证以及计算数字资源相似度的任务,审核通过后,将数字资源的元数据上链。
3.共识层
共识机制是区块链的核心,本文的方案借鉴Polkadot区块链网络的设计思路,采取NPOS共识机制,参与者角色包括验证人、提名人、收集人、钓鱼人。其中,验证人主要验证区块数据是否合法,为防止恶意验证,验证人都需质押DOTs,发生任何不合共识算法的事件,验证人都会被剥夺部分或者全部质押的DOTs。反之,可以得到相应的奖励。提名人可参与选举出一个或多个可信赖的验证人候选人,以确保网络不会因仅有的少数几名验证人而过于中心化。若验证人负责验证区块得到最终的确定,验证人和提名人都将获得与各自权益成比例的奖励。收集人将区块链网络中交易集成区块并根据这些区块产生状态转移的证明,提供给验证人;同时,也关注网络情况,向验证人证明恶意行为。钓鱼人是通过监督整个网络上的各种活动来判断其他参与者是否违规进而阻止恶意行为。钓鱼人需要提供少量的DOTs做保证金,若钓鱼人的举报属实,那么他将得到一笔DOTs奖励。各角色信息交互的过程如图5所示。
图5 各角色信息交互过程
4.激励层
由上一小节可知,验证人、钓鱼人等角色在区块链履行职责时均要质押一定量的DOTs,以防止一些恶意行为,若行为被证实是合理有效的,各角色根据自己的贡献可得相应的奖励,这些方式体现了该方案的激励机制。
5.网络层
区块链本质上是一个P2P网络,每当一个节点创造出新的区块后,它需要以广播的形式通知其他节点,其他节点收到信息后对该区块进行验证,然后在该区块的基础上去创建新的区块。网络层使用的机制包括传播机制、数据验证机制等。
6.数据存储层
主要是形成数字资源的区块数据,由于区块链的高冗余特性,使得链上无法存储过大的数据,根据前述存储方案,采取链上链下相结合的方式,链上存储数字资源的元数据,链下通过云存储方式存储数字资源的完整内容。
(三)方案的科学性与可行性分析
本文的数字资源确权与交易方案具有科学性、安全性和可行性,主要表现在:
1.科学性与安全性
首先,采取区块链技术对数字资源进行确权与交易,由于区块链分布式存储的特点,从而避免了在传统中心化模式下,单一节点存储易丢失数据的风险。另外,区块链的链式结构,每个区块的区块头包含上一区块的Hash值,从而保证了数据访问及确权与交易等操作的可追溯性以及历史数据的不可篡改性。其次,采用NPOS共识机制保障了区块链节点的诚实行为。传统的POS方式容易产生节点寡头,NPOS共识机制放弃了简单的以投票数多少来确定超级节点的方式,而采用基于所有提名人投票情况,按照票数均等原则选出若干验证节点。验证人依赖于他们抵押的DOTs,他们的失职行为会受到惩罚,其他的角色也有类似的奖励惩罚机制,这样方式有效地避免了区块链中不诚实节点的存在,从而保障了整体安全性。
2.可行性
首先,确权与交易区块链可以采取基于Substrate框架进行设计实现,Substrate是一个用于构建区块链的开源的、模块化的和可扩展的区块链开发框架。Substrate提供了构建区块链的核心组件,为区块链开发者提供了一个简单灵活自由的框架平台。Substate开发框架包含Imports、Pallet Configuration、Pallet Storage Items、Pallet Events、Pallet Errors、Callable Pallet Functions几个部分,基于Substate开发区块链难度大大降低,保障了本文的确权与交易区块链实现的可行性。其次,区块链上存储的是数字资源的元数据信息,并非完整的源文件,这样的存储方式,缓解了传统方式下随着用户数量增多造成链上数据的存储空间的快速增长,从而避免了区块链性能下降的现象,保障了区块链资源存储的可行性。最后,区块链上存储的元数据信息是基于都柏林描述性元数据核心元素集以及借鉴PREMIS保存性元数据设计思路,都柏林核心元素集及PREMIS方案均已经过长时间的检验且被广泛应用,确保了元数据设计的合理性。
五、总结
区块链确权,其本质是所有者存储到区块链数字资源的或者在区块链中新产生的资源借助加密及时间戳技术,确认并记录资源的最先拥有者。由于区块链具有去中心化、分布式、不可篡改等特性,并且可以记录所有用户的所有操作,因此在区块链上数字资源任一时刻的所有权归属是明晰的,且侵权的维权相对更容易。基于区块链的数字资源交易主要是借助区块链的智能合约技术,实现从“意向用户购买—转账付款—所有权变更”的转化。
由于区块链上的数据是冗余存储,为不影响区块链的网络性能,本文提出“元数据+云存储”的方式来设计区块链的存储方案,借鉴都柏林核心元素集及PREMIS方案设计了数字资源的元数据,并在此基础上设计了区块链确权与交易方案的实施框架,对整体方案进行了科学性、安全性及可行性方面的分析。本文认为区块链技术对数字资源进行确权与交易具有良好的适用性,采用NPOS共识机制保障了区块链节点的诚实行为,能够保障方案整体的安全性。采取基于Substrate框架实现及使用元数据+云存储的方式进行数据访问,确保了方案具有良好的可行性。
本文也存在一些问题有待将来解决。例如,本文的确权与交易方案仅考虑了最基本的角色,并未将监管者的角色考虑其中,同时也并未涉及数字资源维权的功能,未来可将版权管理机构、仲裁机构等角色纳入,开展更全面的研究。另外,本文提出了数字资源确权与交易区块链的实施框架,Substrate开发框架也减小了区块链的开发难度,但构建一条完善的、无任何漏洞的区块链仍需考虑很多细节问题。