基于区块链的大数据交易关键技术与发展趋势
2022-02-22周希阳
关键词:区块链;大数据交易;技术与发展
一、引言
区块链技术在2019年的中央政治局集体学习上被领导人作为当前一项核心技术自主创新的突破,引发了领导集体的重视和广泛热议。区块链技术在促进数据共享、有害业务流程、降低运营成本等方面具有非常重要的优势,因此被国家提升到了重要战略层面,并将视为推进年社会治理手段现代化的重要依托。区块链技术的起源本是从中本聪有关比特币的一篇论文中率先提到。所谓比特币系统底层的区块链技术主要是为了解决加密数字货币中的双重支付问题,可以在P2P网络中保证交易记录的安全真实有效。
二、区块链技术背景概述
区块链技术由多方共同维护,利用密码学保证传输的有效和访问的安全,最大程度满足数据一致存储,对数据篡改有效防护,可以被称为分布式账本技术。通过数据形成的链式存储结构,去除中心化的信任基础,为众多加密的数字货币交易提供底层的技术支持。一定时期内发生的交易状态,经过公示后形成交易数据,可以通过区块链数据结构充分体现。同时,按照时间序列排序的区块链数据也串联成了链式的存储结构。比如:在比特币区块链中,负责将一段时间收集到的交易数据打包的工作人员,可以计算满足一定条件的随机数值,形成共识后将区块结构追加在当前区块链的尾端,是一种非常有效地防止数据篡改的方法。
现有的区块链分三类,分别是:公有链、联盟链和私有链。后两种也被称为许可链,需要提前设定节点的准入准则。当前区块链技术已经被应用到商业领域,从公链形式向联盟链方向发展时是大势所趋,但私有链也有自己的广泛应用市场。区块链技术已经历经几个阶段的演进和变化,技术逐渐成熟,从数字货币为代表的区块链1.0技术时代,到一智能合约为代表的区块链技术2.0时代,到当前正在进入各行业深度融合的区块链3.0时代,技术在日新月异地发展,与时代的需求不谋而合。区块链技术还将与大数据、人工智能等新技术进行密切融合,形成更符合时代需求的新型区块链技术,可以有效支持大规模产业复杂应用的区块链技术4.0阶段。
三、区块链与数据交易
区块链技术具有三点特性,成为了此项技术区别于其他技术的关键。多节点性是指在区块链的身份认证和数据交易、数据验证等环节都可以经过多个节点的验证,姐姐第三方服务平台的不可信问题,大大提高了可靠性。使用区块链技术存储数据的访问控制列表以及数据交易的记录都是作为数据所有者的真实可信的交易日志,为数据所有者享有,并不能任由他人进行数据的篡改和伪造。任何一方都不能干预数据代理和数据请求者使用智能合约制定交易规则,且合约生效后将自动执行,这是为交易双方提供了信任关系的技术基础。
区块链技术下的数据交易是多个实体交易参与者通过生成的公私钥进行注册。产生数据的尸体为数据所有者,也称为用户。一般数据所有者拥有的少量数据通过数据代理进行数据的整合,从而可以向数据请求者出售,当然数据代理也可以称为数据所有者。查询或购买数据的实体是数据请求者。围绕这三方,将开始有关区块链技术的运行。
3.1 隱私保护
一般情况下在互联网平台进行交易的数据容易泄漏隐私,数据代理会在未经过数据所有者同意收集其数据,再将收集到的数据进行出售交易,获得利润,或者,数据代理没有提前对数据所有者的隐私性数据进行有效管理和保护,导致交易过程中在某个环节泄漏了用户的隐私信息。这种情况,一方面用户可能不能及时发现自己的隐私数据被泄漏,一方面发现泄漏后的维权手段只能借助法律手段,不能在技术应用层面进行有效防控1。
但是在区块链技术的支持下,数据代理发布数据时可以在节点通过验证方式来将数据进行有效保护,需要数据所有者进行授权才能吸入区块链,大大提高了数据的安全性。数据交易后,交易记录的相关信息也可以存储在区块链上,确保用户的知情权和控制权。
使用隐私管理器的用户可以在PPM设备上设置隐私偏好,当数据代理的请求行为熟悉问题时,设备会第一时间向用户发送请求信息,提醒用户关注并获得授权允许。只有当用户同意时才可以将数据发送到数据代理,经过处理后再生成交易平台出售规则的匿名数据集合,并通过HASH值作为数据集ID发送到隐私管理器设备PPM上。相关数据被有效验证和保存,用户也可以随时查看交易数据。用户可以通过区块链技术对数据进行有效地控制和使用知情。
3.2 数据转卖
数据的特点是所见即所得,没有复制的成本,如何控制数据转卖问题是当前数据交易中的难题。数据存储方、交易平台和数据请求者在获得数据后都有可能为了获利而进行转卖。以往的集中式交易数据流程中,数据所有者会选择对数据进行加密以保护数据隐私和安全,但是仍然会有一些网络黑客利用各种手段对数据进行获取后二次转卖获利,购买者不费力气就可以购买到自己需要的数据,并可以利用数据任意修改而绕开监测。但是在区块链技术模式下,这种问题将不复存在。因为区块链技术可以对数据进行溯源,不管是否存在认为任意数据修改、伪造、复制等,都可以直接追溯到数据生产者和所有者,这源自该技术要求数据代理必须向其提供数据来源,才能保证数据不被转卖,阻止数据请求者在后台获取数据后进行二次倒卖获利。
一种名为SDTE的交易方法是在数据交易中出售数据的分析结果而不是原始的数据。知恩感恩合约形式发布的数据处理算法进入到区块链后,数据请求者发布购买需求,选择合适的数据代理和可信节点,选定了受SGX保护的EVM节点后,数据请求者可以把这些节点发送给数据代理,然后由数据代理发送数据地址和解密密钥给可信节点,执行处理后,可信节点将结果使用数据请求者提供的加密密钥进行加密后,再发送给数据请求者,这个那个过程中,数据请求者只能得到数据处理的结果,而无法获得原始数据,这就从根本上解决了数据在被获取后二次倒卖的可能性。整个数据处理都在区块链的可信环境中进行,分析过程中的原始数据始终被安全保护,无法泄漏。
3.3 交易公平
数据交易最后的要求就是交易双方要公平平等,一方获得合法数据,一方收到数据付款。以往通常会借助第三方平台介入来解决数据交易公平问题,但是会让问题更加复杂难处理,数据这种特殊的产品一旦查看就无法进行退货,让交易公平没有达成的可能。区块链技术中数据的有效性和完整性是基于多节点监测来检验的,就可以有效保证数据交易的原子性可以由智能合约来保证。
数据代理和数据请求方分别在智能合约中支付和数据等金额的保证金,在交易成功后返还一定比例的保证金,如果交易存在争议时,纠纷的化解机制为多个节点对数据有效性驗证,只有验证通过,智能合约才不会返还保证金。或者,双方通过双重签名技术DAPS技术保证交易公平。双方交易时由数据代理向对方发送首个签名,数据请求者发布支付合约,数据代理在接到支付合约后,再发送第二个签名以接受付款,数据请求者通过两个签名提取密钥,从而解密了数据。一旦其中任意一个环节未按规定完成,就无法获得第二个签名,而区块链中的各节点无法获得第一个签名,只能获得第二个签名,是无法提取密钥的2。
四、区块链技术的发展
区块链技术除了作为数据交易平台之外,还可以支持数据所有者获得持续的数据交易可能,从而获得多次交易利益。这种高回报的方式在第三方平台介入的情况下是无法实现的,但是区块链平台就可以实现并轻松利用智能合约进行自动返现。区块链的价值转移功能体现在数据所有者和数据代理之间形成良好的数据共享公平环境,双方是互利互惠的信任关系,不是数据的孤岛,点对点地交易也成为现实,让价值直接转移,让数据所有者获得自己数据的应有价值,激励其不断分享数据,实现数据互联互通。
比如,在医疗行业飞速发展的今天,各地的就医环境和资源分配并不均衡,导致很多就医需求无法满足。医疗大数据在近年来飞速应用在医疗行业,成为一项惠民生的工程。电子病历是患者的隐私信息,也是医疗大数据中的重要组成部分,但是如果对患者的医疗信息不加以保护,就会出现信息泄漏,侵犯患者的隐私权。这就需要区块链技术发挥其隐私保护和数据价值分配的优势,在数据交易中做到各方兼顾。同时,对于患者在多地就医时,也可方便医生查询以往的就诊记录和治疗信息,对医生为患者提供更优质的医疗服务提供了便利,让患者的医疗信息在就医中实现数据共享共用。未来,应当加大对区块链技术的应用推广,降低大数据的使用门槛,也缓解了单次数据分析的计算成本。
五、结语
区块链作为新兴的互联网技术已经引起了社会各界的关注和重视,该项技术在数据共享、协同工作、可信体系建设方面具有独有的优势。随着区块链技术的发展和应用,越来越多的行业将接纳和使用此项技术,通过分布式的数据存储,去中心化的信任基础,形成新的社会形态。
参考文献:
[1]于洋,梁鸿,基于区块链的大数据交易关键技术与发展趋势【J】,计算机科学,2021(11):12-13.
[2]朱建明,高盛,区块链关键技术聚集起应用演进进展【J】,计算机技术与发展,2020(4):34-35.
作者简介:周希阳,男,1994-08,汉族,上海,本科,上海科汇人才服务有限公司(派遣至软件中心),研究方向:大数据,区块链。