区块链与人工智能技术融合发展初探
2018-02-22刘曦子
刘曦子
(赛迪智库网络空间研究所,北京 100846)
1 引言
区块链与人工智能技术是当前科技行业非常前沿的两类技术。从技术本质上来看,区块链技术本质上是通过共识算法来生成、存储数据,通过智能合约操作数据,以及通过密码学技术保证数据的安全[1]。区块链技术具有去中心化、数据不可篡改等特点[2]。人工智能技术则包含三个关键点,一是数据,二是算法,三是计算能力。实际上,从这两类技术本身特点来看,区块链和人工智能在数据、算法和算力这三个层面上可以相互赋能并融合发展。
在数据层面,区块链技术在一定程度上能够保证可信数据,以及实现在保护数据隐私情况下的数据共享,为人工智能建模和应用提供高质量的数据,从而提高模型的精度。
在算法层面,一方面,区块链的智能合约本质上是一段实现了某种算法的代码,人工智能技术植入其中可以使得区块链智能合约更加智能;另一方面,区块链可以保证人工智能引擎的模型和结果不被篡改,降低模型遭到人为攻击风险。
在计算能力层面,基于区块链的人工智能可以实现去中心化的智能联合建模,为用户提供弹性的计算能力满足其计算需求。
2 区块链为人工智能技术应用提供了高质量数据来源
可靠的、高质量的数据是人工智能技术应用的重要基础。然而,当前用于人工智能技术建模的数据收集和运用存在四个问题。
一是数据不可信。人工智能和大数据技术的发展促进了大数据交易市场的火爆,很多人工智能的互联网公司由于自身缺乏数据收集渠道而转向从数据交易市场的数据公司购买。实际上,市场很多的所谓大数据公司的数据来源来自于数据黑市,数据真实度和可信度大打折扣。例如,有些数据过期失效,数据贩子对同一份过期数据稍加修改,反复售卖。数据贩子甚至通过制造虚假数据获取利润,这些“脏数据”往往只有30%是真实的,70%是造假充量的假数据。
二是数据涉嫌非法。一部分数据贩子通过所谓内部渠道,企业内部人员与外部人员勾结,以及其他关系掌握数据资源,其本身没有数据加工能力,通过直接售卖裸数据赚取差价,在贩卖的数据中,有些数据可能是涉嫌违法的个人隐私数据。
三是数据质量不高。例如,数据的实时性较低,数据标注质量不高等。在人工智能应用中,包括图像识别、语音识别、动作识别、自动驾驶等领域都需要对数据进行精准标注,高质量的标注数据决定了人工智能建模的效率[3]。
四是数据难以共享。当前,数据产业仍处于垂直分割状态,数据的持有者、开发者、使用者相对分离,数据难以流动和共享,无法最大程度利用数据为人工智能企业发展提供动能。即使不同企业或者组织之间有意愿进行数据共享,也因为涉及用户数据隐私安全问题和数据共享中的利益分配问题望而却步。
表1 物联网应用层协议比较
区块链以其可信任性、安全性和不可篡改性,能够在保证数据可信、数据质量、数据隐私安全的前提下,充分实现数据共享和数据计算,为人工智能应用在数据质量和共享层面提供有力的支持。
首先,区块链的不可篡改和可追溯性使得数据从采集、交易、流通,以及计算分析的每一步记录都可以留存在区块链上,任何人在区块链网络中,不能随意篡改数据、修改数据和制造虚假数据,使得数据的可信性和质量得到一定程度的信用背书,有助于人工智能进行高质量的建模,从而使用户获得更好的用户体验。
其次,基于同态加密、零知识证明、差分隐私等技术实现多方数据共享中的数据隐私安全保护,使得多方数据所有者在不透露数据细节的前提下进行数据协同计算[4]。例如,IBM Watson Health(健康医疗项目)基于区块链技术研发一种安全、高效、可扩展的医疗数据交易方式,实现患者隐私数据的共享,包括电子病历、临床实验、基因数据以及移动设备、可穿戴设备和“物联网”(IoT)设备中包含的医疗数据,以便IBM 通过分析大量的个人医疗数据进行建模从而推动相关基于人工智能技术的医疗诊断应用的落地。再次,基于区块链的激励机制和共识机制,极大拓展了数据获取的来源渠道。在区块链密码学技术保证隐私安全的前提下,向全球范围内所有参与区块链网络的参与者,基于预先约定的规则收集需要的数据。对于不符合预先规则的无效数据,通过共识机制予以排除。参与者授权使用的有效数据,以Hash码形式记录在区块链上,个人通过公私钥技术拥有数据的控制权;对于授权提供数据的参与者,提供Token等形式的激励。
总的来说,区块链能够进一步规范数据的使用,精细化授权范围,有助于突破信息孤岛,实现保护数据隐私的前提下安全可靠的数据共享。人工智能基于可信和高质量的数据开展计算和建模,极大提升区块链数据的价值和使用空间。
3 人工智能技术有助于智能合约实现真正智能
智能合约概念最早在1994年由学者 Nick Szabo 提出,最初被定义为一套以数字形式定义的承诺,包括合约参与方可以在上面执行这些承诺的协议,其设计初衷是希望通过将智能合约内置到物理实体来创造各种灵活可控的智能资产。
区块链技术的出现重新定义了智能合约,并将智能合约的内涵进一步具体和深入。当前的智能合约一般是具有状态、事件驱动和遵守一定协议标准,并运行在区块链上的代码程序。它能够实现一定触发条件下,以事件或者事务的方式,按着代码规则,处理和操作区块链数据,并由此控制和管理区块链网络的数字资产。作为一种嵌入式程序化合约,可以内置在任何区块链数据、交易、有形或无形资产上,形成可编程控制的软件定义的系统、市场和资产。
可以看到区块链的智能合约的本质是代码,和其他编程语言并没有什么不同。通过智能合约的代码可以自动处理区块链网络的不同节点之间的交易,例如为传统金融资产的发行、交易和管理提供了自动化的工具。在数字票据的整个生命周期中,票据开立、流转、贴现、转贴现、再贴现、回购等一系列业务类型、交易规则和监管合规,都可以通过智能合约编程的方式实现。此外,智能合约也能够应用于社会系统的合同管理、监管执法等事务中。
当然,智能合约只是一个事务处理模块和状态机构成的系统,它的存在只是为了让一组复杂的、带有触发条件的数字化承诺能够按照参与者的意志,正确执行。此外,智能合约在法律上并不具备法律约束力,在功能上也并不智能。在商业活动正真需要实际签署合约的场景下,智能合约在实践和理论上无法实现它名字所赋予的功能,智能合约代码本身也缺乏真实合同的基本要素,例如条款、条件、争议解决等[5]。智能合约在具有真正法律约束力上还有很长的路要走。不仅如此,智能合约的代码也是僵化的、一成不变,在实际应用中缺乏必要的灵活性。实际上它只包含了基于不同输入而反馈的一系列复杂结果,当前的智能合约并不智能,它的处理是确定性的。如果说它智能的话,仅仅体现在提供有效的自动化履约,降低人为错误和潜在争议风险。
人工智能为区块链中相对粗糙的智能合约技术带来了福音,并有助于实现合约智能化。人工智能结合区块链智能合约,以三个层面重塑全新的区块链技术应用能力。
一是人工智能结合智能合约,可量化处理特定领域问题,使得智能合约具有一定的预测分析能力。例如在保险反欺诈应用中,基于人工智能建模技术构建风控模型,通过运营商的电话号码不同排列的数据组合进行反欺诈预测,并依据智能合约的规则进行相应的处理。基于人工智能的智能合约,能够处理人脑无法预见的金融风险,在信用评级和风险定价方面比人脑更具有优势。
二是人工智能的介入让其拥有仿生思维性进化的能力。就智能合约本身而言,通过人工智能引擎,在图形界面的模板和向导程序的指引下,能够将用户输入转化为复杂智能合约代码,即生成符合用户和商业场景的“智能协议”。
三是人工智能不断地通过学习和应用实践形成公共化的算力。
当然,人工智能与智能合约的深度结合还需跨过法律和技术两重难关。尽管一些相对简单的合约通常可以将履约自动化,对于更加复杂的合约,可能还需要人的介入来解决争议。
4 区块链为人工智能建模提供了分布式算力
在区块链与人工智能结合的层面上,区块链技术在一定程度上保证了数据可信和质量。人工智能技术通过引擎构建模型,并运行在区块链上,使区块链的智能合约更加“智能”。在算力层面,人工智能通常基于个人自建或者传统云计算平台进行模型计算训练。随着数据量的增大和计算复杂度的提升,对于传统中心化的云计算平台和服务器的计算能力的要求也越来越高,对于企业的成本投入也在不断攀升,这主要因为高性能计算机或者是服务所带来硬件采购和维护成本。
尽管互联网企业已经使用廉价的P C 机作为云平台的服务器,但电力消耗依然巨大。共享经济的到来,为降低能源消耗和提高资源利用效率提供极佳的解决思路。全球范围内的大多数普通计算机的算力都处于闲置状态,如果能够把这部分算力利用起来,能够极大降低人工智能建模的成本和提高资源利用效率。
区块链是分布式网络,能够实现算力的去中心化。区块链有助于构建去中心化的人工智能算力设施基础平台,转变传统的不断提高设备的性能以提高算力的思路。
在算力层面上,区块链技术可以实现在分布在全世界各地的去中心化海量节点之上运行人工智能神经网络模型,利用全球节点的闲置计算资源进行计算,实现去中心化的智能计算。此外,通过区块链智能合约可以根据用户产品计算量对网络计算节点进行动态调整,从而提供弹性的计算能力满足用户计算需求。
5 结束语
本文从数据、算法和算力三个层面对区块链与人工智能技术融合发展进行了探讨,可以看到区块链与人工智能在数据、算法和算力层面可以相互赋能。随着区块链与人工智能技术成熟,以及学术界和产业界广泛探讨,相信未来区块链与人工智能这两种技术融合将更加深入,应用场景会更加丰富。