区块链+分布式商业打破“数据孤岛”的工程性研究
2020-07-20麦庆达黄小敏
麦庆达 黄小敏
摘 要: 基于区块链底层架构思想,商业场景开发的私有链和联盟链对数据资产的增值和价值挖掘起重要作用。本文对数据金融工程化应用进行必要性分析,论证金融科技代表性的区块链底层环境下在数据治理中的应用;针对数据资产化,为满足企业、开放银行数据交易、开发业务的需求,提出基于区块链的分布式商业模式交互的环境治理体系,有效挖掘信息价值,加快连接金融领域的“数据孤岛”。
关键词: 金融工程 数据资产化 开放银行 分布式商业模式 区块链即服务
一、引言
区块链从最初一个系统的架构理论,演变到工程实践,最终上升为“加快推进区块链技术和产业创新发展”的国家战略。围绕区块链学术界正不断攻关技术难题,工业界对新型的“分布式的商业场景资料来源:金融区块链合作联盟(深圳),《金融区块链底层平台FISCOBCOS白皮书》,2017年。”,即为达到商业过程中多方对等地位、透明化、可信化的设想,提出了更高的技术要求。区块链信息技术的核心包括:分布式记账、非对称性加密、认证机制、智能合约四个方面。这些底层的特性满足基于现实考虑的工程,但是区块链技术的是否投入使用,仍需考虑成本、效率等。业界对于解决传统痛点问题的区块链的创新性技术的需求旺盛,很大程度上缘于工业领域的意见或者技术的炒作,投资者或者决策者需要理智对待(Ruoti等,2019)。
总体来说,引入区块链技术系统作为业务管理或运营系统有以下四个理由:一是系统有多方共同管理的必要,二是系统需要多方参与操作,三是系统的信息来源有审查的需求,四是系统需要阻止恶意的数据删除操作。若无第一和第二项要求,那么就不建议决策者引入区块链技术;如果前两个的需求有一个得到满足的话,接下来的第三、四的需求意味着系统“共同治理”的需求,监管者审核业务并在恶意的删除数据中恢复原有数据的需要。而事件驱动的“智能合约”在灵活的协议和准入规则的布置下,可根据现实场景业务逻辑,有利于基于区块链底层特性搭建起可编程金融和可编程社会(贺海武等,2018)。基于工程的思维,革命性的新型信任机制产生,必然会伴随“不可能三角问题”:该信息技术的系统中“高效低能”“去中心化”以及“安全”三个方面不能同时满足(陈一稀,2016)。诸多问题还有如:创新性金融工具可能带来的法律风险(杨东和潘曌东,2016)、市场反垄断中监督机构的策略(孙晋和袁野,2019)等。而如何把金融科技的工具落地实际场景是本课题重要研究方向。
与此同时,“数据孤岛问题资料来源:中国信息通信研究院、华为技术有限公司,《数据基础设施白皮书》,2019年。”在数据价值实现中尤为突出。数据的流通、信任的传递是金融的本质内涵,而用户的数据量的爆发式增长,同时要求企业、银行提供“融合、协同、智能、安全、开放”的数据存储平台,能够在业务中利用数据资产自我增值,并提高企业管理能力,还能租售方式让数据“变现”(来源:《数据资产管理实践白皮书(4.0)》)。并且开放银行的API接口请求(吴朝平,2020),可打破传统的“数据孤岛”问题(来源:中国信息通信研究院和可信区、块链推进计划)。基于区块链技术的系统联通多个节点,包括商户机构、隐私数据的所有者、数据价值挖掘第三方;在数据资产所有者的法定授权情况下,商业银行可积极假定场景寻找外部合作,有效地建立高效的数据传递机制,普惠实体经济,推进商业的个性化营销,提高客户对服务的满意度,提供个性化的金融科技产品和解决的方案。
如在一个多层次的产业供应链发展场景中,提高上下游供应链企业的融资风险管理能力,加强对整个产业链条的经营和生产流程的风险管理。(王鑫和陈力源,2020)通过供应链上各节点对等地贡献有效信息,高度凝聚商品物流、信息流、资金流等信息,并且利用智能合约控制数据访问权限。区块链在供应链的分布式商业场景中,多方链上实现“数据信息”的流通。功能上应体现为:数据作为资产进行交易,使得数据资产化为可交易的标的;整体管理运行流程的可视化与相关节点可进行风险控制;提高数据流通效率,有效降低融资成本与信息传递过程的损失。
在数据资产定价应用层面上,特别是在金融垂直领域中,银行数据汇总(如:银行的信息流和资金流相分离的支付清算体系(李兴欣,2018)、对企业提供的数据价值抵押的评估标准等)的系统基于众多开源软件、云计算的结构化、工程化管理并未完全建立,數据系统整体的可用性和质量仍需提高,需对企业的质押信息进行有效的风险管理,并且精准的定价,有利于数据资产推动建立自身交易的生态圈(孙妮等,2017)。同时,企业数据资产定价中,通过改变传统主观的评估方法,利用工程中的量化思维,如成分分析等,找出创造价值的特征数据(李菲菲等,2019)。同时值得注意的是,在计算一致性指标前仍依赖使用德尔菲法进行专家打分,具有一定的主观性。而数据的闭环处理过程中,也会由于数据的自身特殊时空关系,导致数据价值的测量发生变化(夏俊杰等,2019)。
本文将进一步讨论互联网时代的数字化数据存储中,由于“数据孤岛”存在的参与方数据篡改作恶和呈现效率低下、导致成本高的问题。重点分析金融科技以区块链技术架构是如何有效形成“分布式技术”的“商业思想”,同时其带来什么样新的变化。基于工程化的思想和区块链技术手段提出分布式商业模式工程构建的框架,并提出具体的编程逻辑,利用区块链新型工具为商业世界带来普惠性的解决方案。
二、“数据孤岛”带来的商业问题
在人工智能技术的背景下,能否有效地预防商业中的欺诈,关键在于参与方在场景下的“信息平衡”。于此考虑,数据即“重要资产”,也是“信任的重要来源”,因为数据可以被有效地挖掘,从而进行有效的风险管理。在银行借贷活动中,“数据欺诈”意味着某些扮演贷方角色的机构,经营额、客户活动数据是其自主独立记录的。而对于银行作为借方来说,贷款业务审批的过程中无法验证贷方的经营过程中是否存在“刷单”“虚假流量”等非正常交易的情况,导致借方在授信时无法真实衡量贷方的经营能力,增加风险管理的难度。又如在网络贷款场景下出现的“多头借贷”,借款人利用征信体系的不完全建立,在多家金融贷款机构进行贷款申请,容易导致借方逾期未还款,对贷款方带来巨大的资金流损失。针对点击欺诈(对所获得的产品或服务没有真正兴趣的故意点击广告)是在线广告投放成本中最艰巨的问题之一,因此,建立有效的欺诈检测方法对于在线广告业务至关重要。有学者通过集成学习的方法,利用特征工程等针对不平衡数据进行标签预测,减少广告投放的成本(Oentaryo等,2014)。
同时,数据交换受到各种因素的影响,包括交换价值的衡量标准、政府法律的限制。其中,美国国家经济研究局调查报告中显示,欧盟提出通用数据保护条例(General Data Protection Regulation:简称GDPR)尽管提高了数据所有者的自我保护意识,甚至推动了英国的市场管理局(CMA:competition and Markets Authority)提出开放银行的概念,共同制定银行数据共享框架等,打破传统商业银行的客户信息垄断。同时,该条例也影响了投资和就业,导致部分新型、成熟企业总计投资损失高达每周800万元美元,并导致不同阶段的企业最高每笔交易融资额缩水高达70%左右,其中更造成人员的流出和岗位的流失。这对传统的商业模式提出了巨大的挑战。我们能否通过区块链技术搭建可供数据安全、合规地交换的平台,对数据生命周期的管理和商业利润的可持续起着至关重要的作用。
三、分布式下的“数据资产化”
(一)数据价值影响因素分析
由于对数据隐私的需求,传统第三方公司通过对输出数据加入拉普拉斯(Laplace)噪声、对输入数据引用随机响应(Randomized Response)等方法满足基于概率的方法保护隐私要求。但是同时,在满足隐私保护后的数据往往会造成建模的精准度有所下降,这要求我们在考虑数据资产价值价格的时候,必须需要从数据上链前后时间内的成本花费、计算数据带来的收益和市场类似数据交易法等维度进行评估(见表1)。从商业便捷实用性和会计计量角度考虑数据资产的定义,数据的使用权、计算权等数据资源、资产、资本、经济概念可统一归类在数据资产的范围之中(叶雅珍等,2019),采用历史成本(初始计量和后续计量)的估值处理对数据资产定价更为实用(陆旭冉,2019)。
(二)信息有效共享
同时,关于数据的资产估值过程也要根据业务场景进行数据的收集,例如在食品安全溯源场景中,企业数据获取成本在區块链下的联盟链可能表现为食品的原料供应商、加工厂、包装厂等商品信息的“信息获取成本”。利用区块链为这些信息提供同一规则下的公布,可以价值化信息和优化原有产业链的透明度与监察机构的融入程度。特别是针对一些容易产生违法行为的商业场景,如“血钻石”指的是一些来源不明的钻石往往可能是以胁迫冲突获得的,却由于交易信息没有统一认证的原因而被正常的交易。这时候可以通过把钻石交易市场中的交易商、钻石鉴别机构、物流方等多主体接受区块链的分布式商业联盟,利用区块链技术的多智能主体“共同协作”、高“商业隐私保护性”补充原有的机制安全漏洞。通过分布式商业体系框架中的(图1所示)事件驱动下本地内置人工智能启动计算板块,利用智能合约(Junis等,2019)去中心化的协作AI(Harris和Waoner,2019)等技术进行赋能。
四、区块链技术框架下的对策建议
(一)构建分布式商业交互工程
分布式本质是多方共同拥有对等的信息并提高信息传递的效率,这对于政府的监管呼声提供了一个新的接入途径。区块链技术中所谓“分布式账本”并非取代原有的、必要的国家监督主体系统,如银行的原有的清算、审计系统等,而是提供涉及零知识、环签名、通道、混合器等(均可用于区块链技术体系之中)密码学领域的方法,在最大限度地保证各参与方隐私(数据资产)的情况下提供一个可监督、可信的信息交互的平台。尽管数据具有交换的价值量、必要性,但是数据本身隐含的信息不应该被泄漏,从商业数据拥有方的角度来说,其更加不可能在没有利润下主动的分享,这就要求我们提出新型的技术框架。借鉴学者在数字加密货币的流通性特点下建立的区块链架构基础上(刘滋润等,2019),在应用层把数字加密货币的内容转为数据资产,结合区块链在边缘计算的应用前景(方俊杰和雷凯,2020),区块链技术架构在商业场景的应用过程中应具备技术成效上可维护并支持贯穿整个系统的多个智能主体高效率地共协调、共决策;管理运营风险上可通过仿真的方法(李明飞,2019)模拟不同加密技术理论,并有效地利用权限管理和准入规则等构建信任;强调生产关系的对等过程中解决数据保护的问题(周艺华和李洪明,2020)。
如图1所示,搭建基于区块链、机器学习和边缘计算等金融科技的分布式商业体系框架。商业联盟的多智能主体指的是分数据使用(计算)方、数据资产提供方、个人授权数据与政府监督机构。在最上方的数据授权环节,各参与方通过个性化定制智能合约进行灵活交易信息、在多节点共同监督。授权后可自动访问相应范围内的数据库所在位置,在有良好维护的人工智能边缘计算下进行数据价值的实现,如图1的中间“事件驱动系统自动化操作部分”,最后的数据会被记录在分布式存储的区块链上。
(二)智能合约设计与生态治理
本文从区块链技术架构能解决的四个需求点出发,对企业确定是否需要引入区块链提出建议。基于工程的思想,对区块链产生的革命性信任机制产生的问题进行回顾,认为在金融场景落地应用仍需要解决技术、法律规范、监管机构的定位问题。然后通过分析“数据孤岛”造成的商业欺诈,认为数据不仅可以作为资产,更是一种“信任的重要来源”。随着商业场景下对数据交换的需求愈加强烈,提及了“开放银行”的出现实际上也是对分布式商业体系地呼唤。革命性地提出基于区块链的分布式商业体系框架,数据提供方、数据使用方还有公众、监管机构可利用区块链、人工智能等金融科技,共同参与数据授权。特别地更有利于数据应用场景的开发、数据交换激励机制的完善,达到最终实现数据价值的目的。而为满足以上框架生态治理的需求,基于区块链分享技术框架的分布式商业场景下布置,可使用智能合约充分满足应用的需求。基于Solidity的智能合约逻辑设计与用户接口自动化事件驱动,赋予分布式商业架构对数据的自主化存储、限制性访问、智能化计算的指令,有利于分布式商业体系中数据交换重要一环的形成。
如数据资产交换的提供方需要在区块链上提出数据目录存储申请,并能在链上提供数据的价值转移、数据使用方可在其账户中查询数据资产过去的使用情况等需求。整个区块链技术架构前期确定链上的业务逻辑后,可以根据智能合约的内容自动化运行。涉及内容如Account_data,用户的唯一识别(string);data_price,数据的价值(uint256)。对外接口设计(用于不同主体的操作)实现定向数据目录访问,根据数据的用途决定数据回收的dict类型含:{“不可回收”,“可回收”}等全方位管理数据资产的生命周期。
本文希望基于工程思想,不仅提出基于区块链的分布式商业信息共享、数据交换体系可以形成新的信任机制,且可用于解决传统商业信息不对称带来的弊端,更为该框架的治理体系构建如利用智能合约提供思路。
参考文献:
[1]HARRIS J D,WAGGONER B Decentralized and Collaborative AI on Blockchain[C],IEEE;City.2019.
[2]JUNIS F,PRASETYA F M W,LUBAY F I.A Revisit on Blockchain-based Smart Contract Technology[J].arXiv preprintarXiv:1907.09199,2019.
[3]OENTARYO R,LIM E-P,FINEGOLD M.Detecting click fraud in online advertising:a data mining approach[J].The Journal of Machine Learning Research,2014.15(1).
[4]RUOTI S,KAISER B,YERUKHIMOVICH A.Blockchain technology:what is it good for?[J].Communications of the ACM,2019.(1).
[5]陈一稀.区块链技术的“不可能三角”及需要注意的问题研究[J].浙江金融,2016(02).
[6]方俊杰,雷凯.面向边缘人工智能计算的区块链技术综述[J].应用科学学报,2020(01).
[7]贺海武,延安,陳泽华.基于区块链的智能合约技术与应用综述[J].计算机研究与发展,2018(11).
[8]李菲菲,关杨,王胜文.信息生态视角下供电企业数据资产管理模型及价值评估方法研究[J].情报科学,2019(10).
[9]李明飞.基于私有区块链的多源网络数据隐私保护仿真[J].计算机模拟,2019(08).
[10]李兴欣.区块链技术在我国银行支付清算应用研究[M].北京:北京邮电大学,2018.
[11]刘滋润,王点,王斌.区块链隐私保护技术[J].计算机工程与设计,2019.(06).
[12]陆旭冉.大数据资产计量问题探讨[J].财会通讯,2019(10):59-62.
[13]孙晋,袁野.区块链技术应用的反垄断隐忧及应对[J].学习与实践,2019(09).
[14]孙妮,康守松,刘晓峰.数据资产视角下商业银行大数据应用现状及发展前景分析[J].现代管理科学,2017(02).
[15]王鑫,陈力源.基于区块链技术多层供应链金融体系的优势、价值及构建——基于信用无损失传递的微观视角[J].南方金融,2020.
[16]吴朝平.API开放银行:金融科技背景下商业银行转型升级的重要方向[J].金融理论与实践,2020(01).
[17]夏俊杰,孙晔,杨海涛.基于区块链的数据资产保护与交易平台研究及应用[J].邮电设计技术,2019(9).
[18]杨东,潘曌东.区块链带来金融与法律优化[J].中国金融,2016(08).
[19]叶雅珍,刘国华,朱扬勇.数据资产相关概念综述[J].计算机科学,2019(11).
[20]中国信息通信研究院,华为技术有限公司.数据基础设施白皮书[M].2019.
[21]周艺华,李洪明.基于区块链的数据管理方案[J].信息安全研究,2020(01).