基于CiteSpace分析的区块链技术可视化研究
2019-02-27CHENGHaoZHANGZheng
程 豪,张 峥 CHENG Hao,ZHANG Zheng
(上海理工大学 管理学院,上海 200093)
0 引言
2008年,中本聪(Satoshi Nakamoto)在密码学邮件组里发表了一篇关于以密码学为基础的电子货币理论的论文,该论文中的电子货币就是目前的比特币[1]。支持比特币发展的是区块链[2],区块链是一种防篡改、共享的数字化账本,用于记录公有或私有对等网络中的交易,并由集体维护交易数据的分布式数据库。账本分发给网络中的所有成员节点,在通过哈希密码算法链接的区块的顺序链中,永久记录网络中的对等节点之间发生的资产交易的历史记录。所有经过确认和证明的交易都从链的开头一直链接到最新的区块,因此得名区块链[3]。
作为新兴技术的中坚力量,区块链是信息技术领域一个新兴重要议题[4]。在区块链迅速发展的背景下,它的发展受到各国的高度关注。为了描绘区块链技术研究的整体框架,以便国内学者清晰地了解其研究现状和发展趋势,本文应用科学文献和知识图谱可视化软件CiteSpace V对区块链技术研究进行深入分析[5],对2008~2017年该领域的研究现状进行梳理与总结,客观揭示区块链技术研究发展态势,为该领域研究框架梳理提供一种新的参考方法。
1 对象与方法
1.1 数据来源
Web of Science(WoS)核心合集是获取全球学术信息的重要数据库,收录了论文中所引用的参考文献,并按照被引作者、出处和出版年代编成独特的引文索引。本文于2018年10月25日在数据库Web of Science核心合集中收集数据,保证了研究结果的相对科学性。根据区块链技术的研究主题,限定“主题(Blockchain)”,“时间跨度=2008~2017”对英文文献进行精炼,剔除相关度较低的文献,共计检索出有效文献477篇,其中每条记录包括文献的作者(Authors)、题目(Title)、摘要(Abstract)和文献引文(Reference),以纯文本的格式进行保存,记录内容为全记录与引用的参考文献。
1.2 分析工具
CiteSpace是由美国德雷塞尔大学陈超美教授开发,运用科学计量学,对数据和信息进行可视化分析,使复杂的信息变得直观形象,以挖掘科学分析中蕴含的潜在规律,得到知识图谱的引文可视化分析的Java应用程序软件。本文运用CiteSpace V软件,以区块链技术研究领域的文献为研究对象,对从Web of Science中精炼得到的477篇文献进行合作网络分析、共被引分析、共现分析,得到所需的知识图谱,廓清区块链技术领域的研究情况。
2 结果与分析
2.1 文献年度分布
在Web of Science中通过主题检索的方式,检索到文献477篇,对这477篇文献做初步的梳理,得到区块链技术研究文献的年度分布如图1所示。
比特币的实践从2008年10月31日就拉开了帷幕,并与2009年建立了世界第一个区块链。但根据图1看出,2008~2012年的发文量为零,所以区块链技术的研究从2013年才真正开始,2015年之后出现快速发展趋势。出现快速发展趋势与2015年1月26日比特币交易平台coinbase的上线、2015年10月中旬首届全球区块链峰会的举行有关。
2.2 国家合作网络分析
将数据导入CiteSpace软件中,选择“Country”为节点,阈值选择Top N=30,进行国家合作网络分析,通过整理后得到图2和表1。图谱中一个节点代表一个国家,节点的大小代表该国发文量的多少。中心度是测量节点在整个网络图谱中重要性的一个指标,在CiteSpace软件中,该指标可以表示数据库中文献的重要程度。中心度越大,其在该领域的影响力就越大[6]。
图1 区块链技术研究文献年度分布
图2 区块链技术领域国家合作网络图谱
表1 区块链技术研究领域的主要国家
由图2和表1分析可知,在区块链技术研究领域发文量排名前10的国家分别是美国(USA)103篇、中国(China)92篇、英国(England) 37篇、德国(Germany) 30篇、意大利(Italy) 28篇、日本(Japan) 27篇、澳大利亚(Australia) 24篇、法国(France)23篇、瑞士(Switzerland)17篇、印度(India)15篇。美国和中国不仅在区块链技术研究领域的发文量远远超过其他国家,且与其他国家之间的合作关系也更为突出。美国在区块链技术研究领域不论是发文量还是中心度都是第一,说明美国在该研究领域处于引领地位。我国在该领域的发文量处于第二,但是中心度不高,中心度只有0.20,表明我国的区块链技术研究在该领域的影响力不高,区块链技术研究水平有待进一步提高。
2.3 作者共被引分析
通过作者进行共被引分析,可以对区块链技术领域研究者之间的合作关系和程度进行识别,从而发现该研究领域的关键人物。将数据导入CiteSpace软件中,选择“Cited Author”为节点,阈值选择TopN=30,进行作者共被引分析,通过整理后得到图3和表2。图谱中的节点越大,说明作者的被引频次越高,在区块链技术研究领域的地位越重要。
图3 区块链技术领域作者共被引图谱
从图3和表2中可以看出,Satoshi Nakamoto被引频次最多,拥有最大的引文年环,高达241次,他是比特币的开发者兼创始者,创造了比特币协议及其相关软件Bitcoin-Qt。因此,他的观点及领导会对比特币的未来产生重大的影响。Vitalik Buterin被引频次达61次,是区块链平台以太坊创办人兼首席科学家。以太坊的创造,将区块链从1.0时代推进到了2.0时代。以太坊打破了过去区块链平台的疆界,让开发者可以更轻易地开发各种区块链应用[7]。Gavin Wood主导了以太坊的原型设计、系统开发以及最后版本的测试发布,奠定了以太坊的技术基石[8]。Eyal.I将比特币作为点对点电子货币推出,以促进传统金融体系之外的交易,旨在完全分散电子交易[9-10]。Melanie Swan是区块链科学研究所的创立者,首次将区块链技术分为1.0、2.0和3.0三个研究阶段,并指出三个研究阶段的具体内容[11]。Guy Zyskind通过提高云数据共享的灵活性,在保证客户私人重要信息安全的前提下,帮助公司对客户信息进行分析[12]。Christian Decker奠定了PSP网络(支付服务提供商的网络)的基础,他提出的双工微支付信道协议,保证了端到端的安全性并允许即时传输[13]。Sarah Meiklejohn提出比特币是一种纯粹的在线虚拟货币,在物理上没有获得支持[14]。Konstantinos Christidis指出区块链—物联网组合功能强大,可以引起多个行业的重大转变,为新的商业模式和新颖的分布式应用铺平了道路[15]。Joseph Bonneau从数字货币及智能合约技术层面,研究区块链技术在金融领域的运用[16]。
表2 被引次数最多的前10位作者
2.4 文献共被引分析
通过文献进行共被引分析,能更加深刻地把握区块链技术领域的研究情况。学术文献的被引频次可作为文献价值的重要依据,一些高被引学术文献是学科发展的基础,对于学科的发展十分重要。将数据导入CiteSpace软件中,选择“Cited Reference”为节点,阈值选择TopN=30,进行文献共被引分析,通过整理后得到图4和表3。
图4 区块链技术领域文献共被引图谱
分析图4和表3,从文献被引频率可以看到,近几年对区块链技术发展影响较大的文章主要有Satoshi Nakamoto在2008年发表的Bitcoin:A Peer-to-Peer Electronic Cash System,该文第一次提出比特币的概念,给出了对比特币的完整构想,依次介绍了比特币中最重要的概念,包括交易、时间戳服务器、工作量证明、交易在网络中的过程、激励、回收硬盘空间、简化的支付验证、价值的组合与分割、隐私,最后论文通过概率论(泊松分布)证明攻击者难以制造一条更快的区块链,无法完成攻击[17]。第二篇影响较大的文献是Melanie Swan在2015年发表的Blockchain:blueprint for a new economy,该文献证明了区块链技术的许多概念和功能可以广泛地扩展到各种各样的情况,随着时间的推移,区块链技术可能存在于更大的生态系统中集中式和分散式模型[18]。第三篇影响较大的文献是Konstantinos Christidis在2016年发表的Blockchains and Smart Contracts for the Internet of Things,该文献详细描述区块链—物联网组合:(1)促进服务和资源的共享,从而在设备之间创建服务市场;(2)允许我们以加密可验证的方式自动化几个现有的、耗时的工作流程。他指出在物联网环境中部署区块链网络之前应该考虑从交易隐私到网络上交易的数字化资产的预期价值,区块链—物联网组合功能强大,可以引起多个行业的重大转变,为新的商业模式和新颖的分布式应用铺平了道路[15]。第四篇影响较大的文献是Wood Gavin在2014年发表的Ethereum:A securedecentralised generalized transaction ledger,该文献指出区块链范式与加密安全交易结合时,已经通过很多项目证明了它的实用性,尤其是比特币。第五篇影响较大的文献是Sarah Meiklejohn在2013年发表的A Fistful of Bitcoins:Characterizing Payments Among Men with No Names,在这项研究中提出了纵向表征比特币网络,专注于服务的兴起和不断增长的差距研究[14]。
表3 被引排名前5的文献
2.5 关键词共现分析
关键词是对文章主旨的高度概括、文章核心内容浓缩和提炼出的词,能体现出文章的核心思想,文章中出现频次较高的关键词可反映该领域的研究热点[19]。将数据导入CiteSpace软件中,选择“Keyword”为节点,阈值选择TopN=30,进行关键词共现分析,通过整理后得到区块链技术领域的研究热点,如图5和表4。
图5 区块链技术领域关键词共现图谱
表4 区块链技术研究领域的高频关键词
由图5和表4可以看出,“区块链(blockchain)”、“比特币(bitcoin)”、“智能合约(smart contract)”是区块链技术研究领域最关键的三个节点。当关键词中心度的值大于等于0.1时,说明这个关键词具有很强的中心性,在合作网络中具有枢纽性的作用,在表4中,中心度较高的词有区块链(blockchain)、加密货币(crypto currency)、比特币(bitcoin)、密码协议(cryptography)、物联网(internet of thing)、安全(security)、智能合约(smart contract)、隐私(privacy)、去中心化(decentralization)、一致性(consensus)、模型(model)、可扩展性(scalability)。
除了区块链(blockchain)这个自我指向性的关键词外,通过文献内容的梳理和相关文献的研读,可以发现区块链其他两个关键的节点的具体内容。比特币(bitcoin)具有去中心化、全球流通交易费用低、无隐藏成本,且匿名、免税、免监管等优点,是利用分布式储存的区块链技术进入大众视野,是区块链技术的典型实际应用。区块链是比特币的底层技术,比特币相当于区块链技术的第一个应用。因而成为区块链技术研究领域的热点。智能合约(smart contract)是以数字形式定义的一连串承诺,帮助合约参与方完成这些承诺的执行的协议[20]。区块链具有分布式记账、全流程记录、不可篡改性和加的特点,为智能合约提供了安全可靠的执行环境,而智能合约可扩展区块链的应用范围[21]。随着对于区块链技术中智能合约的研究,会使智能合约技术不断进步,为区块链技术提供重要支撑。
通过对文献的梳理,按照研究层面的归类,区块链技术的研究可以分为三个层面:(1)底层技术层面,高频关键词有区块链技术(blockchain technology)、物联网(internet of thing);(2) 核心技术层面,高频关键词有去中心化(decentralization)、访问控制(access control)、安全(security)、信任(trust)、隐私(privacy)、云计算(cloud computing)、可扩展性(scalability);(3)应用技术层面,高频关键词有比特币(bitcoin)、以太坊(Ethereum)、智能合约(smart contract)、数字货币(digital currency) 加密货币 (crypto currency)。
2.6 研究前沿分析
为了更加清晰地了解每个时间段的研究热点,利用关键词生成时区态势图谱,能够看出区块链技术从2008~2017年的发展脉络及研究热点的变化,同时也能够看出区块链技术的研究前沿。图6反映了区块链技术从2008~2017年的研究热点变化态势及研究热点间的联系,其中最右上角的关键词代表区块链技术的研究前沿,反映了该研究领域的未来发展趋势。
图6 区块链技术研究领域前沿时区态势图谱
从图6中可以看出,2013~2017年的关注研究热点依次是比特币(bitcoin)、隐私 (privacy)、加密货币 (crypto currency)、智能合约 (smart contract)、安全(security)、以太坊(Ethereum)、去中心化(decentralization)、密码协议(cryptography) 等;2013~2017年区块链技术的研究一直是研究的重要热点。随着研究方向的变化和社会发展的进步,很多研究热点随之改变,区块链技术的研究前沿主要是安全(security)、密码协议(cryptography)、智能合约(smart contract)等领域的研究。
3 结论
本文利用信息可视化软件CiteSpace V,以Web of Science核心合集中2008~2017年477篇关于区块链技术研究文献为数据池,对区块链技术研究文献分别进行国家合作网络分析、作者共被引分析、文献共被引分析、文献共被引聚类分析、关键词共现分析、研究前沿分析,并在客观数据基础上进行讨论,梳理了区块链技术研究的知识网络和知识结构。研究结论表明:
(1)区块链技术研究文献从2015年后出现快速发展的趋势。区块链技术发展时间不长,特别是学术领域还处于探索阶段,这为学者专家提供了广阔的研究空间。
(2)美国在区块链技术研究领域处于世界引领地位。我国在该领域的发文量处于第二,但中心度不高,中心度只有0.20,与美国相比还存在一定差距,区块链技术研究水平有待进一步提高。
(3)通过作者共被引分析可知,区块链技术研究领域的高影响力人物有Satoshi Nakamoto Vitalik Buterin,Gavin Wood,Eyal.I,Melanie Swan,Guy Zyskind,Christian Decker等人。
(4)通过文献共被引分析可知,近几年对区块链技术发展影响较大的文献主要有Bitcoin:A Peer-to-Peer Electronic Cash System;Blockchain:blueprint for a new economy;Blockchains and Smart Contracts for the Internet of Things;Ethereum:A secure decentralised generalised transaction ledger;A Fistful of Bitcoins:Characterizing Payments Among Men with No Names,这些文献对于区块链技术领域的研究具有重要的参考意义。
(5)通过关键词共现分析可知,区块链技术的研究可分为底层技术层面、核心技术层面、应用技术层面三大层面。其研究热点包括加密货币(crypto currency)、比特币(bitcoin)、密码协议(cryptography)、物联网(internet of thing)、安全(security)、智能合约(smart contract)、隐私(privacy)、去中心化(decentralization)等。
(6)通过研究前沿分析可知,发现区块链技术的研究前沿主要是安全(security)、密码协议(cryptography)、智能合约(smart contract)等领域的研究。