APP下载

区块链技术支持下电子数据保障方法探究

2019-05-24徐超姜国标陈勇

软件导刊 2019年5期
关键词:电子数据区块链

徐超 姜国标 陈勇

摘 要:电子数据是审计信息系统的基石,提升审计电子数据可靠性与可追溯性是加强审计信息系统建设必不可少的步骤。从审计电子数据采集、存储、传输三方面出发,总结目前国内外研究现状及存在的不足。以区块链技术为支撑,探讨审计电子数据采集及可信性确认机制、一致性传输及可追溯存储机制等可靠性与可追溯性加强方法的实现机制,并以此为基础提出区块链技术环境下审计方法变革的基本方案,为构建可靠可追溯的审计信息系统提供前瞻性探索。

关键词:区块链;电子数据;可追溯性

DOI:10. 11907/rjdk. 191302

中图分类号:TP301 文献标识码:A 文章编号:1672-7800(2019)005-0001-04

Abstract:Electronic data is the cornerstone of audit information system. Improving the reliability and traceability of audit electronic data is an indispensable step to strengthen the construction of audit information system. The paper summarizes the related researches from the aspacts of acquisition, storage and transmission of the audit electronic data. And it also shows the existing shortcomings of the audit electronic data. Then, based on blockchain technology, this paper discusses the realization mechanism of reliability and traceability enhancement methods, such as electronic data acquisition and trustworthiness confirmation mechanism, consistency transmission and traceability storage mechanism. Furthermore, it puts forward the basic scheme of audit method reform by blockchain technology, which makes proactive exploration for the construction of a reliable and traceable audit information system.

Key Words: block chains; electronic data; traceability

0 引言

2018年3月,中共中央印发的《深化黨和国家机构改革方案》明确:为加强党中央对审计工作的领导,构建集中统一、全面覆盖、权威高效的审计监督体系,更好发挥审计监督作用,组建中央审计委员会,作为党中央决策议事协调机构。习近平总书记在中央审计委员会第一次会议中强调:要深化审计制度改革,解放思想、与时俱进,创新审计理念,及时揭示和反映经济社会各领域的新情况、新问题、新趋势,要坚持科技强审,加强审计信息化建设。而审计信息化建设主要以审计电子数据为信息来源,通过分析挖掘审计电子数据中的相关性,达到发现问题、规避风险的目的。如果审计电子数据不可靠,审计信息化建设基石就不稳定,审计结果也就难以保证。如果审计电子数据不具备可追溯性,即使发现了问题也无法追根溯源,难以从根本上解决问题、规避风险。因此,构建高可靠且可追溯的审计电子数据是加强审计信息化建设的必经之路。

区块链技术是分布式数据存储、点对点传输、共识机制、加密算法等技术在信息时代的创新应用模式,被列为《“十三五”国家信息化规划》中的关键技术。目前,区块链技术已经应用到多个领域,包括数字资产交易、供应链管理、智能制造、物联网、知识产权保护等,并极大地促进了大数据、云计算等新技术发展,一些学者已经对区块链技术在审计中的应用进行了初步探索。Sutton[1]利用区块链技术设计了防篡改审计日志,并提供日志操作和不可篡改性证明模型,以保护隐私数据;Fridgen [2]将区块链技术应用于业务流程管理,实现了集设计、实施、评价于一体的整体解决方案,并通过实例验证了方案有效性;Suzuki[3]提出一种区块链技术验证系统方案,实施严格控制资源访问的审计日志,意在提高医疗客户服务器系统请求响应通道安全性;樊斌[4]针对会计和审计领域,对区块链技术在该领域的应用可行性、发展趋势进行了探讨;许金叶[5]以会计监督为研究对象,将区块链技术的不可篡改性、可追溯性、智能合约等关键特征融入其中,指明其积极意义;陈旭[6]将区块链技术与实时审计相结合,初步探析了其可行性;黄冠华[7]在联网审计领域对区块链技术应用的可行性进行了探索,分析了区块链技术在改进联网审计各个层面的风险,并提出有针对性的解决方案。

区块链技术环境下的审计技术方法研究,受到国内外学者热捧,也是目前的研究热点。区块链与审计相结合还处于初步研究阶段,本文将结合区块链技术,对信息时代下审计电子数据可靠性和可追溯性加强方法进行探究,为后续审计信息化建设奠定坚实基础。

1 审计电子数据国内外研究现状

1969年在美国洛杉矶成立的电子数据处理审计协会(EDPAA)和1984年颁布的国际审计准则15号《电子数据处理环境下的审计》,有力地推动了全球计算机审计实务发展。我国对审计电子数据可靠性的研究相对较晚。潘晓江[8]最早提出数据可靠性概念:“数据可靠性是指数据真实、合法、完整、准确的状态。会计电算化工作, 从系统设计开始就必须十分注重数据可靠性控制。”对我国计算机审计与电子数据可靠性研究具有启发和借鉴作用。郑石桥[9]提出一个理论分析框架,用于分析审计电子数据的技术属性和逻辑过程。中国审计署也制订了一系列内部规则,规范其在收集、转移、存储、分析和保护数据方面的行为。目前,国内外审计电子数据研究主要集中在以下几个方面:

1.1 采集完整性研究

电子数据采集决定审计工作能否高效准确,获取真实和完整的电子数据,是开展审计数据分析的第一步,学者们在采集模式和理论方法上作了大量研究。徐超[10]将国家审计署大数据审计工作总结为“三个集成、五个关联”。三个集成即数据、分析、审计工作集成;大数据审计工作包括针对被审计单位建立采集、分析、保护数据的机制,规范其在收集、转移、存储、分析和保护数据方面的行为,建立专门部门和多个交叉团队管理数据,深度挖掘数据价值;Samtani[11]提出一种文本挖掘方法评估数据采集系统的脆弱性,确定了55 000多个数据采集系统存在漏洞;Lee[12]对远程采集和存储的流数据进行完整性检查;Colombo[13]设计了一个大数据采集系统仿真模型,在此基础上开发了仿真工具,通过比较模拟仿真结果,验证了工具的有效性;陈琦[14]以C#为开发语言,提出一种针对文本格式数据、Excel 数据和Access 数据的审计电子数据采集方法;赵华[15]面向Oracle数据库,实现了一种能辅助审计人员快速掌握数据含义的转换工具,提升审计电子数据采集效率与审计分析能力;董海韬[16]以中间人原理为基础,提出一种安全套接层/传输层安全保密网络数据的明文采集方法,解决了互联网上使用安全套接层/传输层安全协议保密数据难以审计的问题;赖春林[17]以医疗保险基金审计为例,研究如何有效采集审计电子数据;卢学英[18]以数据采集、数据清理、数据转换、数据验证4个阶段为出发点,概述了电子数据完整性保证方法;张志恒[19]提出基于文本挖掘的审计数据分析框架,并阐述了采集与存储、挖掘与分析、总结与发布的审计数据分析流程;王志之[20]从审计获取原始数据存在的质量问题入手,探讨了如何改善审计采集原始数据质量,提高数据可分析性。

1.2 传输一致性研究

在审计过程中,电子数据通常需要经过多次传输。无论在数据库领域还是在理论计算机科学领域,数据传输一致性是国内外学者不容忽视的问题。徐超等[21]通过对DES和RSA加密技术进行分析, 设计了一种基于DES和RSA算法的数据加密传输系统,能够适用于不同应用环境;Fan[22]利用时效约束条件,提出一种无时间戳条件下查询数据时效的方法;Papenbrock[24]基于规则约束,提出一种一致性规则发现方法;Wang[25]针对CFDs在一致性检测和修复方面问题进行了探讨;杜岳峰[23]从数据一致性和时效性为出发点,对修复错误数据进行了研究,提出一种基于关联数据的一致性和时效性清洗方法,并采用一种启发式修复方法对错误进行修复,提高修复的准确性;杨东华[26]认为数据质量问题会对大数据应用产生致命影响,提出一种基于任务合并的优化技术。针对冗余计算和利用同一输入文件的简单计算进行合并,分别对实体识别模块、不一致数据修复模块和缺失值填充模块进行优化;冉德彤[27]利用条件函数依赖,提出一种记录比较方法,通过一致性信息计算属性相似度,完成记录比较。

1.3 存储研究

随着审计信息化建设的加强,审计电子数据将呈现指数级增长,如何高效安全地存储大数据并支持实时大数据分析,是大数据审计技术发展面临的首要问题。金瑜[28]提出一种基于MapReduce框架的云存储数据审计方法,主要基于代理签名技术,将数据签名进行并行化处理和批量审计,以保障云存储服务的有效性;何诚刚[29]以模糊C均值聚类理论为指导,设计了一种信息存储效率管理方法;马晓亭[30]提出一种大数据平台多维度敏感数据保护方法;潘明[31]为了防止多维度敏感数据泄露,针对公积金系统中不同类别的数据进行脱敏操作,以保证用户信息安全;刘明辉[32]研究了云环境下敏感数据所面临的安全风险,在敏感数据分类分级基础上给出云环境下敏感数据保护技术方案;董新华[33]通过分析敏感数据安全现状,提出一个大数据平台敏感数据安全共享系统框架。

1.4 研究现存不足

目前,审计电子数据的研究已经取得了一定成果,但仍然存在一些不足。

(1)关于审计电子数据采集的研究,主要集中在电子数据采集效率方面,即如何利用有效方法与工具快捷高效采集电子数据,缺乏对审计单位提供電子数据本身的完整性与可靠性研究。

(2)关于审计电子数据传输一致性研究,主要集中在单主题参与的约束规则、数据一致性分析、数据时效性分析3个方面,对于多主体参与情况下电子数据传输一致性考虑较少,缺乏对多主体环境下电子数据传输一致性可靠性评估模型,以及该模型指导下的电子数据传输有效性策略研究。

(3)关于审计电子数据的存储研究,主要集中在存储效率与存储安全相关问题,鲜有文献对多副本方式存储的数据可追溯性进行深入探讨,因此对于可追溯性需求强烈的审计电子数据而言,该方面还有待进一步研究。

2 基于区块链技术的审计电子数据可靠性加强方法探究

区块链技术融汇了分布式架构、块链式数据验证及存储、点对点网络协议、加密算法、共识算法、身份认证、智能合约、云计算等多类技术,具备去中心化、保障数据完整性、透明性、不可撤销性等特征,对于解决审计电子数据的可靠性和可追溯性具有独特优势。基于区块链技术对审计电子数据可靠性及可追溯性进行研究,必将极大推动审计信息化建设。

2.1 审计电子数据采集及可信性确认机制

审计电子数据采集是审计过程的关键环节。在大数据环境中,审计电子数据多而复杂,涉及多方主体,采集的电子数据通常夹带大量噪声,其完整性、真实性很难保证。因此,可以基于区块链技术,自动采集各个审计节点单位的每笔待审计记录,并将其定时分批加密进行广播。设计分布式节点自动解密和验证机制,对每笔待审计记录涉及的关联方进行交叉确认。经过确认的审计记录数据添加时间戳和加密机制后被确认加入区块链,无法再进行修改。与传统审计数据采集方法相比,基于区块链技术的审计数据采集方法具有质量高、实时、无法篡改、可追溯特点,将大大减少审计过程中的低层次重复劳动, 解决审计电子数据采集不完整、不真实、难以应用于全覆盖审计分析的问题。

主要包括以下3个方面:

(1)规范化审计电子数据采集模式构建。针对现有审计电子数据常用特征、干扰数据特征等不同因素,按领域分类别,逐层构建规范化审计电子数据采集模式,确保采集内容满足审计系统需求,消除大量噪声和干扰数据。

(2)審计电子数据完整性评估模型建立。基于区块链历史块对审计电子数据跟踪记录,结合具体审计系统对采集到数据的利用情况,定量分析各类数据对审计结果的影响及人为故意造假概率,并以概率论和统计学为基础,利用机器学习方法建立审计电子数据完整性评估模型。

(3)基于区块链多方主体的采集数据真实性交叉确认机制。基于区块链多方主体提供的业务数据,对通过规范化模式采集的审计电子数据进行定量评估,并进行多主体交叉验证确认,自动确定该采集数据的真实性,将确认后的采集数据,结合完整哈希值和时间戳,组成一条独立数据,并进行全网广播,添加到区块链中。

2.2 审计电子数据一致性传输与可追溯存储机制

在传统审计环境中,审计电子数据需要汇集到中心节点,其安全性和可用性受到中心节点服务器与网络带宽限制,而基于区块链技术的审计数据分布式存储方式可以避免这些限制, 解决审计电子数据提取难、追踪难的问题。因此,可从以下4个方面开展研究。

(1)基于可信时间戳的电子数据传输一致性模型构建。基于区块链的时间戳机制,以每组数据传输前后的时间戳为主要参数,结合审计电子数据传输方式、数据量、数据重要程度、可恢复能力等数据相关信息,构建数据一致性评估模型,为数据传输过程中的可靠性评估提供依据。

(2)基于多副本共识的电子数据存储有效性评估模型构建。以区块链多副本共识技术为基础,将审计电子数据以多副本方式分布式存储,并根据存储地点、安全等级、管理权限等多方面因素,对其存储的副本进行本地评估,最后综合所有副本的评估结果,构建该副本当前存储有效性评估模型。

(3)基于存储可靠性评估模型的电子数据可用性检验方法设计。在使用审计电子数据前,以存储有效性评估结果为标准,先对该电子数据有效性进行评估,然后结合评估值及该数据使用范围确定可用性,避免错误数据进入审计系统,导致重大审计风险。

(4)基于B+树索引的存储数据历史修改记录快速追溯跟踪方法设计。基于区块链技术对审计数据进行组织,并根据审计电子数据类型、属性等多个因素,以B+树的方式构建多级索引。基于该索引及区块链的链式结构,设计数据修改记录的快速追溯跟踪方法,一方面追溯存储不可靠原因,另一方面保障重要数据的可重构性,为实现快速可跟踪审计奠定基础。

2.3 区块链技术环境下审计方法变革

区块链技术环境下,要实现审计电子数据的有效利用,传统审计方法与流程将不再适用。因此,在区块链审计技术初步实现基础上,可从以下几个方面进一步探索研究审计方法和流程变革, 为大数据环境下现代审计流程的革新奠定坚实基础。

(1)区块链技术环境下审计流程再造研究。区块链环境下审计实施流程利用区块链技术手段,结合流程再造思想,重塑现有审计制度和审计组织体系,创新审计实施流程。

(2)区块链技术环境下跨组织工作流管理研究。区块链技术环境下,各个审计关联主体将不再孤立。这些主体之间的资金流、信息流和业务流通过区块链连为一个有机整体。各主体积极参与是区块链有效运行的前提和保障,如何设计激励、协调和管理机制,对区块链中跨组织实体的工作流进行有效管理是一个崭新的管理问题。

(3)区块链技术环境下实时风险评价和审计异常预警研究。与传统现场审计相比,区块链技术可以保障实时审计在线监督和审查,使实时风险评价和实时审计异常预警成为可能。因此,需要建立一个具有模型库、知识库及数据分析功能的实时决策支持模型,通过数据实时分析挖掘、审计模型预测及知识库客观评价,及时发现审计疑点或审计线索。

3 结语

区块链技术应用于审计行业是未来审计信息化建设趋势所在。区块链技术对审计信息化最重要的贡献在于:分布式账簿中每个参与者均可获得唯一、真实的账簿副本,使审计地点不再受限;审计人员通过一套公私密钥和数字签名等安全机制获得账簿访问权,使被审计单位的隐私和机密得到有效保护,符合《意见》中对审计资料严格保密的要求;账簿的任何改动会实时备份于所有副本中,某一参与者单方发起的任何修改都需要征得全链多数参与者(现阶段区块链设置阈值为51%)同意以及全体参与者确认,从而实现审计数据在区块链网络内公开和透明,总体上降低了审计风险。

本文结合区块链技术,对审计电子数据采集、存储、传输的可靠性和可追溯性进行了前瞻性探索,并对区块链技术环境下审计方法的变革方案进行了分析,为未来区块链技术在审计领域的应用提供了有力支撑。

参考文献:

[1] SUTTON A, SAMAVI R. Blockchain enabled privacy audit logs[C]. International Semantic Web Conference, 2017:645-660.

[2] FRIDGEN G, RADSZUWILL S, URBACH N, et al. Cross-organizational workflow management using blockchain technology-towards applicability, auditability, and automation[C]. Hawaii:International Conference on System Sciences,2018.

[3] SUZUKI S,MURAI J. Blockchain as an audit-able communication channel[C]. Computer Software and Applications Conference, 2017:516-522.

[4] 樊斌,李银. 区块链与会计、审计[J]. 财会月刊,2018(2):39-43.

[5] 许金叶,朱鸯鸯. 区块链信息技术对会计监督的影响研究[J]. 会计之友,2018(1):156-160.

[6] 陈旭,冀程浩. 基于区块链技术的实时审计研究[J]. 中国注册会计师,2017(4):67-71.

[7] 黄冠华. 区块链改进联网审计途径研究[J]. 财政科学,2016(10):84-91.

[8] 潘晓江. 电子计算机审计与数据可靠性控制——会计电算化之后现代审计的对策(续)[J]. 会计研究, 1983(5):54-58.

[9] 郑石桥. 电子数据审计的技术属性和逻辑过程:一个理论分析框架[J]. 江苏社会科学,2016(6):37-44.

[10] 徐超. 浅析各国大数据审计工作现状——基于世界审计组织大数据工作组第一次会议的研讨结果[EB/OL]. http://www.audit.gov.cn/n6/n41/c96373/content.html.

[11] SAMTANI S,YU S,ZHU H,et al. Identifying supervisory control and data acquisition (SCADA) devices and their vulnerabilities on the Internet of Things (IoT): a text mining approach[J]. Intelligent Systems,2018 (99):1.

[12] COLOMBO T, FR?NING H, GARCìA P J, et al. Optimizing the data-collection time of a large-scale data-acquisition system through a simulation framework[J]. Journal of Supercomputing, 2017:1-27.

[13] LEE K M, SANG H L. Remote data integrity check for remotely acquired and stored stream data[J]. Journal of Supercomputing, 2017(9):1-20.

[14] 陈琦,陈伟. 一种基于C#的审计数据采集方法的设计与实现[J]. 中国管理信息化, 2015(17):37-39.

[15] 趙华,闵志刚. Oracle审计数据的采集与转换[J]. 审计与理财, 2015(3):17-18.

[16] 董海韬,田静,杨军,等. 适用于网络内容审计的SSL/TLS保密数据高效明文采集方法[J]. 计算机应用,2015,35(10):2891-2895.

[17] 赖春林. 如何有效利用审计采集的数据——以医保基金审计为例[J]. 审计与理财, 2016(11):17-18.

[18] 卢学英. 计算机审计中如何获取真实完整的电子数据[J]. 价值工程, 2017, 36(20):205-206.

[19] 张志恒,成雪娇. 大数据环境下基于文本挖掘的审计数据分析框架[J]. 会计之友, 2017(16):117-120.

[20] 王志之. 审计数据预处理探析[J]. 中国经贸,2017(16):260-261.

[21] 徐超,葛红美. 基于DES和RSA算法的数据加密传输系统设计[J]. 通信技术, 2010, 43(4):90-92.

[22] FAN W,GEERTS F, YU W, et al. Conflict resolution with data currency and consistency[J]. Journal of Data & Information Quality, 2014,5(1-2):1-38.

[23] 杜岳峰,申德荣,聂铁铮,等. 基于关联数据的一致性和时效性清洗方法[J]. 计算机学报, 2017(1):92-106.

[24] PAPENBROCK T, EHRLICH J, MARTEN J,et al. Functional dependency discovery: an experimental evaluation of seven algorithms[J]. Proceedings of the Vldb Endowment,2015,8(10):1082-1093.

[25] WANG J, TANG N. Towards dependable data repairing with fixing rules[C]. ACM SIGMOD International Conference on Management of Data, 2014:457-468.

[26] 杨东华,李宁宁,王宏志,等. 基于任务合并的并行大数据清洗过程优化[J]. 计算机学报, 2016(1):97-108.

[27] 冉德彤,游宏梁. 一种基于数据一致性的记录比较方法[J]. 电子设计工程, 2018,26(1):66-69.

[28] 金瑜,严冬. 基于MapReduce的云存储数据审计方法研究[J]. 计算机科学,2017,44(2):195-201.

[29] 何诚刚. 大规模电子通信信息存储效率管理仿真[J]. 计算机仿真,2017,34(9):175-178.

[30] 马晓亭. 图书馆大数据平台多维度敏感数据保护研究[J]. 图书馆,2017(2):70-75.

[31] 潘明. 数据脱敏在公积金系统中的运用[J]. 信息技术与信息化,2015(17):150-151.

[32] 刘明辉,张尼,张云勇,等. 云环境下的敏感数据保护技术研究[J]. 电信科学,2014,30(11):1-8.

[33] 董新华,李瑞轩,何亨,等. 一种大数据平台敏感数据安全共享的框架[J]. 科技导报,2014, 32(34):47-52.

(责任编辑:何 丽)

猜你喜欢

电子数据区块链
区块链技术的应用价值分析
“区块链”的苟且、诗和远方
用“区块链”助推中企走出去