区块链大数据审计应用问题与对策研究
——以探索广东省组建联盟链为例
2021-03-24詹宏锋黄璐
詹宏锋 黄璐
(广东科学技术职业学院,广东珠海 519090)
0 引言
区块链(Block chain)概念最早是在中本聪的比特币白皮书中提到的以工作量证明链(proof-of-work chain)的形式而存在,是由一串使用密码学方法产生的数据块组成的,每一个区块都包含了上一个区块的哈希值(hash),从创始区块(genesis block)开始连接到当前区块,是使用时间戳及非对称加密算法由上一个区块产生新的哈希值形成块链。区块链是各参与方基于共识机制建立数字信任的分布式共享账本,是分布式数据存储、P 2 P 传输、密码学、分布式系统、共识机制、加密算法、博弈论集成等计算机技术的新型应用模式,在分布式账本中每条记录都有一个时间戳和唯一的密码签名,使所有交易具有可审计历史,是数据存储、点对点传输、共识机制、加密算法等计算机技术的集成应用,基于共识算法的实时运行系统指定了数据可以共享,基于智能合约的规则使技术性信任可以认证,基于加密算法的P2P使交易双方可以互选。存储的数据或信息,具有不可伪造、全程留痕、可以追溯、公开透明、集体维护等特征[1]。区块链包含公有链、联盟链、私有链三种,其特点如图1公有链、联盟链、私有链特征分析如图所示。
区块链大数据审计,是基于区块链技术特性的数据区块形成的大量数据采用大数据技术进行新时代审计作业信息化的审计方式。是在传统审计中融合了区块链新一代高新技术,优化和补充了传统审计工作的短板,可实时、全面的用于数智化审计,进一步降低审计成本、审计证据可靠和审计效率提升;有利于推动审计内容向财务绩效转变;有利于推动审计模式向持续审计转变;有利于推动审计职能向预防及监督相结合的事中事前审计;为解决审计工作中存在的瓶颈问题提出新的探索和实践方向。
1 现状及存在问题
1.1 国内外现状
图1 公有链、联盟链、私有链特征对比分析图Fig.1 Comparative Analysis of public chain, alliance chain and private chain
近几年各国政府对区块链技术普遍采取积极支持的态度[2]。国内外学者针对区块链技术及大数据审计研究,不同领域的研究观点还存在一些分歧。目前我国对区块链在各行业的应用正不断深入,我国已将区块链发展列为国家规划,国家审计署官网发表《在大数据审计中应用区块链技术的一点设想》表明积极态度。何宝宏认为,区块链和大数据技术存在一定的共性;陈伟认为大数据审计是新的计算机审计方式。各行业对区块链的应用也正显井喷式发展态势,未来潜力空间无限。目前,总体来说,在国内发达地区在大数据审计投入、跨单位基础数据对接、数据采集、数据清洗、数据分析的方法和信息系统的运用、技术手段和人才储备方面远高于欠发达地区,各地区在大数据审计的运用总体水平尚不平衡,而基于区块链的大数据审计的运用目前还属研究探索阶段。广东省对于大数据审计的发展和运用更为重视,随着全省构建审计“一盘棋”格局的实施,以三级审计机关联动审计方式,全省在不断地深入推进审计项目和审计组织方式“两统筹”,推动各类审计项目深度融合,实行审计成果共享。通过基于区块链的大数据审计可以不断提高精准发现问题、及时揭示风险、准确评价判断、宏观系统研究的能力,有效提升审计监督效能[3]。
1.2 当前还存在的主要问题
(1)数据互联互通和真实性方面。目前被审计单位的电子数据大部分是由各单位自主建立的单一信息化管理平台进行管理与维护,数据与平台相对封闭,数据孤岛的瓶颈尚未完全解决。再者也存在内部人员可能有意或者无意的删除和篡改数据等不当行为的风险,且数据不能很好地交叉验证,使目前对电子数据的真实性验证存在一定局限性。
(2)在安全存储管理方面。由于被审计单位提供电子数据常含有详细的、潜在的能够反映被审计单位机密的信息,易遭受恶意攻击,电子数据被篡改等安全存储的技术问题,不利于提高审计工作的效率。
(3)数据采集标准性和可靠性方面。在电子数据采集传递中仍存在数据结构与接口不统一、标准化程度不高、互联互通程度不足,导致数据失真,同时也存在接口安全的风险,较难验证数据的可靠性和一致性。
(4)审计技术要求方面。实行电子数字化信息的现代审计方式,除了需要审计的专业技术外,同时对计算机等综合型人才的需求也提出了更高的要求。
2 组建联盟链实现基于区块链的大数据审计应用对策及分析
2.1 组建联盟链
区块链与大数据审计的融合,现阶段可按已上链数据和未上链的审计大数据分别考虑。通过对应用选型的研究表明,基于区块链的大数据审计采用联盟链更具明显优势。建设联盟链的区块链上链平台,将未上链已审计取证的数据上链,并供有权限的审计机构调用,接入区块链平台后,利用区块链技术及大数据审计技术进行审计,基于区块链可信任、不可篡改、可追溯的特性,通过对区块链数据审计后形成审计报告后上链,解决重复审计和审计结果共享的问题。根据区块链上链数据的特性,可以通过在审计数据加入时间戳作H a s h 处理形成新区块并上链,通过联盟链的共识算法和智能合约,能追溯到历史审计情况,由此确定审计结果可用。区块链在审计领域的应用,从技术角度分析,与审计有着异曲同工之妙,更有着比传统审计更多的优良先天基因,其提供了可靠的审计线索,并具有可验证真实有效性问题的技术特性,使基于区块链技术在大数据审计的应用奠定了信任基础,其创造可靠的协同机制,具有广阔应用前景。
2.2 探索全面审计
通过对区块链分布式账本数据库及区块链加密共享技术的研究,探索从抽样审计向全面审计发展的应用模式。当前审计还较多采用抽样审计,非审计所有数据而导致审计误差的问题,可以通过区块链分布式账本数据库的技术运用,使其每个信息均经过区块链数据平台接口上链后形成区块链,形成基于计算机自主验证、不可篡改、数据加密共享的统一模式,提高信息的一致性、准确性以及完整性,为实现全面审计打破了瓶颈,向大数据要效率,推动审计信息化进一步发展。
2.3 解决数据存储有效性的应用新模式
通过拜占庭将军问题与共识算法的研究,提出了简化审计流程,从现场审计向非现场审计面临的数据存储有效性问题的应用探索新模式。可以将区块链技术融入审计工作,区块链的共识机制是从非对称加密和时间戳等密码学角度制定好一套所有参与者及参与方式都必须遵循的透明无法人为随意修改统一规则,使上链的数据按统一机制产生,从技术上制约着电子数据与实际交易的舞弊或不真实行为,审计工作人员可通过计算机对具有区块链基因的数据信息予以直接审计,无需前往现场就能实现提升审计数据准确度及有效性的审计保障。
2.4 运用跨链机制解决数据极限性问题
通过研究表明,基于区块链的大数据审计的融合,可以解决审计信息化面临数据共享的全面性问题,采用区块链联盟链跨链机制实现审计数据局限性瓶颈新模式。一是去中心化和不可篡改性方面,具有所有节点共同维护和统一认证的全民监督功能,增进了各方的互信,数据可信度高、审计效率高;二是具有时间戳的技术能保障数据具有时间点的监督、验证和溯源;三是在数据安全、数据隐私保护有技术保障;四是智能合约的制定能实现审计的规则化、实时化、智能化。
3 基于区块链的大数据审计应用设计模型
基于区块链的大数据审计应用设计模型是综合目前我国区块链运用的上线案例及区块链技术的研究成果提出的应用探索[4]。目前审计数据采用集中存储方式管理,基本上是先由各派驻审计机构采集,然后统一上传到审计数据中心,再由数据中心集中管理,派驻机构不存储相关数据。该模式优点是数据安全性、合法性层级较高,但也产生了数据中心软、硬件设备需求较大的弊端。可以将数据的采集、维护和管理放权下沉,共享服务、共担风险,对审计应用的保密性、合法性、可靠性方面发挥其应有的作用,区块链的分布式特性可检验所有分类账的文件签名并否经过修改,在数据质量、数据隐私、数据安全方面也有保障。从区块链基因中的加密算法、时间戳和数据自主管理中,可实现数据可以追踪、记录每一位审计人员的数据事件和其他需要收录数据的活动、身份识别管理,使审计数据留痕,通过区块链与大数据的融合,从技术上两者相辅相承,相互促进,将营造更加安全和干净的网络信息环境,真正进入互联网价值时代。
设计模型结合现状,运用区块链及大数据审计技术,在数据采集过程中个性化选择流程,即按已上链数据和未上链的审计大数据分别考虑,首先需建设联盟链的区块链上链平台,将未上链已审计取证的数据上链,并设置访问及写入权限,供有权限的审计机构调用;对于区块链数据,直接接入联盟链,通过区块链技术及大数据审计技术进行审计,基于区块链可信任、不可篡改、可追溯的特性,通过对区块链数据审计后形成审计报告后上链,解决重复审计和审计结果共享的问题。
设计模型分为六个模块实现,即数据采集、数据还原、数据清洗、数据分析、生成审计报告和生成新区块加入区块链。如图2,数据采集模块主要是基于大数据技术等通过数据直联API接口、网络爬虫、离线采集、互联网采集、实时采集等方式,将审计所需的财政数据、社保数据、公安数据、工商数据、公积金数据、税务数据、科研数据、财务数据等采集入库。数据还原模块主要是按规则、格式标准分类初始化还原数据,并积累审计池数据;数据清洗模块主要是根据审计池数据对未上链数据设置清洗规则、数据生成标准表和清洗模型提取审计相关数据,对已上链数据生成时间戳、审计机构等数据并将审计调用记录生成区块上链。分析模块主要是根据审计数据、审计任务及审计规则等进行数据分析建模、Python数据分析、可视化、审计线索分析,对于未上链数据生成取证单进行现场取证,对于区块链数据由于其可信任特性可直接提取审计相关数据[5]。生成审计报告模块可运用现大数据审计平台的基础建设,通过智审模型、根据审计任务生成征求意见稿最后生成审计报告。生成新区块加入区块链模块主要是建设区块链上链平台,将已生成的最终审计报告生成新区块并加入区块链,供其他审计机构或单位调用,真正解决重复审计、全面审计、实时审计和审计成果共享问题。
图2 区块链大数据审计流程设计图Fig.2 Block chain big data audit process design diagram
4 实现区块链大数据审计的应用建议
(1)全省做好顶层设计,在原有已建设的良好基础上更上一层,各地的审计信息化建设要统一思想以实现区块链大数据审计一盘棋,集中资源统一方向分步实施。
(2)继续加强科研及资源投入,集全省优秀资源的智慧在各环节中细化实施细则,实现智审走在前列。
(3)可以通过组建联盟链的方式,结合现状,过渡期间按未上链数据及区块链数据分别设计流程,同时创建区块链上链平台和联盟链智能合约规则,积累审计池区块链数据,为下一步实现区块链的融合奠定基础。
(4)确定实施方案后可选择前期建设条件比较成熟、硬件条件、人才资源等比较丰富的城市开展试点,在实际工作中不断探索,精益求精,条件成熟后在全省推广。
(5)加强新时代审计人才的培养,加强引进具备大数据或计算机技术等方面的审计专业人才,对现有审计人员加大力度培养掌握新技术,运用新技术,开创新局面。
(6)紧密围绕国家审计署的战略规划,在方案设计中充分考虑国家顶层设计的方向、国际最新动态,用实际成效促进国家审计一盘棋贡献广东力量。
5 结语
基于区块链的大数据审计的技术融合即是机遇也是挑战。在数据融合方面,基于其可追溯可确权可信任的特点,建立一个约定规则的审计数据共享机制和流程,将提高审计工作效率,优化审计流程。在数据安全的保障方面,通过引入非对称加密算法、数字签名、私钥、时间戳等技术,能实现联盟链上指定权限使用人引用,破解新的数据孤岛问题[6]。在数据质量方面,通过智能合约和共识机制,共同制定联盟链数据标准和共识验证来保证链上数据的真实性、准确性,通过数据追溯机制改善数据的可信度,使得数据获得强信任背书。通过基于区块链的大数据审计的融合的不断深化,以实现我省科技强审、提升智审建设、提高审计效率、用实际成效促进我国审计事业进一步发展贡献广东力量。