基于NoSQL的XBRL财务报告智能审计方法研究
2017-05-18陈耿马寅韩志耕
陈耿+马寅+韩志耕
【摘要】随着大数据的发展,财务报表也逐渐向网络化、电子化发展,XBRL因此而兴起,针对企业财务的审计方法也因随之发生改变。本文分析了非结构化数据库——NoSQL的特点,并研究了两种适合XBRL网络财务报告存储的NoSQL数据库,探究了基于NoSQL的XBRL财务报告智能审计方法。
【关键词】XBRL 财务报告 智能审计
XBRL是Extensible Business Reporting Language的缩写,即可扩展商业报告语言,是一种全新的网络财务报告形式。目前,我国财政部在全国推广XBRL网络财务报告形式,并且,上交所与深交所早在2010年就开始要求上市公司每年需要报送并披露XBRL格式的年报。XBRL作为一种全新的财务报告方式,针对它的审计鉴证成为未来研究的关键。
一、NoSQL及其技术优势
在面对大数据应用中来源不同、拥有海量信息的数据进行整合、处理时,传统的关系型数据库在可用性、灵活性、可扩展性等特性上表现出明显的缺陷,此时,一些不拘泥于固定关系模式的数据库应运而生,他们不再一味的遵循关系结构,于是这些数据库被称为NoSQL(Not Only SQL)。NoSQL数据库一经诞生,就受到了电子商务、社交网络、定位服务等互联网行业的青睐,以亚马逊、Twitter为主要代表的大型互联网公司早已正式采用NoSQL作为公司、客户数据的存储模式。NoSQL与传统的SQL数据库想比较有以下几点优势:
(一)易扩展
NoSQL数据库种类繁多,但是一个共同的特点都是去掉关系数据库的关系型特性。数据之间无关系,这样就非常容易扩展。也无形之间,在架构的层面上带来了可扩展的能力。
(二)大数据量,高性能
NoSQL数据库都具有非常高的读写性能,尤其在大数据量下,同样表现优秀。这得益于它的无关系性,数据库的结构简单。一般MySQL使用Query Cache,每次表的更新Cache就失效,是一种大粒度的Cache,在针对web2.0的交互频繁的应用,Cache性能不高。而NoSQL的Cache是记录级的,是一种细粒度的Cache,所以NoSQL在这个层面上来说就要性能高很多了。
(三)灵活的数据模型
NoSQL无需事先为要存储的数据建立字段,随时可以存储自定义的数据格式。而在关系数据库里,增删字段是一件非常麻烦的事情。如果是非常大数据量的表,增加字段简直就是一个噩梦。这点在大数据量的web2.0时代尤其明显。
(四)高可用
NoSQL在不太影响性能的情况,就可以方便的实现高可用的架构。比如Cassandra,HBase模型,通过复制模型也能实现高可用。
二、适用于XBRL的几种NoSQL数据库
XBRL将信息颗粒化,把财务报告内容分解成一个个信息元素(元素可以简单理解为一个数字或者一段文字),每个元素可以单独从报告中提取出来进行分析处理。XBRL在选取数据库时应当考虑数据的增删改查等操作的快捷方便,以及财务数据分析的统计、分析等功能。有两款NoSQL数据库是国际XBRL软件商的应用主流——MongoDB和Redis。
(一)MongoDB
MongoDB是一款文档数据库,在Mongo DB中,每一条记录都是一个Document对象,适用于动态查询。每一份XBRL财务报表数据都以文档的形式存储在MongoDB数据库中,可以实时插入、更新或查询新元素,具备实时财务数据存储所需的复制及高度伸缩性。
但是,MongoDB的本身特性也限制了XBRL的部分功能使用。MongoDB文档式存储方式,减弱了XBRL财务信息颗粒化的优势,各信息元素不能方便的组合、拼接,只能将整份文档数据从数据库中提取出,以至于不能满足大量原子性复杂事务的操作要求。
(二)Redis
Redis是Key/Value类数据库,主要用途在于高性能访问。Redis的优点在于速度快,简单,容易维护,支持多种数据结构。和Memcached类似,它支持存储的value类型相对更多,包括string(字符串)、list(链表)、set(集合)、zset(有序集合)和hash(哈希类型)。这些数据类型都支持push/pop、add/remove及取交集并集和差集及更丰富的操作,而且这些操作都是原子性的。而原子性操作极大地契合了XBRL信息数据颗粒化的特性,在不同财务数据组合、分析等功能需求上有着得天独厚的优势。
但是,Redis的缺点是不提供数据可靠性保障,支持的功能也比较少。扩容,负载均衡,高可用方便也有明显的不足。对于将来XBRL财务数据进一步的分析利用可能会有所阻碍。
三、智能审计与XBRL
智能审计的核心技术就是利用大数据的分析方法对审计数据进行处理转换、挖掘利用、多维分析,以获取更多有用的审计先做。智能审计的工作途径有两种:一种是直接从审计数据中发现疑点、线索,审计人员根据线索直接切入问题;另一种是从大量数据中发现疑点,审计人员根据疑点导向查找问题。XBRL的颗粒化、关系型、标准化、可扩展等特性极大的契合了智能审计的技术要求,将XBRL作为智能审计系统的数据标准,可以降低审计过程中的信息交换成本,提高数据分析效率,为智能审计的实现提供了技术支持。
参考文献
[1]曾志勇,刘建业.基NoSQL的XBRL数据存储研究与应用[J].中国管理信息化,2015,(19):49-50.
[2]阮梦黎.大数据挑战下的NoSQL系统研究[J].聊城大学学报(自然科学版),2015,(01):88-93.
[3]李伟.大数据下的NoSQL数据库技术分析[J].信息通信,2014,(07):72-73.
[4]曹順良,宋静,李荣,雷向欣.智能审计软件系统架构研究[J].财会通讯,2012,(16):96-97.
[5]叶焕倬,何玉凝.基于智能匹配的计算机审计数据采集技术研究[J].审计与经济研究,2010,(05):40-46.
[6]李立成.智能审计决策支持系统浅探[J].财会通讯,2009,(10):109-110.
基金项目:本文为国家自然科学基金资助项目(71271117);江苏省自然科学基金资助项目(BK20151460);江苏省高校自然科学基金资助项目(16KJB520021);江苏省公共工程审计重点实验室开放课题资助项目(GGSS2015-04);南京审计大学研究生创新计划资助项目(MZ2016009)。