大数据时代下的新型审计方法
2021-07-02杨阳
杨阳
摘 要:大数据时代的到来给审计工作提出了全新的要求。审计职能、审计方法论、审计技术和审计内容等都将发生全新的变化。本文试图从审计方法的角度来梳理大数据时代下审计所面临的挑战及应对方法。本文将从 C 端和 B 端两个维度来对审计方法展开分析。除过传统的审计方法外,大数据时代下的 C 端审计,要重点关注流量审计;大数据时代下的 B 端审计,要将更多的精力投向信息系统审计。
关键词:审计方法;流量审计;信息系统审计
一、综述
如今,数据已经渗透进了每一个行业和职能领域,成为了新的生产要素。人们对于数据的使用,将极大的扩宽生产边界。数据的迅速膨胀,高新技术的使用以及新型商业模式的出现,都对审计工作提出了全新的要求。在大数据时代,如何审计这些数据,成为了每一个审计人员都应当考虑的事情。
数据来自于不同的维度,从数据生产者的角度来看,数据可被分为三类:第一类是 C(Consumer)端的数据,第二类是 B(Bussiness)端的数据,第三类是G(Goverment)端的数据。但其中 G 端的数据不以盈利为目的,所以不在本文的讨论范围之内。
二、数据的生产方式
2.1C 端数据的生产方式
每个人随时随地,每时每刻都在生产着数据,并且这些数据被通过不同的方式记录了下来。在线上(即网络空间中),每个网络用户在使用各大网络平台满足自身的日常需求时,他们所产生的数据就已经被各大平台按需获取,从而形成了平台的流量。在线下(即事实空间中),个人的行为习惯、饮食起居、行踪轨迹等日常生活也被传感器、摄像头、信号塔等设备所记录。我们每个人的数据都是一个数据源头,在源源不断的生产着数据。
2.2B 端数据的生产方式
企业从成立至破产,无时无刻不在生产着数据。企业作为市场经济活动的主要参与者,要运用各种生产要素来进行经营。为了在激烈的市场竞争中生存,企业一方面需要扩大生产要素的数量,另一方面需要提升生产要素的运营效率。数据作为新的生产要素,也就自然成为了各个企业的竞争之地。企业生产数据的方式有两种,一种是按照企业目前的经营状况,从设计、生产、销售等环节来按需采集并生产数据;另一种建设新型的知识体系,自主开发企业所拥有的数据资源, 包括数据服务,数据知识图谱,数据标注表等。
三、C 端审计
对于各大网络平台公司,和流量相关的收入平均占总收入的 60%以上。但流量并非完全是真实的,如何保证流量的真实性,这就对审计方法提出了新的要求。
3.1异常流量普遍存在
流量对于各大网络平台来说至关重要,但是异常流量早已经出现在了互联网的各个细分行业之中。电商领域的流量可被用来刷单、刷信誉;广告领域的流量可被用来刷点击,刷曝光率;APP 的流量可以刷下载,刷活跃人数;自媒体领域的流量可以用来刷粉丝,刷阅读量等。
3.2外界对流量数据越加关注
从 2020 年 3 月 1 日起,网信办发布的《网络信息内容生态治理规定》开始正式运行,该规定中明确流量数据造假已被视为违规行为;全球各资本市场对业绩和数据真实性愈发关注,如中国证监会《首次公开发行股票并上市管理办法》和香港联交所《证券上市规则》等法规和条款都要求数据披露人对数据的真实、准确、完整负责;流量欺诈会导致网络服务商和供应商下架产品。
3.3流量黑产的典型链路
在黑产上游环节,“手机卡商”提供卡源和猫池,开发者开发出接码平台和群控软件来统一操作手机、猫池等网络设备,上游承担了硬件软件支持的的角色。在黑产中游环节,通过跳转号和盗号扫号养号等行为承担着账号注册与分销的角色。在黑产下游环节,通过吸粉、诈骗、微商等引流活动和播放量、点赞、收藏等刷量活动实现盈利变现。
3.4C 端的审计方法
若完全了解程序的内部逻辑结构,可以利用大数据分析技术和软件白盒测试方法来进行审计。具体的审计方法为:首先从用户信息、用户行为、网络 IP、用户设备和数据指标等维度建立起流量审计分析框架;在流量审计分析框架的基础上,从日质数据中按需获取相关的数据,并进行相应的数据清洗、数据存储和数据分析;在分析的结果之上出具相应的审计报告。
若不完全了解程序的内部逻辑结构,可以利用大数据分析技术和软件黑盒测试方法来进行审计。具体的审计方法为:首先按照国家标准中对于异常流量的定义和分类,并结合审计客户的具体情况,制定出本次反作弊系统测试的具体规则; 再设计出不同的正常流量数据和异常流量数据,通过不同的行为和功能测试来判断反作弊系统能否完成正常的识别;在测试的基础上更新系统规则并迭代开发测试系统,直到能满足要求为止;最后使用测试系统来测试用户的流量数据,并在分析的结果之上出具相应的审计报告。
四、B 端审计
企业作为一个“信息系统”,生产出的数据有两方面用途,一方面被用于企业内部来改善管理和更新产品。另一方面被用来拓展市场,提高生产效率和质量, 扩宽企业经营边界。
4.1数据孪生
目前各个行业都处于信息化转型的浪潮中,各行业都在打造数据孪生体。所谓的数据孪生就是指通过物联网、传感器、5G 等网络设备以及网络传输协议, 将现实世界中真实存在的物质映射到網络世界中,从而实现现实世界和网络世界的双向发展。
4.2B 端审计的挑战
B 端生产的数据是一体的,但用途却是两方面的,审计人员首先面对的问题就是数据的权限分配问题,审计人员不可能拿到所有的权限来核准数据的准确性以及信息系统的具体逻辑规则;其次,审计人员需要关注现实世界的经营情况和数字世界的映射情况,这就要求审计人员要了解一部分的映射规则,并且要分现实世界和数字世界分别给与审计报告;数据最后审计人员要明白受托责任制并没有发生改变,只是商业模式出现了创新,我们仍然应该对多方负责,并负有审计法律责任和审计职业责任。
数据的安全性是 B 端审计的核心,作为审计人员,最重要的任务就是要确保数据是安全的。数据的安全应该从两个维度来分析,第一个维度是企业内部使用数据时,是否设置了相应的权限来保障数据安全性;第二个维度是企业和企业外部产生交互时,数据是否被完整的存储,是否只开放了愿意开放的接口,是否设置了反爬虫规则等等。
4.3B 端审计的方法
B 端数据的性质,导致了审计人员只能拿到有限的权限来展开测试,所以采用的审计方法应当采用大数据分析加黑盒测试的方法。首先按照客户的经营方 向,制定出测试系统的具体规则;再根据具体规则来编写不同的测试用例来测试功能;再在测试的基础上更新系统规则并迭代开发测试系统,直到能满足要求为止;最后使用测试系统来测试数据,并在分析的结果之上出具相应的审计报告。
五、总结
大数据时代的审计方法离不开大数据分析技术和测试开发技术,同时还需要审计人员具备审计知识,这都对审计人员、审计工作提出了更高的要求。
综上所述,在大数据时代,审计人员面临着诸多挑战,但通过恰当的审计方法,仍可以相对保证数据的可靠性。在具体的审计工作中,审计人员虽可以拿到全部的数据,但在客观条件上仍受限于数据保密性、数据安全性、系统开发规则、审计成本和商业模式的约束,审计人员仍无法绝对保证数据的可靠性。同时,我们还应该思考一个更深层次的问题,如果大数据、人工智能和数据挖掘技术得到进一步运用,能够动态规划企业的日常经营,受托责任制还会成为审计的理论基础吗?88CDDC15-59A6-4C18-94BD-EB96A6BF660D