R语言大数据审计可视化运用分析与发展探讨
2022-04-29王文婕康玉梅
王文婕 康玉梅
摘要:在数字经济时代,传统审计逐步开始转型。R语言以其开源、简洁、丰富的数据挖掘能力,集数据分析与可视化为一体,服务于大数据审计领域。通过回顾有关国内外文献,分析R语言大数据审计可视化运用领域,探讨其增强审计可靠性、提升审计效率、聚焦专项审计风险等优势,分析其发展所面临的困境,并运用R-Studio工具对新《审计法》及泡泡玛特的市盈率、总市值、净利润进行大数据审计分析,以展现R语言的多元化应用,并对R语言大数据审计应用提出建议与展望。
关键词:R语言;数据可视化;大数据审计
0 引言
数据是新时代重要的生产要素,数字经济的发展对我国工业经济向数字经济转型至关重要。我国“十四五”规划提出,用数字畅通“大循环”、融通“双循环”,为数据产业明确了发展方向。大数据、5G、云计算、人工智能、区块链等新技术飞速发展,使新时代、新发展阶段下的大数据审计具备了技术先决条件。大数据技术对财务数据的辅助分析和可视化已经与审计业务密不可分,本福特定律在审计业务中的运用更确立了数据分析技术在审计进程中的重要地位。随着数据分析技术的发展,现在的大数据审计运用R语言和Python较为广泛,技术开发不再局限于对财务数据进行函数辅助分析,其在可视化编程领域也逐渐活跃起来。R语言适用于哪些领域?在大数据审计中拥有哪些优势,面临何种困境?在审计实务中如何运用?探讨解决R语言大数据审计的运用困境,对数字经济时代审计转型与发展具有重要意义。
本文通过回顾R语言大数据可视化审计的国内外文献,分析R语言大数据审计可视化运用领域,具体探讨大数据审计的优势与困境,并以北京泡泡玛特文化创意公司(以下简称“泡泡玛特”)为例,运用R-Studio工具进行大数据审计分析,用以展现R语言在审计实操中的灵活运用,以期对R语言大数据审计未来发展提出合理性建议并进行展望。
1 理论回顾与研究评述
随着金融科技的广泛应用和快速发展,国内常见的CAATs(Computer Assisted Audit Techniques,计算机辅助审计技术)工具主要有Microsoft Office、ACL、IDEA、Microsoft SQL Server、MySQL、Oracle等,数据分析则多依赖MATLAB、SAS、R语言等。R语言大数据可视化审计的理论与运用成为国内外学者研究的新热点,无论是在政府审计、社会审计中还是在内部审计中,计算机辅助技术都得到了相应的重视,其作用也得到了发挥。牛艳芳等[1]指出,政府审计中SQL和OA运用较多;社会审计主要运用账套审计的软件和Excel;内部审计则差异较大,实力较强的企业在ERP(企业资源计划)中嵌入内部审计模块或开发专门的审计分析平台,实力较弱的企业比较依赖Excel。陈伟等[2]认为,目前常用的信息系统(信息科技)审计方法不能很好地满足金融科技应用系统风险审计的需要,继而采用大数据审计技术开展金融科技风险审计,发现大数据审计技术是一种有效的审计方法。刘国城等[3]结合云计算相关技术,运用较为成熟的Hadoop系统,尝试建立审计全覆盖驱动下的大数据审计平台,并从大数据审计平台构建的需求、理念和策略3个方面进行分析,将大数据审计平台分为数据中心、采集、预处理、分析和可视化5个系统,以此探索有效的审计新路径和新方法,为审计全覆盖提供技术基础,并为未来大数据审计工作的开展提供理论支持。宋铁波等[4]也探索了R语言、Python等技术工具的处理过程、优点和缺点。陈伟和詹明惠[5]进一步以金融科技贷款业务系统为例,提出了基于大数据可视化技术的信息系统AC审计方法,并采用R语言实现了该方法,结合案例详细地分析了该方法的应用,从而验证了该方法的可行性与有效性。栾心勇等[6]以山东省各级审计机关为研究对象,了解审计大数据建设及应用情况,在体制、机制、方法和创新技术方面采取的相关措施,以及在人才队伍建设和数据安全方面的保障手段,针对大数据审计思维欠缺、大数据产生新的安全隐患与风险、审计管理模式亟须改善等问题,提出改良审计组织方式、改进数据管理模式、加强培训和实践应用等针对性的解决方案。王茜一[7]则研究了公立医院绩效审计对图形、图像数据审计分析的需求,以医院药品加成绩效审计应用数据可视化技术为研究案例,分析了公立医院是否存在药品加成违规情况。
王雪荣和侯伟龙[8]采用Citespace对中国知网(CNKI)的2 768篇大数据审计领域的研究文章进行可视化分析,认为此阶段学者对大数据适用于审计的情况是基本肯定的,大数据审计技术可以提高审计效率,增强审计质量,节约审计资源,充分发挥审计的监督职能,做到审计全覆盖,但是该阶段的研究还停留在理论层面,对于大数据审计技术实务层面的探讨和应用方面的研究成果存在不足。王海洪等[9]通过综述研究分析认为,大数据技术为审计工作的发展提供了新思路和新途径,大数据审计的规范化值得继续研究,区块链等技术为大数据审计工作提供更多可能。Espinoza和Novoa-Muoz[10]通过世界卫生组织酒精使用障碍鉴定测试智利版(审计)证明序数α的有用性,并以R语言提供用于执行相应计算的命令。
近年来,随着机器语言的进步,数据收集加速,大数据审计的运用前景得到国内外众多学者的认同。不少学者与企业合作或进行案例调研,以R语言的特性为导向,展现了其在审计实际案例中的强大功能。由此可见,R语言大数据审计具有可实施性,但由于该领域的研究处于起步阶段,审计流程的具体设计与实务还需要更多探讨与挖掘。本文结合案例为该领域研究提供更多审计视角,并为R语言大数据审计发展困境提供解决思路。
2 R语言大数据可视化运用领域分析
2.1 R语言大数据可视化基于语言特征的运用领域
R语言因其简洁、灵活、开源的特性,具备处理TB、PB级数据集的能力,能够自由、有效地用于统计计算和绘图的语言环境,并在UNIX、Windows及Mac-OS系统中均可以运行,提供了广泛的统计分析和绘图技术,包括回归分析、时间序列、分类和聚类等建模方法[11]。在数据保存方面,R语言具有良好的处理机制,与其他语言相比,它是彻底面向对象的统计编程语言,与数据库之间有较好的接口,可以编译条件语句、循环语句、自定义递归函数,利用MapReduce模型进行分布式计算,满足TB、PB级的数据处理需求,提高了运行速度和计算效率。R语言还提供丰富的数据挖掘算法程序包,如ggplot2程序包中的可编译图形,带给R语言可视化更多的可能性。大数据可视化技术有助于数据直观分析,因此可视化技术成为大数据应用的重点之一。
R语言已被应用于数学函数、计量统计、金融财会、生物制药等多个领域。随着R语言的开发,数据的可视化分析快速发展,R语言的可视化功能在学术界和企业界均被灵活应用。在学术界,R语言可视化被用于医疗、环境监测、金融分析、电子技术等众多领域的数据图表制作;在企业界,KPI(关键绩效指标)报表、数据监测、人员监控、体温测量中都有R语言可视化的身影。
2.2 R语言大数据可视化审计领域分析
随着财会、审计领域的计量运用逐渐增多,R语言的开发和使用因其开源性、可绘制性等优势受到众多财会、审计乃至整个统计分析行业人员的喜爱。可视化审计分析方式能够帮助审计人员快速、有效地交互分析大量数据,帮助审计人员更快、更准确地从复杂的数据中发现审计线索,洞悉财务漏洞。
在以往的审计程序中,MySQL和Oracle的使用较为普遍,而R语言通过RMySQL、ROracle、RODBC等程序包与MySQL、Oracle、ODBC等数据库均能建立联系。此功能很好地解决了数据转换问题,为R语言在审计领域的普及带来了更多可能性。
此外,以往传统审计中的审计数据分析方法多采用纸质凭证和纸质底稿,年终汇总和出具报表工作量巨大,数据归类方式有限,统计数据时十分烦琐,审计人员对电子数据进行采集也多基于Excel工具。从大量数据中提取审计依据并进行分析处理是审计人员工作的难点。随着技术的发展,财会、审计行业逐渐转型变革,财务数据从纸质向电子化发展,从纸质发票向电子发票演变,网上报账系统、手机App报税平台建设及数据的链接统一,带来行业效率的提升。以往财务数据量巨大,纸质凭证的翻阅及审阅严重影响了审计效率,而R语言很好地解决了该问题。R语言数据可视化审计分析,是基于大数据技术开发出来的,具有时代背景。
3 R语言大数据审计的优势与困境
3.1 R语言大数据审计的优势
3.1.1 R语言大数据分析预测增强审计可靠性
R语言的数据分析预测优势使得审计过程更精准,审计结论更科学、可靠。以往审计严重依赖审计人员的经验判断,审计报告的准确性难以得到证实,全面审计耗费巨大的人力、物力,但收效甚微。加之财务舞弊案件频发,会计师事务所的公信力也饱受民众质疑,审计的准确性、有效性受到揣测。运用机器学习的实验新模型得出的预测结果,准确性比传统逻辑回归模型提高近5倍,此功能将提升通过审计发现舞弊事件的可能性。此外,张敏[12]运用机器学习的方法预测上市公司业绩,发现运用机器学习方法得到的预测值与实际业绩非常接近,并且比分析师的一致性预测更为准确。R语言大数据分析预测的可靠性得以证实,由此将进一步扩展R语言数据审计功能,增强审计可靠性。
3.1.2 R语言大数据分析提升审计效率
R语言数据的可视化分析还能帮助审计人员从海量数据中更快、更精准地发现问题,推演各数据之间的相关关系,找到被审计单位电子数据中的漏洞。出具审计报告不再局限于公司的个体判断,审计人员更能结合整个行业的发展进行有效判断。
云计算、人工智能等计算机技术的发展使数据能够互联互通,大数据审计的实时报告和快速反馈功能也得以实现。因此,R语言的大数据分析审计在效率和效果上都要优于传统审计。运用R语言大数据审计切实提升了审计效率和效果。
3.1.3 R语言大数据分类聚焦专项审计风险
针对被审计单位提供的专项审计数据,R语言可以根据审计项目进行分项归类,有效储存数据。审计人员审计调查时可以利用分门别类的专项数据开展对不同项目的审计审查。例如,对内部供应链审计,采集和分析上下供应链数据,评估、改善供应链,降低运营成本,提高供应链效率;对税务审计,审查纳税人是否按税法规定纳税、减税和免税,有无偷税、漏税行为,纳税依据是否真实,计算是否准确,有无弄虚作假、截留税款等现象;对离任审计、清算审计、经济责任审计、高新技术企业认定审计、财产转移审计、贷款审计等均能处理。审计单位结合详尽的分类项目指标,出具的专项审计报告将更具体,更聚焦审计专项风险所在,促使被审计单位的风险症结得到更早发现、更快处理。这样可切实增强专项审计为被审计单位识别风险、排除风险、化解风险的能力,使专项审计提质增效。
3.1.4 R语言大数据审计的数据包容性
实体企业的数据类型各异,这需要具备极强数据包容性的计算机语言助力审计工作开展。传统的审计数据是结构化的,按照详尽的审计步骤实施,而企业各异的审计数据阻碍了工作开展。R语言的运用则能够收集和整理不同种类的数据信息,对行业数据、个体数据,财务数据、非财务数据,以及结构化数据、非结构化数据等均能进行处理。开源的R语言功能极其强大,使审计不再局限于结构化数据。在文本信息处理方面,R语言也具备显著优势,其高效、准确的词云提取功能,彻底解决了审计人员对文本信息进行审计时信息量大、效率低下等问题。
3.1.5 R语言大数据中心建设助推全面审计工作开展
推动被审计单位建设数据中心,对数据进行集中统一处理,可助力审计工作全面开展。根据企业集团构建的数据库,由上至下,纵向审查被审计单位上下隶属关系,对有关账册进行纵向加减审核,从根本上核查数据;对被审计单位经济效益进行横向审计,由此及彼分析宏观数据基本面及各子公司、各部门经营情况,为被审计单位改善整体效益提供合理建议。由抽样思想向全面审核转变,建设大数据中心,发挥R语言海量数据处理能力,可为集团化全面审计工作开展提供便利,真正发挥全面审计的广度效应。
3.1.6 R语言大数据多元可视化丰富审计工作
R语言出色的可视化编译程序使审计分析效果呈现多元化、变化性。常年审计报告的黑白数据使报表使用者易产生厌烦情绪,而R语言强大的图表绘制功能为审计报告增色添彩。其语言的可编译能力充分凸显了强大的数据可视化功能。该功能不仅覆盖Excel的条形图、折线图、散点图、饼状图,便于直观地从数据中获取信息,而且可以编译出小提琴图、箱线图、环形图、气泡图、热力图、词云图、星相图、脸谱图等多种可视化形式,满足项目的各种可视化需求。R语言直观、简洁的可视化功能给广大审计人员带来福音。对于复杂性数据分析,还可以将各功能图进行叠加,以此满足多元化、可视化分析需求。更为特别的是,R语言还可以对大批量数据进行交互式、动态式、多维式可视化分析,以此满足高级别可视化需求。审计工作不再是枯燥无味的数据处理,报表使用也拥有了全新的功能体验。这对于大数据时代的审计行业来说可谓取得突破式进展,为沉闷的审计工作注入了活力。
3.2 R语言审计面临的困境
3.2.1 R语言审计人才缺失严重
R语言审计作为新兴领域,无论是在理论研究层面还是在实践探索层面均存在不少空白。现阶段R语言大数据审计技术的运用水平仍然较低,拥有技术和审计2项专业技能的优秀复合型人才极其稀缺。行业中普遍存在的现象是:懂技术的人不懂审计,懂审计的人不懂技术。随着技术的发展,R语言审计对审计人员提出更高要求,审计人员需具备一定的程序编译能力。由于数据审计属于新领域研究方向,相关人才的培养培训工作相对滞后。高校的培养体系刚刚从传统审计向现代化审计转型,拥有技术与审计2项专业技术知识的毕业生较少。审计市场上现有的专业人员大多运用Excel工具,对Python、R语言使用尚不熟悉。经验丰富的老审计人员计算机知识欠缺,学习计算机智能语言难度较大,将审计技术与经验结合有一定困难;审计新人具备一定的编译能力,但审计经验需积累和培养。审计人员新老断层导致R语言审计专业人才稀缺。
3.2.2 现有审计人员创新能力亟待提升
大数据审计技术的引入时间尚短,审计人员对其可视化应用的创新开发有待进一步提升。北京、上海、广州等一线城市大数据技术运用较为普及,年轻人多,数据体量大,审计人员、报表使用者易接受传统审计的转型,适合大数据审计建设,具备更多的创新性;而一些二、三线城市数据体量小,创新性不足,对大数据审计技术的运用较少,也普遍简单,大数据审计的整体建设暂未普及开来,未形成深入挖掘的态势。R语言的审计程序开发仍需审计人员提升创新能力,完善大数据审计功能。
3.2.3 审计人才就业渠道需拓宽
疫情反复,行业经济受阻,人才就业存在一定困难,优质复合型审计人才的就业渠道急需扩展。传统审计岗位引进大数据审计毕业生后并未形成规模化发展,大数据审计企业相对较专业,提供的对应就业岗位尚多,但政府、事业单位提供的相应岗位较少,多以财会、审计大类招录后,实际大数据审计专业运用却较少,大数据审计实施也有一定难度。
3.2.4 大数据审计制度需完善
实施大数据审计程序的审计制度尚不完善。大数据审计的发展需要相应的配套制度进行完善、规范。大数据审计项目具有多样化特点,其审计流程制度不能一概照搬,不同行业、不同企业、不同专项数据特征均不同,对审计方案的设定和实施需进行精确判断和专项评估。无论是审计的测试环节还是实施环节,相关规章制度均有欠缺。审计制度决定大数据审计的成败。根据行业特征、数据特点、项目需求对不同风险进行划分并处理,设置适合的审计程序,编译优质的R语言审计程序,是找出企业数据问题所在、解决被审计项目问题、优化审计实施措施的重点。
3.2.5 R语言数据收集和整理工作烦冗复杂
R语言审计的关键是数据的采集和预处理,海量数据的收集工作烦冗复杂,其成本及真实性都面临风险与挑战。一方面,数据采集过程任务量大,协调调度不统一,往往造成审计进度延缓;另一方面,被审计单位的数据来源往往存在体量大、格式不统一等问题,造成数据整理困难。根据项目需要,数据采集后再进行严格的筛选和重分类,整个过程烦冗复杂,而数据预处理质量直接影响大数据审计的后期分析效果。
3.2.6 R语言审计数据安全制度待完善
在大数据审计过程中,由于存在数据的收集、整理、传输、转运等环节,数据安全问题需引起审计人员的重视。在信息化时代,信息泄露事件频发,企业信息、个人信息泄露严重。因此,在R语言大数据审计分析过程中,审计人员采集数据时要严格遵守相关规定,进行数据转移时不能为了便捷而简化流程,导致数据泄露、遗失,同时需妥善保管和处置含有商业机密的数据。财务数据关系到企业整体运转,需谨防关键数据泄露与遗失,审计过程必须确保被审计单位数据得到有效保护,保障数据传输与转运安全。
4 R语言在泡泡玛特大数据可视化审计中的应用
根据2021年新修订的《中华人民共和国审计法》(以下简称《审计法》),运用R-Studio进行词云图分析,见图1。由图1可知,“审计”“机关”“单位”“规定”“国家”“监督”“财务收支”等关键词多次出现,国家实行审计监督制度,审计机关履行审计监督职责,对“电子数据综合分析”“数据共享平台”及信息系统的“安全性、可靠性、经济性”等相关内容也有规定。
基于新修订的《审计法》,以泡泡玛特为例,对R语言审计可视化功能进行展示。泡泡玛特成立于2010年10月20日,2019年6月26日变更为外商投资企业,2020年12月11日在香港联合交易所挂牌上市,成为“盲盒第一股”。
泡泡玛特上市时,香港联合交易所规定2020年主板新申请人须具备不少于3个财政年度的营业记录,并须符合下列3项财务准则中的1项:
(1)盈利、市值测试。盈利:过去3个财政年度至少5 000万港元(最近1年盈利至少2 000万港元,前2年累计盈利至少3 000万港元)。市值:上市时至少达2亿港元。
(2)市值、收入测试。市值:上市时至少达40亿港元。收入:最近1个经审计财政年度至少5亿港元。
(3)市值、收入、现金流量测试。市值:上市时至少达20亿港元。收入:最近1个经审计财政年度至少5亿港元。现金流量:前3个财政年度来自营运业务的现金流入合计至少1亿港元。
根据R语言大数据审计的流程执行程序(见图2),结合香港联合交易所IPO(首次公开募股)具体要求,选取上市公司备受关注的总市值、净利润、市盈率3个指标,进行R语言大数据审计分析展示。
4.1 市盈率棒棒糖图(Lollipop)分析
审计人员收集和整理2021年6月30日的行业市盈率排行数据,选取华讯、壹照明、TCL电子、凯富善集团控股、英马斯集团、泡泡玛特6家上市公司的市盈率,将泡泡玛特与行业平均值、行业中值进行对比,运用R-Studio工具导入数据,绘制棒棒糖图,见图3。
从可视化结果可以看出,截至2021年6月30日,泡泡玛特的市盈率远超行业中值、行业平均值,其市盈率几乎是行业中值的2倍;泡泡玛特相对其他公司的市盈率偏高,公司前景看好。不同行业的市盈率差异甚大,银行股市盈率常年在5~10倍,股价涨幅不大,而一些医药类企业、科技类企业的市盈率高达30~70倍,甚至达到100倍之多。
由此看来,泡泡玛特市盈率高不能一概而论。在审计分析泡泡玛特的盈利状况时,应着手对其市值与盈利状况进行相关分析,考虑其投资回收时间与未来发展潜力。未来可持续发展潜力是市值上涨的原动力,因此泡泡玛特IPO高涨的市值与后期表现也是审计中应充分关注的对象,需要分析其市值波动的缘由,评判其财务数据的真实、可靠性。
4.2 总市值环形图分析
选取2021年6月30日的行业总市值数据,收集和整理海尔智家、创科实业、思摩尔国际、泡泡玛特、敏华控股、JS环球生活6家上市公司的总市值,运用R-Studio工具导入数据,绘制环形图,并将泡泡玛特与行业平均值、行业中值进行对比,见图4。
审计时结合2021年6月30日泡泡玛特的总估值看,该公司以总估值495亿元排在行业第4位,远超行业平均值102亿元、行业中值3.76亿元。海尔智家排在第1位,总市值达2 455亿元;接着是创科实业,总市值达2 320亿元;后面依次为思摩尔国际、泡泡玛特、敏华控股、JS环球生活。
市值作为IPO项目的一个重要指标,可使审计人员在行业基础上对被审计公司的总体地位做判断,再根据其市场反馈与公司个体情况进行深入挖掘,从盈利、发展等多维度综合分析公司情况,公司优劣将一目了然。
4.3 净利润“小提琴+箱线图”分析
在总市值基础上,进一步收集和整理创科实业、海尔智家、蓝月亮集团、敏华控股、泡泡玛特、思摩尔国际6家上市公司的净利润情况,运用R-Studio工具导入数据,绘制“小提琴+箱线图”双分析叠加图,使审计人员对数据的评判更加详细,见图5。
6家公司的净利润数据集可视化后,依据高低值排列,清晰地显示出最大值属于海尔智家,但该公司的净利润波动范围相较其他5家公司更大,其净利润中值在80亿元附近;而排在第2位的创科实业,净利润最大值为52.26亿元;被审计单位泡泡玛特的净利润则处于较低水平,该情况可能与公司新上市便遭遇疫情影响有关。
根据可视化分析结果,审计人员可进一步分析泡泡玛特净利润较低的原因,考虑是否与市场经济环境、供应链畅通程度、生产线效率等因素有关,并查看其主营业务收入、主营业务成本、存货进销单、应收账款、应付款项等数据,为该公司提供合理建议。考虑到泡泡玛特从新三板转港股上市的特点,要确保IPO财务合规。
最后,审计人员出具不同意见类型的审计报告,以增强会计报表的可靠性,给予审计意见。借助R语言可视化审计分析工具,审计人员做出的风险预测、判断更为精准,能够切实保障被审计单位的财产、债权人和股东权益,以及企业利害关系人的利益。
由此案例可以看出,审计人员在开展审计业务前,利用市盈率棒棒糖图、总市值环形图、净利润“小提琴+箱线图”对公司的市场规模、盈利水平进行更具体的了解,对后期审计业务的实施具有指导作用,环环相扣推动审计业务的开展。
运用R语言的大样本可视化分析技术,能够更加明晰地了解行业的整体净利润状况,不再仅依赖于传统审计专业人员的经验判断,在大数据技术的支持下,选取、收集的数据更为精准,审计实施程序更为有效。此外,R语言大数据可视化的多图叠加功能也增强了可视化分析功能。
5 建议与展望
新时代下,大数据审计不断发展,R语言可视化分析技术在审计实务方面的应用仍需加强。本文属于探索性的研究成果,针对R语言在企业实际审计业务中的运用进行了部分演示,但R语言大数据审计仍然任重道远。
5.1 R语言在审计业务中应用的建议
5.1.1 培养大数据审计专业复合型人才
新领域的发展需要复合型专业人才,人才是推动行业进步的关键所在。要解决复合型人才培养问题,需要从教师与学生培养着手,高校应从师资引进与学生培养两方面展开:一是引进专业技术人才,加强数据技术人才与审计领域教师的交流合作,共同研讨大数据审计的教学方案;二是培养财会、审计领域学生对数据技术的兴趣,将最新数据技术教授给财会、审计专业类学生,解决财会、审计专业类学生学习数据技术的入门之难,进而使学生掌握大数据审计技术,培养学生运用大数据审计技术的能力,服务于市场。此外,企业、高校等应联合开设大数据审计技术课程培训,积极推动已就职审计人员培训,鼓励其加强大数据技术学习,提升大数据审计职业技能。
5.1.2 增强大数据审计人才创新能力
新领域的发展需要创新创造能力,财会、审计人员应积极学习创新创造技能,抛除陈旧思想,打开思路。随着R语言等大数据技术的进步,结合实际工作经验,创造性地开辟大数据审计的新途径,发挥审计人员的智慧和才干,创造适合大数据审计的新审计模式,并在实践中不断探索、探讨大数据审计模式的发展新思路,制定大数据审计规章制度,设定大数据审计具体流程。随着众多审计、财会专业人才的转型,以及新一代具备大数据技能与财会、审计专业知识的人才毕业、就业,大数据审计行业的发展集聚雄厚力量,未来可期。
5.1.3 为复合型人才提供就业渠道
政府应大力推动企业与高校深入合作,令高校充分了解市场就业需求,开展线上、线下招聘培训会议,让学生明晰市场就业需求,为高校毕业生提供充足的就业、实习岗位与渠道。高校应加大力度引进具有实务经验的优秀教师,使毕业生能将所学技能充分应用于市场、服务于市场。这样技术才能进步,大数据审计才能快速发展。另外,企业也可推广“导师制”,为学生提供更多实习岗位,提升其实践工作经验,弥补应届生初入职场的欠缺与不足。
5.1.4 完善大数据审计相关制度
完善大数据审计相关流程制度与配套规章,对规范大数据审计具有重要意义。无规矩不成方圆,大数据审计的各项指标、流程需规范化,需对大数据审计的开发提出指导性意见。制定大数据审计准则对审计业务的开展、实施、质量控制具有保障作用。
5.1.5 推动企业数据处理一体化建设
推动财务数据一体化建设,涉及多行业的大型集团公司可成立财务共享中心,构建财务信息化处理系统。企业数据分类规范化、统一化,避免命名冲突,进一步提高R语言文本聚类技术、电子化扫描技术、文字数据提取技术的精确性、有效性,确保数据与实体的真实、统一性,克服数据初始设定的困难。经过初次审计系统构建后,逐步规范和完善审计程序,使财务数据有效转化为审计数据,避免高冗杂、高重复性数据的收集和整理,保障大数据可视化编译的严谨性,谨防“假账真审”,确保审计程序顺利实施。
5.1.6 通过制度流程设定保障数据安全
在数据库建设进程中,应对数据制定相应的合理级别,如商业机密型、可部分公开型、完全公开型等;进一步强化数据浏览权限设定,因岗设权,保证审计实施过程中被审计单位的商业信息安全、员工个人信息安全,防止数据滥用;完善数据转运流程制度,由审计人员清点审计资料后办理转移接收手续,谨防审计数据遗失、泄露。
5.2 R语言在大数据审计中的应用展望
随着人工智能技术的不断成熟,R语言大数据审计终将在审计业务中普及。大数据审计的核心依托于机器学习,审计风险智能评判提示和数据真实性甄别将是大数据审计的2个前进方向。完善“人机交互”式审计程序,智能评判资金流动关联,监测资金总体变动情况,提示变动异常,供相关方使用;同时,审计人员也要注重对商业数据的有效保护,谨防数据遗失、泄露;做好舞弊智能识别,完善重大错报漏报防范机制。基于此,使R语言大数据审计充分发挥审计作用,完成审计使命。
6 结语
本文对R语言大数据审计可视化进行了分析,对大数据审计可视化的发展进行了探讨,得出该领域仍处于初步发展阶段的结论。运用R语言进行大数据审计,其意义不仅在于创新了审计方法,增加了审计方式的多样性,而且为大数据审计提供了更精准、便捷的途径,对审计行业的发展具有跨越式帮助。
参考文献
[1]牛艳芳,邓雪梅,陈伟.数据科学工具之R语言在审计数据分析中的应用探索[J].中国注册会计师,2016(9):93-97.
[2]陈伟,詹明惠,陈文夏.基于社会网络分析的金融科技系统用户管理风险审计方法研究[J].中国注册会计师,2019(12):74-78.
[3]刘国城,马欣萌,徐志.审计全覆盖驱动下大数据审计平台构建研究[J].会计之友 ,2021(11):125-132.
[4]宋铁波,陈玉娇,朱子君.量化文本分析法在国内外工商管理领域的应用对比与评述[J].管理学报,2021,18(4):624-632.
[5]陈伟,詹明惠.基于大数据可视化技术的信息系统AC审计[J].会计之友,2021(1): 120-125.
[6]山东省审计学会课题组,栾心勇,孟祥宇.山东大数据审计探索与实践[J].审计研究,2020(3):29-35.
[7]王茜一.基于数据可视化技术的医院药品加成绩效审计应用[J].财会通讯,2021(9):145-149.
[8]王雪荣,侯伟龙.大数据审计研究综述与展望:基于Citespace的知识图谱分析[J].会计之友,2021(23):78-86.
[9]王海洪,吕登辉,任美,等.我国大数据审计研究综述:基于中文核心期刊文献研究[J].会计之友,2021(14):134-139.
[10]ESPINOZA S C,NOVOA-MUOZ F.Ventajas del alfa ordinal respecto al alfa de cronbach ilustradas con la encuesta AUDIT-OMS [J].Revista Panamericana De Salud Pública,2018(42):1-6.
[11]羌雨.R与当前大数据审计方法的比较研究[J].时代金融,2017(15):220-221.
[12]张敏.大数据审计:五大趋势与五大挑战[J].会计之友,2020(8):2-11.
收稿日期:2022-03-15
作者简介:
王文婕,女,1996年,硕士研究生在读,主要研究方向:大数据审计、公司财务。
康玉梅(通信作者),女,1973年生,博士研究生,副教授,主要研究方向:公司财务、审计。