基于蚁群优化的数字化审计系统数据快速查询方法
2022-07-26张晶康鹏戴艳杨新敏李磊
张晶, 康鹏, 戴艳, 杨新敏, 李磊
(1.国网甘肃省电力公司, 甘肃, 兰州 730030;2.国网甘肃省电力公司检修公司, 甘肃, 兰州 730050)
0 引言
审计是国家对单位财务信息的重要监督和统计制度,随着大数据和信息处理技术的发展,采用信息化的特征分析和系统设计方法来实现审计的信息化管理和数据查询,提高审计过程的可靠性和有效性。数字化审计系统数据的查询技术研究是实现信息化审计管理系统底层数据库设计的关键技术,通过数字化审计系统数据查询优化设计,建立数字化审计系统数据的融合和特征聚类模型,采用智能化的信息管理和模糊数据聚类技术,实现数字化审计系统数据快速查询和信息融合,提高数字化审计系统数据查询和监测能力。数字化审计系统数据快速查询方法研究在审计系统优化设计中具有重要意义[1-2]。
对数字化审计系统数据快速查询的设计方法主要是通过分析数字化审计系统数据的相关性特征,结合融合聚类方法,实现数字化审计系统数据快速查询。传统方法中,文献[2]提出一种基于模糊匹配的审计证据获取方法,首先通过引入位置参数改进外存倒排索引结构,并采用非对称查询模式自适应地选择待匹配数据,实现审计大数据表格公共字段的快速模糊匹配,保证了算法在大数据下的运行效率,其次在公共字段匹配基础上,对字段内数据进一步进行相似性判断,从而发现相似审计舞弊数据,获得审计证据。文献[3]提出改进粒子群优化算法的数据库查询优化方法,构建数字化审计系统数据快速查询的语义本体结构模型,采用相关特征分析,实现数字化审计系统数据快速查询。但是以上两种方法在数字化审计系统数据查询的过程中,数据查询的寻优能力较差,导致查询时间较长,降低了数字化审计系统数据查准率[4]。
针对以上方法存在的问题,本文提出基于蚁群优化的数字化审计系统数据快速查询方法。首先对采集的数字化审计系统数据进行预处理[5],在最优变异度约束下,提取数据特征,然后采用蚁群算法进行数据查询的寻优控制,实现数据快速查询,最后进行仿真测试分析,展示了本文方法在提高数字化审计系统数据快速查询能力方面的优越性能。
1 数字化审计系统数据预处理
1.1 数据降维处理
为了实现基于蚁群优化的数字化审计系统数据快速查询,采用分布式链路节点跟随识别的方法实现对数字化审计系统数据采集和存储结构分析,结合压缩感知和分段融合的方法,分析数字化审计系统数据的分块存储结构模型,引入Block块匹配结构,通过数据集的位置标定和窗口函数分析,实现对数字化审计系统数据的高维特征匹配和信息融合处理[6],本文引入了一个工作窗口机制,得到数字化审计系统数据的分块存储结构模型如图1所示。
图1 数字化审计系统数据的分块存储结构模型
根据上述数字化审计系统数据的分块存储结构模型,实现对数字化审计系统的底层数据库融合,构建数据的空间数据发布模型,根据数据特征空间匹配结果,实现数据的线性跟踪控制,基于查询关键词与历史查询数据的匹配性[7-8],实现对数字化审计系统数据搜索和匹配,得到数字化审计系统数据的线性跟踪控制模型,如图2所示。
图2 线性跟踪控制模型
根据图2所示的数字化审计系统数据的线性跟踪控制模型,假设Gc表示数字化审计系统数据库的关联谱特征分布的有向图G1和G2的交集,在有向图G1和G2的传输链路节点中,分析数字化审计系统数据库的邻域空间A,B和C的共同节点,当数字化审计系统数据的存储空间属于G1和G2[9-10]。计算有向图G1、G2语义模糊特征分布域Sr,通过对采集的数字化审计系统数据进行非线性样本重组,得到非线性相关匹配集的计算公式为
(1)
式中,n(G1)和n(G2)分别表示数字化审计系统数据库分布有向图G1和G2中的查询节点数目,n(G1∩G2)表示数字化审计系统数据的交叉语义分布集。在数字化审计系统数据存储的公共结点中,通过语义融合,采用模板匹配和线性规划设计的方法进行数字化审计系统数据降维处理[11-13],得到降维输出为
(2)
1.2 数据特征提取
构建数字化审计系统数据的特征重构模型,形成数字化审计系统数据特征分布的语义相似度σ:
σ=SC*(a+[n(G1)-n(G2)]*Sr)
(3)
式中,a表示数字化审计系统数据的相邻特征匹配系数。当Sr=0时,数字化审计系统数据特征分布的语义相似度σ取决于SC*a。数字化审计系统数据的相邻特征匹配系数a表示为
(4)
式中,n(GC)表示在有限域Gc中查询到的数字化审计系统数据的主题词数量,ε表示数字化审计系统数据的模糊度辨识参量,mGC(G1),mGC(G2)分别表示数字化审计系统数据分布域G1、G2的关联规则特征分布集。采用蚁群寻优的方法进行数字化审计系统数据查询过程中的速度vi和位置收敛控制xi,得到数字化审计系统数据查询的蚁群寻优的过程目标控制函数f表示为
(5)
式中,γ2表示为数字化审计系统数据查询的蚁群寻优全局极值位置,当γ2越小,数字化审计系统数据查询的相似度水平越高。由此得到数字化审计系统数据查询最大和最小阈值控制参数ximax和ximin。由此得到数字化审计系统数据在区间(-1,1)之间的解释控制变量cxi:
(6)
(7)
利用数字化审计系统数据特征的差异性实现信息融合,提高数字化审计系统数据的检测和特征识别能力。
2 数字化审计系统数据快速查询优化
2.1 蚁群算法的播散信息素规则函数
在上述数字化审计系统数据降维处理和数据特征提取的基础上,采用蚁群算法进行数据查询的寻优控制。首先根据蚁群个体的差异性实现对数字化审计系统数据查询的异常特征判断,提取数字化审计系统数据的可靠性文本结构特征量,并对文本结构特征量进行加窗处理,窗函数形式为
(8)
式中,N(t)表示数字化审计系统数据的关联语义特征分辨率。采用多尺度平移控制的方法,建立数字化审计系统数据检测模型,得到语义关联度为
(9)
式中,数字化审计系统数据分布的模糊度点集满足UT=U-1。采用蚁群寻优的方法,得到数字化审计系统数据挖掘的觅食环境参数分布模型,根据蚁群觅食环境拟合,构建数字化审计系统数据查询的环境特征分布式融合检测模型,得到播散信息素规则函数:
(10)
2.2 数据查询的快速寻优
在模糊聚类中心采用蚁群优化算法对数字化审计系统数据的快速检索和识别,根据特征提取和聚类分析结果,在全局最优解约束进化下,得到蚂蚁完成一次循环后的局部核函数表达式为
(11)
(12)
(13)
式中,vt表示数字化审计系统数据查询的速度,xt表示t时刻的时间尺度,c1表示数字化审计系统数据查询聚类的空间规划系数,α1和α2是[0,1]之间的随机数。通过获取全部新产生的全局最优解,实现对数字化审计系统数据的快速查询,得到查询实现过程如图3所示。
图3 数字化审计系统数据查询实现过程
3 仿真实验分析
为了验证本文方法在实现数字化审计系统数据快速查询中的应用性,采用MATLAB进行仿真实验分析。实验中选取数字化审计系统数据的采样样本集为3 600,训练样本数为240,对数字化审计系统数据采集的延迟率为0.46,数据采样的频率为13.5 kHz,实验对象中抽取数字化审计系统数据样本数分别为80、120、200、340、…、1 550,每个数字化审计系统数据样本含有1 000个实验数据。
根据上述参数设定,分别采用文献[3]提出的审计大数据下模糊匹配审计证据获取方法、文献[4]提出的改进粒子群优化算法的数据库查询优化方法和本文提出的基于蚁群优化的数字化审计系统数据快速查询方法,对数字化审计系统数据查询时延进行比较分析,比较结果如图4所示。
图4 数字化审计系统数据查询的时延对比
分析图4得知,采用本文方法进行数字化审计系统数据查询,随着数据量的增加,数据查询时延逐渐增大,但本文方法的查询时延较文献[2]提出的审计大数据下模糊匹配审计证据获取方法、文献[3]提出的改进粒子群优化算法的数据库查询优化方法的查询时延短。
测试文献[2]提出的审计大数据下模糊匹配审计证据获取方法、文献[3]提出的改进粒子群优化算法的数据库查询优化方法和本文提出的基于蚁群优化的数字化审计系统数据快速查询方法的数字化审计系统数据查询的最优解,得到测试结果见表1。
表1 数字化审计系统数据查询性能对比
分析表1中的数据得知,本文方法进行数字化审计系统数据查询的寻优能力较好,且查询时间最短,说明本文方法的数字化审计系统数据快速查询效率较高。
为了进一步验证本文方法的有效性,对文献[2]提出的审计大数据下模糊匹配审计证据获取方法、文献[3]提出的改进粒子群优化算法的数据库查询优化方法和本文提出的基于蚁群优化的数字化审计系统数据快速查询方法的数字化审计系统数据查准率进行比较分析,比较结果如图5所示。
图5 数据查准率对比结果
根据图5可知,本文方法的数字化审计系统数据查准率最高可达100%,而文献[3]提出的审计大数据下模糊匹配审计证据获取方法和文献[4]提出的改进粒子群优化算法的数据库查询优化方法的数字化审计系统数据查准率最高只有68%和80%,本文方法的数字化审计系统数据查准率比文献方法好,说明本文方法的数字化审计系统数据查询效果较佳。
4 总结
本文提出基于蚁群优化的数字化审计系统数据快速查询方法。引入Block块匹配结构,通过数据集的位置标定和窗口函数分析,实现对数字化审计系统数据的高维特征匹配和信息融合,采用模板匹配和线性规划设计的方法进行数字化审计系统数据降维处理,采用蚁群寻优的方法进行数字化审计系统数据查询过程中的速度和位置收敛控制,获取最优解,实现对数字化审计系统数据的快速查询。仿真实验分析得知,本文方法进行数字化审计系统数据查询的时间开销较短,查准率较高。