APP下载

混合动态性数据情报侦查方法研究

2022-03-23薛亚龙刘梓泞宁夏警官职业学院宁夏银川750021

贵州警察学院学报 2022年1期
关键词:动态性侦查人员情报

薛亚龙,刘梓泞(宁夏警官职业学院,宁夏 银川 750021)

随着云计算、人工智能、物联网等智慧驱动创新科学技术的不断前进发展,各种海量复杂且具有离群性、动态性、层次性的混合动态性数据呈现出指数级的数量猛增。通过深入挖掘与分析这些混合动态性数据聚类之间的潜在关联数理关系,对于促进社会各行业领域的发展具有重要的预测和指导价值。混合动态性数据在给社会发展带来惠利的同时,也给数据化犯罪情势的生存与发展提供了必要性的“土壤”。混合动态性数据不仅包括结数值型数据、文本型数据而且还包括符号型数据、图像型数据等动态性数据源,造成传统动态性数据情报侦查过程中往往出现数据缺失碎片过多、模糊优势关系差值较少、数据聚类质量纯度不高等侦查错误。基于此,引入混合动态性数据情报侦查方法研究范式。这不仅促使侦查人员能够提升对混合动态性数据关联聚类加权系数和优先属性的阈值预设,而且还能够帮助其提高对不同混合动态性数据之间渐近正态性和相合性地挖掘与分析,从而能够帮助其快速有效地转变传统情报侦查思维模式和拓展创新情报侦查的新方法,最终实现混合动态性数据情报侦查方法的应然价值和实然效果。

一、混合动态性数据情报侦查的内涵与属性

在智慧驱动创新科学技术背景的引领下,大量复杂指数级的涉案混合动态性数据被存储和积累,其中往往隐藏着与涉案犯罪情势具有各种潜在关联数理关系的价值情报,对案件情报侦查预测和决策具有重要的关键性作用。如何对这些涉案混合动态性数据展开高效的关联聚类挖掘与分析,已成为智慧驱动创新科学技术时代现代情报侦查领域内迫切急需解决的重要任务。在混合动态性数据情报侦查应用过程中,侦查人员不管是对混合动态性数据进行数据清洗、数据预处理、数据仓库存储还是其平台设计、流程模型构建以及数据关联聚类算法应用等,都是建立在混合动态性数据情报侦查的内涵与属性基础之上。显然,将混合动态性数据与现代情报侦查工作互相融合而形成新的情报侦查方法即混合动态性数据情报侦查方法,这不仅是混合动态性数据在社会各领域行业所应用发展的必然趋势,而且还是传统情报侦查工作自身变革转型的内在本质应然要求,更是预防和打击犯罪情势数据化生存与发展态势的迫切实然应对选择。因此,在智慧驱动创新科学技术新时代下,应该赋予混合动态性数据情报侦查新的内涵与属性。

(一)混合动态性数据情报侦查的内涵

混合动态性数据挖掘与分析任务主要是通过数据清洗、数据预处理、数据集成、数据仓库存储以及数据关联规则构建和数据聚类算法应用等流程模型所实现,是机器学习、数据模式识别、数据挖掘等领域最为重要的研究内容之一。[1]依据对混合动态性数据挖掘与分析的不同流程模型,混合动态性数据挖掘与分析应用方法主要包括支持向量机的SVM 算法、决策树C4.5 算法、KNN 近邻算法、随机森林RF 算法以及朴素贝叶斯NB 算法等。[2]在对混合动态性数据进行预处理挖掘流程中,一般都是基于混合动态性数据的数据距离、数据路径以及数据相邻系数的相似度等而构建其存储的数据仓库模型;在其关联聚类分析流程中,主要通过确定混合动态性数据的测试样本与所需挖掘分析全部混合动态性数据关联聚类模型之间的数据相邻系数相似度,进而为采取行为预测和决策提供数据情报的支持保障。同时,不同混合动态性数据在被采取关联聚类后的频繁项目集中并不是处于孤立的状态,各个混合动态性数据之间依然存在一定程度的关联性,而且在混合动态性数据挖掘与分析的平台设计、流程模型构建等也蕴含着各种潜在的关联数理关系。[3]

随着人们对混合动态性数据挖掘与分析应用的要求越来越高,更多的关联聚类算法被引入其中。例如,Thiago 等提出一种基于虚拟网络的高层次混合动态性数据聚类算法。该算法是通过在虚拟网络中对各种混合动态性数据的数据聚集系数、数据路径同质性以及隐藏数据结构拓扑性等数据关联的挖掘和聚类,从而将混合动态性数据的隐藏数据结构拓扑性与其物理属性互相交互和互相融合的一种智能关联聚类算法;[4]Jiang 等从混合动态性数据局部挖掘模式关联类别化分类的性能差异角度出发,提出基于混合动态性数据之间数据加权权重系数的一种自动聚集编码的关联聚类算法;[5]还有学者以混合动态性数据表示的集成一致性函数为设计方法,提出诸如基于特征转换、标签对齐、相似性度量、数据图论等混合动态性数据挖掘与分析应用算法。[6]显而易见,将不同关联聚类算法应用于混合动态性数据的挖掘与分析时除了考虑其数据节点、数据距离、数据路径等物理属性之外,还需要进一步考虑不同混合动态性数据之间数据相邻加权系数等拓扑结构关系,从而实现混合动态性数据挖掘与分析应用的关联聚类性和优质性。基于此,结合混合动态性数据挖掘与分析的不同关联聚类算法和现代情报侦查工作的应然价值导向需求,作者认为,混合动态性数据情报侦查的内涵为:侦查人员采取时间序列算法、量子进化算法、K-prototypes聚类算法、数据表示聚类集成算法等混合动态性数据应用算法,通过对数据簇类中心、数据频繁项目集、数据相邻加权系数以及数据隶属度等混合动态性数据特征的挖掘与分析,帮助侦查人员快速有效获取其与涉案犯罪情势之间隐藏的内在各种关联数理关系,从而实现混合动态性数据情报侦查预测和决策的一种新型现代数据情报侦查方法。

(二)混合动态性数据情报侦查的属性

1.混合动态性数据情报侦查的粗糙集属性。1982 年波兰数学家Zdzislaw Pawlak 提出一种挖掘与分析模糊和不确定数据的数学理论即粗糙集理论。[7]该理论经过40 多年的不断完善和发展,逐渐地被应用于数据集成、数据挖掘、数据控制、数据决策等行业数据领域。随着智慧驱动创新科学技术的不断前进和发展,混合动态性数据在所有社会数据中的作用和价值也越来越突显,从而使粗糙集理论成为混合动态性数据最为重要的属性之一。混合动态性数据情报侦查方法作为混合动态性数据和现代情报侦查工作两者互相融合的时代产物,也必然具有粗糙集的重要属性。混合动态性数据情报侦查的粗糙集属性是由不同混合动态性数据的上下近似区域而构成的一个粗糙数据变量,每个混合动态性数据的加权阈值都是单一值并且已被获知,要求侦查人员必须用动态性数据等价关系的数据系数来挖掘分析。混合动态性数据情报侦查的粗糙集属性是挖掘与分析涉案不同混合动态性数据的重要理论基础和前提,也是帮助侦查人员将混合动态性数据仓库构建划分为边界混合动态性数据、正域混合动态性数据以及负域混合动态性数据的属性根据。混合动态性数据情报侦查的粗糙集属性是建立在对涉案不同混合动态性数据源的分类模式基础之上,可以将此处的分类模式理解为在涉案特定数据犯罪规则仓库中的不同混合动态性数据之间的等价关系。依据混合动态性数据情报侦查的粗糙集属性价值,一方面,侦查人员可以利用已构建的混合动态性数据情报侦查犯罪行为与非犯罪行为规则库对涉案数据仓库中表现不精确或不确定的各种混合动态性数据进行数据近似类别的归纳和统计;另一方面,侦查人员还可以依据其粗糙集属性对混合动态性数据情报侦查过程中数据清洗、数据集成、数据预处理、数据决策等流程模型进行检查和验证。混合动态性数据情报侦查的粗糙集属性具体包含两个方面特性:第一,混合动态性数据情报侦查的离散性。侦查人员将经过数据清洗、数据集成且存储在数据仓库中的不同混合动态性数据采取数据连续属性阈值的离散化技术处理,使其快速有效地形成混合动态性数据情报侦查的决策和预测指向表。第二,混合动态性数据情报侦查的属性约简性。如果在上述的决策和预测指向表中存在诸如离群数据、异常数据等具有冗余性的不同动态性数据,那么就应该将这些数据及时有效地进行检测和删除,快速获取到具有典型代表有效的涉案混合动态性数据。所以,侦查人员应该全面掌握混合动态性数据情报侦查的粗糙集属性,这不仅有利于实现混合动态性数据情报侦查流程的简便化效果,而且还有利于使混合动态性数据情报侦查预测和决策的应用结果更加精确和高效。

2.混合动态性数据情报侦查的多尺度属性。在数据研究对象中的多尺度是指数据测量单位,变量指的是统计学测量尺度基准的衡量数据,数据固有属性为数据挖掘过程中的尺度测量。[8]在混合动态性数据情报侦查应用过程中,侦查人员依据涉案不同混合动态性数据的特征选择属性,将数据仓库中范畴相同或相似的混合动态性数据组建成属性集,然后通过该属性集构建混合动态性数据的偏序结构。同时,侦查人员在此基础上进一步明确不同混合动态性数据的内涵体系分层且形成和实现对涉案混合动态性数据的结构划分,从而使混合动态性数据情报侦查具有典型的多尺度属性特征。混合动态性数据情报侦查的多尺度属性主要包含两个方面:一方面,混合动态性数据的偏序多尺度属性,即指混合动态性数据中的数据时序、数据幅度、数据路径、数据粒度等具有多尺度属性;另一方面,混合动态性数据的内涵体系多尺度属性,主要包括混合动态性数据的概念、类型、特点以及衡量能力等具有多尺度属性。显然,混合动态性数据情报侦查的多尺度属性不仅包括不同混合动态性数据之间相邻的加权权重多尺度属性,而且还包含混合动态性数据基本的内涵体系多尺度属性。从实现混合动态性数据情报侦查的应然价值而言,侦查人员能够利用其多尺度属性创建数据仓库中不同的混合动态性数据频繁项目子集,从而依据涉案犯罪情势的发展态势而采取对不同混合动态性数据的类别划分和数据粒度项目集的构建。在整个混合动态性数据情报侦查的应用过程中,侦查人员依据其多尺度的属性可以将涉案混合动态性数据多尺度数据结构表示为混合动态性数据仓库、混合动态性数据表空间、混合动态性数据索引段以及混合动态性数据区间和混合动态性数据模块等(见图1)。

图1 混合动态性数据多尺度数据结构表示

3.混合动态性数据情报侦查的网络多属性。混合动态性数据情报侦查的网络多属性建立在对数值型数据、符号型数据、文本型数据以及图片型数据等各种混合动态性数据的特征选择挖掘与分析基础之上,侦查人员通过构建犯罪行为与非犯罪行为的贝叶斯关联规则和采取不同的关联聚类算法,进而帮助其能够快速准确地发现和寻找隐藏在不同混合动态性数据之间且与涉案犯罪情势具有关联性的各种数理关系。传统数据情报侦查方法主要是依据数据爬虫、设置TCP/IP 协议栈、数据布局分配等数据属性对不同数据展开挖掘与分析,从而完成传统数据关联聚类的流程构建和算法应用,侦查人员在进行情报侦查预测和决策时往往出现数据缺失碎片过多、数据聚类质量纯度不高等侦查错误。在智慧驱动创新科学技术的新时代,混合动态性数据情报侦查的网络多属性却给侦查人员开展其情报侦查预测和决策提供了逻辑的理论基础。从混合动态性数据情报侦查应用的实际效果角度而言,混合动态性数据情报侦查的多网络属性主要包含两个方面内容:第一,混合动态性数据存储结构的网络多属性。首先,侦查人员采用贝叶斯的关联聚类算法对涉案混合动态性数据的网格分块区域进行划分调度,将特征选择融合度相同和相似的不同混合动态性数据选入数据仓库构建的候选区,对其进行归纳和统计使其形成混合动态性数据情报侦查应用的数据聚类中心集。然后,采用熵函数的混合动态性数据聚类算法对数据聚类中心集进行分布式的数据概率重组,分别获取到混合动态性数据情报侦查应用的数据标准差值和目标样本数据库。最后,根据混合动态性数据情报侦查流程的参数设置阈值,采用混合动态性数据的均衡配置和信道转换的方法而实现对其动态存储结构的重建,从而使混合动态性数据的存储结构具有网络多属性的范畴。第二,混合动态性数据特征融合的网络多属性。在混合动态性数据存储结构网络多属性的基础上,侦查人员采用数据特征快速收敛的技术方法构建混合动态性数据情报侦查的随机数据检验模型,通过利用混合动态性数据灰度特征选择的组合方法,帮助侦查人员及时地获取和更新涉案犯罪行为与非犯罪行为的规则库参量变化条件,即可形成具有网络多属性的分布矩阵混合动态性数据特征融合。因此,混合动态性数据情报侦查的网络多属性对提高混合动态性数据的挖掘准确性和关联聚类性具有关键性的重要价值。

二、混合动态性数据情报侦查的平台设计

目前,侦查人员对不同涉案数据源的控制和管理主要是通过采取通信密码技术中的非对称加密算法和对称加密算法而实现。其中非对称加密算法数据安全系数高但数据收敛速度耗时大,不合适对指数级海量的混合动态性数据进行挖掘与分析;而对称加密算法尽管具有运算的高效性但存在加解密钥相同的现象,导致安全系数的全面下降。[9]显然,非对称加密算法和对称加密算法均无法应用于混合动态性数据情报侦查的特殊场景。基于此,结合混合动态性数据情报侦查挖掘与分析应用中涉及数据管理安全、准确高效性能、预测和决策精确、情报侦查价值需求等综合因素考虑,作者认为,侦查人员可以采用包括混合动态性数据情报侦查验证子系统、混合动态性数据情报侦查安全管理子系统、混合动态性数据情报侦查权限认证子系统等综合功能的混合动态性数据情报侦查平台设计方案(见图2)。

图2 混合动态性数据情报侦查的平台设计方案

依据混合动态性数据情报侦查的平台设计方案可知,其包括混合动态性数据情报侦查验证子系统、混合动态性数据情报侦查安全管理子系统、混合动态性数据情报侦查权限认证子系统、混合动态性数据情报侦查可视化子系统、混合动态性数据情报侦查研判分析子系统以及混合动态性数据情报侦查个性设置子系统等六个子系统。第一,混合动态性数据情报侦查验证子系统。该系统是整个混合动态性数据情报侦查平台设计的支撑系统,主要包括侦查人员的登录验证模块和密钥管理模块,通过与其它子系统的互相交互进而完成动态性数据情报侦查应用的访问控制和用户管理。第二,混合动态性数据情报侦查安全管理子系统。该系统是混合动态性数据情报侦查平台设计的数据管理仓库,主要包括权限使用模块、通信加密模块、传输控制模块、检查验证模块以及仓库存储模块和更新替换模块等,其作用是与混合动态性数据情报侦查可视化子系统和混合动态性数据情报侦查研判分析子系统之间实现情报侦查业务的互相交互。第三,混合动态性数据情报侦查权限认证子系统。该系统主要包括登录认证和数据密钥管理等,其作用是根据案件侦查情势发展对情报侦查需求导向的变化及时与混合动态性数据情报侦查验证子系统实现登录认证、混合密钥分配等权限共享和认证更新。第四,混合动态性数据情报侦查可视化子系统。该系统主要包括对涉案各种混合动态性数据的数据解密、数字地图、数据统计以及数据管理等功能。第五,混合动态性数据情报侦查研判分析子系统。该系统功能主要包括对涉案混合动态性数据的研判设置、研判处理、研判历史以及研判预测等,其目的是为混合动态性数据情报侦查预测与决策提供数据支持和数据响应。第六,混合动态性数据情报侦查个性设置子系统。该系统主要包括个人配置、传输设置、权限变更、动态管理等功能,其主要作用是为侦查人员进行数据下载模块、数据校对模块、数据验证码模块等提供数据校对修正的数据保障。

三、混合动态性数据情报侦查的指标加权系数

在混合动态性数据挖掘与分析应用过程中,往往存在仓库构建的非全面性、规则设计的模糊性、数据集成的随机性以及指标评价的非精确性等突出问题。如果侦查人员仍然采取传统情报侦查的评价体系方法,那么就会造成所挖掘分析出来的关联数理关系与客观犯罪情势的发展存在一定的差异性,甚至还会导致部分侦查预测和决策出现侦查错误或陷入侦查僵局。同时,在混合动态性数据情报侦查的挖掘与分析应用过程中,侦查人员还无法直接对涉案不同的混合动态性数据进行综合评价。为了更好地实现混合动态性数据情报侦查的应然价值和实然效果,在考虑混合动态性数据适配性和情报侦查情势动态性的综合基础之上,提出和引入符合预防、打击数据化犯罪情势生存与发展的混合动态性数据情报侦查的指标加权系数。

(一)熵权分类型相异度系数

为解决对混合动态性数据的量化运算问题,Shannon 从热力学角度提出“混合动态性数据熵权”的概念。混合动态性数据熵权不仅可以被应用于对不同混合动态性数据离散程度的挖掘与分析,而且还可以通过利用多维混合动态性数据的适合权重系数而提高其关联聚类的应用效果。[10]混合动态性数据熵权和关联聚类在情报侦查中的内在关系为:相同混合动态性数据构成的聚类簇比异同混合动态性数据所构成聚类簇的熵权阈值要小。反之,如果相同混合动态性数据被数据仓库构建到不同的聚类簇中,那么其熵权阈值就会增大。在混合动态性数据情报侦查的应用过程中,混合动态性数据的类型复杂性和特征数量性与其熵权阈值的系数呈正相关关系。显然,将混合动态性数据熵权的阈值引入到混合动态性数据情报侦查的指标加权系数之中,可以帮助侦查人员实现对涉案混合动态性数据特征的定量差异距离的挖掘分析。

在实现混合动态性数据情报侦查的关联聚类应用中,混合动态性数据之间的差异距离系数与其特征的分类型具有负相关关系。从混合动态性数据的内涵属性而言,不同混合动态性数据的熵权阈值也反映了其在混合动态性数据情报侦查中的应用价值权重系数。侦查人员可以根据涉案混合动态性数据特征的分类型性质不同,利用混合动态性数据熵权阈值的差异性而计算其在整个混合动态性数据情报侦查应用价值中的权重系数,从而达到提升混合动态性数据情报侦查预测和决策的实然效果。例如,侦查人员可以利用涉案混合动态性数据特征中聚类相对频率、簇间分布路径、相异度差异数等不同分类型性质,实现对混合动态性数据的关联聚类特征期望值、路径差异度分布、离散距离概率等的运算与挖掘。

(二)量化加权相异度系数

为了实现混合动态性数据情报侦查的应然价值,侦查人员可以采取欧氏数据距离算法完成对涉案各种混合动态性数据的数据集成、数据清洗等流程模型。这不仅能够帮助侦查人员降低关联聚类算法的复杂度和耗时量,而且还能够提升混合动态性数据情报侦查预测和决策应用的客观性和精确性。从引入和采取量化加权相异度系数的情报侦查应用价值而言,主要包含两个方面的内容:一方面,量化的混合动态性数据相异度系数。在对涉案不同混合动态性数据进行量化相异度时,侦查人员可以采用无量纲化和有量同驱化的数据处理技术,从而寻找和发现隐藏在聚类簇中混合动态性数据相异度系数的最小阈值和最大阈值。另一方面,加权的混合动态性数据相异度系数。首先,预设混合动态性数据情报侦查的聚类簇表示为D={Xi,1 ≤i ≤N},其中聚类簇有N 个混合动态性数据对象,每个混合动态性数据都具有M维加权特征(P 维表示分类型加权特征,M-P维表示数值型加权特征)。然后,将M-P 维混合动态性数据当作一个完整的数据向量进行数据仓库构建,在该数据仓库中再以P 维混合动态性数据为加权系数构建犯罪行为的关联聚类规则。最后,使用N 个P 维混合动态性数据和N+1 个M-P 维混合动态性数据对其加权的混合动态性数据相异度系数展开计算和统计。量化加权相异度系数不仅能够帮助侦查人员及时高效地寻找和发现混合动态性数据相异度系数的最小阈值和最大阈值,而且还能够帮助其进一步提升对P 维和M-P 维混合动态性数据相异度系数挖掘的精确性和聚类性。

(三)聚类比例效果加权系数

为了提升混合动态性数据情报侦查应用的实然效果价值,侦查人员可以采取MSQEA 聚类算法对涉案原始的混合动态性数据情报源进行聚类挖掘分析,并将聚类后的混合动态性数据中心样本作为检查和验证的重要依据。显然,混合动态性数据的聚类中心数量对是否实现混合动态性数据情报侦查的应然价值和实然效果具有直接性的关联关系。如果混合动态性数据的聚类中心数量预设过大,那么就会降低混合动态性数据情报侦查应用的聚类效果和价值;反之,则会增加混合动态性数据情报侦查应用的聚类成本和收敛耗时量。基于此,作者认为,侦查人员可以将混合动态性数据的聚类中心数量阈值预设为[0.2~0.9]之间,其中混合动态性数据的聚类步长为0.1。设置科学合理的聚类比例效果加权系数能够有效地避免或降低在混合动态性数据情报侦查中出现欠拟合或过拟合等突出聚类算法问题。同时,为了检验和修正混合动态性数据的聚类中心数量阈值等聚类比例效果加权系数的科学合理性,侦查人员还可以采取MSQEA 聚类算法中的CS 聚类验证算法和RS 聚类验证算法进行综合研判。因此,科学合理有效预设聚类比例效果的加权系数,不仅帮助侦查人员避免或降低出现错误型和冗余型混合动态性数据的概率,而且还能够及时高效地提升混合动态性数据情报侦查应用的聚类精度,从而起到解决混合动态性数据聚类重叠和聚类析取等问题的价值作用。

四、混合动态性数据情报侦查的流程模型构建

在实际的混合动态性数据情报侦查应用过程中,侦查人员需要处理海量复杂的数值型、文本型、图片型以及分类型等混合动态性数据情报源。传统数据情报侦查的流程一般包含数据情报搜集、数据情报控制、数据情报存储、数据情报分析以及数据情报应用等具体流程。采取传统数据情报侦查的流程来处理涉案不同混合动态性数据源往往会出现以下突出问题:第一,破坏了混合动态性数据的初始结构,造成数据转换后的各种指标加权系数出现降维现象;第二,缺失了动态性数据隐藏的相异度系数,导致无法真实有效反映混合动态性数据聚类簇的聚类中心数量阈值;第三,混合动态性数据的各种加权阈值较大,挖掘与分析应用的偏差系数也较大;第四,混合动态性数据的粗糙集、多尺度、网络多等属性容易降低混合动态性数据情报侦查挖掘与分析应用的高效性。显然,传统数据情报侦查流程已难以适应对各种混合动态性数据情报源展开挖掘与分析。基于此,结合混合动态性数据情报源的结构特征和混合动态性数据情报侦查的应然价值导向需求,作者认为,混合动态性数据情报侦查的流程模型应该包括数据预处理流程模块、数据特征选择流程模块、数据聚类挖掘流程模块、数据算法选择流程模块以及数据结果验证修正流程模块等五个方面(见图3)。

图3 混合动态性数据情报侦查的流程模型构建

(一)数据预处理流程模块

数据预处理流程模块是混合动态性数据情报侦查流程的起点和基础,主要包括对混合动态性数据情报源进行的数据集成、数据清理、数据转换以及数据约简等。首先,数据集成。数据集成主要是通过人机智能的方式进行,任务包括统一混合动态性数据情报源结构,将其分为时间型混合动态性数据、空间型混合动态性数据、时空型混合动态性数据等方面,并将经过数据集成后的动态性数据情报源进行数据仓库构建。其次,数据清理。数据清理包括三个具体步骤即增加空缺混合动态性数据存储、去除重复混合动态性数据记录以及混合动态性数据的离群点检测,主要将数据仓库中的各种重复数据、空缺数据、离群数据进行挖掘和清除,以便提高混合动态性数据情报侦查挖掘与分析应用的精确性和高效性。再次,数据转换。根据不同混合动态性数据情报侦查挖掘算法的不同需求,侦查人员需要对经过数据清理后的各种混合动态性数据依据数据差标准化、数据比值标准化、数据差值标准化等数据标准进行不同数据转换。最后,数据约简。数据约简主要包括混合动态性数据分区约简、混合动态性数据数值约简、混合动态性数据维度约简三部分,这三部分数据约简既没有互相依赖性也没有固定的前后实施顺序,只需侦查人员每次在数据约简之前在数据仓库中提取被数据转换后的混合动态性数据情报源即可。

(二)数据特征选择流程模块

混合动态性数据情报源不仅是一个含量大、指数增长快、变化动态的数据频繁项目集,而且其数据特征也会随着数据化犯罪情势生存的发展态势而改变。为了提升混合动态性数据情报侦查的关联聚类效果,可以将混合动态性数据情报源的频繁项目集表示为A={X1,X2,X3,...,Xn},且集中每个混合动态性数据的阈值属性都是具有独立性。如果混合动态性数据的聚类阈值符合Xi∈A,那么该混合动态性数据的数量(S)属性就属于聚类簇Ai={X1i,X2i,X3i,...,Xsi}的频繁项目集。反之,当缺失某混合动态性数据的数据特征时,侦查人员则需要重新选择质量和精确度高的数据特征来代替。结合混合动态性数据情报源频繁项目集和其聚类阈值的关联关系,作者认为,数据特征选择流程模块具体可以分为以下步骤:首先,数据性能加强。混合动态性数据情报源具有突出的分离性和紧致性特点,一方面,混合动态性数据测量的分离性越高,那么其被聚类的质量就越高;反之,则被聚类的质量就越低。另一方面,混合动态性数据测量的紧致性越低,那么其被聚类的效果就越强;反之,则被聚类的效果就越弱。侦查人员可以采取二维代价矩阵的矩阵算法来同步存储和数据仓库构建运算混合动态性数据的分离性和紧致性,促使在聚类的过程中其数据性能能够得到全面加强。其次,冗余特征移除。侦查人员可以采取冗余分析和关联分析的数据特征选择方法,依据混合动态性数据频繁项目集中关联规则来寻找和挖掘部分异常的混合动态性数据,按照数据特征子集等级分割的序列标准进而完成部分混合动态性数据冗余特征的移除。再次,数据属性权重的确定。混合动态性数据情报源是分类型、数值型、文字型、图片型等混合动态性数据的结合体,不同类型混合动态性数据在混合动态性数据情报侦查中的权重系数亦不一样。经过冗余特征移除之后,侦查人员需要进一步确定不同混合动态性数据的属性权重。最后,相异度指标系数。侦查人员可以将混合动态性数据情报侦查中的相异度指标系数表示为MDIS ≤A,C ∪D,B,F >,如果其相异度指标系数的阈值为Ck={C1,C2,C3,...,Ck}(k ≥2),那么就表示混合动态性数据的相异度指标系数为M=C ∪D(其中C=Anum∪Acat),从而为后续进行数据聚类挖掘提供算法的参数支持。

(三)数据聚类挖掘流程模块

数据聚类挖掘流程模块是混合动态性数据情报侦查流程模块的重要核心组成部分,可以将其具体分为三个步骤:首先,模糊相关性融合处理。根据混合动态性数据情报侦查对聚类中心数量阈值的预设要求,侦查人员可以采取聚类寻优算法而获得混合动态性数据情报源的多维数据结构,进而运算并计算混合动态性数据进行聚类的关联规则库和粗糙数据频繁项目集。同时,结合混合动态性数据情报侦查的区域聚类挖掘与分析算法,进一步帮助侦查人员获取到其模糊聚类中心数量阈值的预设空间矩阵,并对混合动态性数据的模糊聚类采取具有相关性的数据融合处理,从而实现混合动态性数据情报侦查的模糊聚类效果和数据优化调度要求。其次,数据聚类输出。侦查人员在前面对混合动态性数据情报侦查源进行模糊相关性融合处理的基础上,依据其分类属性而展开模拟神经网络的混合动态性数据聚类模型构建。结合混合动态性数据情报侦查源的神经元系数和标量数据序列两者之间的关联关系,在其输出层即可获得其加权的学习系数。一方面,侦查人员可以采取分组类别检测的方法对标有加权系数的混合动态性数据进行分段聚类检测;另一方面,还可以采取多层神经的聚类算法得到混合动态性数据情报侦查源的神经网络数据聚类和其聚类的边值收敛系数,从而促使在混合动态性数据情报侦查应用中完成和实现数据聚类的结果输出。最后,数据聚类挖掘模型。为了全面提升混合动态性数据情报侦查聚类的高效性和优质性,侦查人员可以采取基于分类型和数值型混合度量算法的数据聚类挖掘模型即D(Xi,Uj)=Dn+WlDc,其中Dn代表分类型的混合动态性数据,而Dc代表数值型的混合动态性数据,Uj则代表混合动态性数据中聚类中心j 的特征选择向量,Wl代表混合动态性数据的不同指标加权系数。侦查人员可以通过以上数据聚类挖掘模型来完成和实现对各种涉案混合动态性数据情报侦查源的聚类挖掘,从而得到更加客观和精确的混合动态性数据情报侦查预测与决策。

(四)数据算法选择流程模块

数据算法选择流程模块在混合动态性数据情报侦查应用中具有承上启下的衔接作用,它是数据聚类挖掘流程模块的延伸和拓展,更是数据结果验证修正流程模块的基础和条件。依据数据算法选择流程模块的应用价值作用,可以将其具体分为三个步骤:首先,算法模式影响力。在混合动态性数据情报侦查挖掘与分析过程中,每个混合动态性数据对其所起的价值作用也各不相同。有的混合动态性数据的价值作用呈现负相关,而有的则具有正相关的决定性价值作用。同时,大部分混合动态性数据的分布具有非均匀性,任何一个混合动态性数据在相对数据距离范围内都会被不同的其他混合动态性数据所围绕。基于此,侦查人员可以实际关联聚类效果为切入点,以数据节点和数据路径的距离密集度为中心对不同混合动态性数据在整个混合动态性数据情报侦查算法中的模式影响力进行测算和评估。其次,算法性能指标。为了提升和实现混合动态性数据情报侦查应用的高效性和精确性,作者认为,侦查人员可以采用指标聚类精度的AC 值来对其进行算法性能指标的评估即其中:NUM+代表被数据仓库构建到聚类簇中混合动态性数据的数量阈值,而AC 则代表聚类簇中正确的混合动态性数据数量占所有涉案动态性数据情报侦查源的比值。显然,指标聚类精度的AC值越大,那么混合动态性数据情报侦查应用的高效性和精确性也就越高。最后,算法精度对比。侦查人员可以利用不同的关联聚类算法对每个混合动态性数据采取至少20 次以上的指标聚类精度AC 的测算,尤其对数值型、分类型、混合型等混合动态性数据的相异度系数给予充分的运算和评估。通过发现和获取不同混合动态性数据情报侦查算法之间的精度对比与差异,全面提高混合动态性数据情报侦查预测和决策的客观性和准确性。

(五)数据结果验证修正流程模块

首先,评价标准。为了检验混合动态性数据情报侦查应用算法的科学性和有效性,作者认为,侦查人员可以采取内外互相结合的评价标准。其中:内部的评价标准为CUM 一种,而外部的评价标准包括PR、AC、ARI、RE、NMI五 种。PR、AC、ARI、RE、NMI 和CUM 内 外评价标准的参数阈值越大,就说明混合动态性数据情报侦查的关联聚类实然效果越好,也证明其预测和决策更加科学和有效。其次,仿真应用。从提升混合动态性数据情报侦查的应用性能而言,侦查人员可以采取Matlab 模型的仿真实验。例如,侦查人员可以从数据仓库中选取分类属性阈值12、训练集120 以及数据距离1600 的不同混合动态性数据进行数据特征关联聚类的测试,通过对混合动态性数据特征的模糊相关性阈值、神经网络模型的改进以及分类构建等互相融合和互相重组,经过该仿真应用最终能够归纳与对比其应用情报侦查预测和决策的准确率、偏差率。再次,结果分析。结果混合动态性数据情报侦查的仿真应用之后,就需要对其结果展开挖掘分析。例如,将数值型、分类型、混合型的动态性数据分别存储到混合动态性数据情报侦查的应用结果IScr、ISly、ISwi之中,侦查人员经过对其算法应用结果分析即可得知:GRC 算法适合于数值型的混合动态性数据,LOF 算法适合于分类型的混合动态性数据,而NGOD 算法则适合于混合型的混合动态性数据等。最后,反馈修正。侦查人员通过混合动态性数据情报侦查挖掘与分析出与涉案犯罪情势具有内在关联性的各种数理关系之后,必然会将其应用到具体的情报侦查预测和决策之中,在应用过程中或结束后会及时地对其进行反馈修正。如果应用的结果与涉案犯罪情势具有相符合性,出现有利于侦查情势发展的情报侦查预测和决策,那么就证明其具有客观性和准确性。反之,则需要侦查人员及时地对其进行反馈和修正,进而对混合动态性数据情报侦查的数据加权阈值系数、流程模型构建以及关联聚类算法等及时进行检查和修正,从而实现混合动态性数据情报侦查的应然价值和实然效果。

五、混合动态性数据情报侦查的应用算法

尽管已有很多关于混合动态性数据挖掘与分析的算法被提出和引入,但是现有的算法主要基于混合动态性数据情报源的数据节点、数据距离、数据路径以及数据密度、数据相似度等方法,造成在传统混合动态性数据挖掘与分析算法中往往会出现数据缺失碎片过多、模糊优势关系差值较少、数据聚类质量纯度不高等突出问题。因此,结合混合动态性数据的粗糙集、多尺度、网络多等内涵属性和现代情报侦查工作要求的智能性、联动性、合成性等应然需求,在智慧驱动创新科学技术新时代应该赋予混合动态性数据情报侦查应用新的算法。这不仅是解决传统混合动态性数据算法中出现数据缺失碎片过多、模糊优势关系差值较少、数据聚类质量纯度不高等突出问题的迫切需求,而且还是预防和打击数据化犯罪情势生存与发展态势应对措施的必然选择。

(一)时间序列预测算法

时间序列预测算法主要是基于对混合动态性数据情报源中的数据日志挖掘以及通过当前数据和历史数据而展开预测的一种算法,具有典型代表性的有人工神经网络算法、支持向量回归机算法以及基因表达式编程算法等三种方法。

1.人工神经网络算法。人工神经网络算法是仿生学和智能算法有机融合的典型代表,在算法中加入大量数据神经元且按照运算规模而将数据神经元划分为不同的层次。[11]从对混合动态性数据情报侦查应用的效果而言,侦查人员可以将混合动态性数据情报源构建为输入层、隐含层、输出层三个数据仓库,任何两层之间的数据神经元均存在关联性的数理关系。例如,以输出层和隐含层为例。侦查人员可以将该两层的数据神经元关系表达为其中Wij就表示隐含层第i 个混合动态性数据神经元输出到输出层第j 个混合动态性数据神经元阈值的权重加权系数。显然,任何两层之间的权重加权系数都是通过采取不同的梯度降维混合动态性数据算法而挖掘获得。如果侦查人员将j(θ)预设为该算法中输入层中第n 个混合动态性数据神经元的网络偏差函数,那么该混合动态性数据的权重加权系数矩阵即可表示为:,而就是其经过人工神经网络算法而获得混合动态性数据情报侦查预测和决策的关联数理关系阈值。诚然,人工神经网络算法中的梯度降维算法主要适用于规模较小的涉案混合动态性数据情报源挖掘与分析应用。当其规模较大时,侦查人员只需要采取人工神经网络算法的梯度升维算法即可。

2.支持向量回归机算法。支持向量回归机算法是一种以支持向量机逻辑训练的监督型混合动态性数据算法,通过非线性数据转换方式将涉案混合动态性数据从低维的数据仓库映射到高维的数据仓库之中,然后在高维的数据仓库中对其进行线性回归关联性的挖掘与分析。支持向量回归算法的过程可表示为F(x)=aw(x)+b,且w:r →t 和a ∈t,其 中a=[a1,a2,a3,...,am]t表示为映射到m 数据仓库中不同混合动态性数据的特征选择权重加权系数,而b 则为混合动态性数据的预设阈值。显然,在混合动态性数据情报侦查的挖掘与分析应用过程中,侦查人员通过采取支持向量回归机算法对其进行时间序列混合动态性数据的线性挖掘分析,从而实现对混合动态性数据中涉及时间数据关联数理关系的研判和预测。

3.基因表达式编程算法。基因表达式编程算法是从遗传算法中演变和发展起来的一种新型仿生学数据挖掘算法,主要依据不同混合动态性数据基因染色体的形成机制而对其通过数据“染色体”的方式重新进行编程和构建。[12]根据涉案混合动态性数据情报源的不同类型和属性,侦查人员可以利用不同混合动态性数据在数据集成或数据仓库构建过程中进行数据突变、数据转换、数据融合以及数据复制等数据“染色体”变化方式,通过采取对混合动态性数据淘汰筛选模式重新选择频繁项目数据集的子集数据“染色体”,进而全面提升混合动态性数据情报侦查应用的挖掘思路和算法性能。

(二)量子进化算法

针对涉案混合动态性数据不同权重加权系数的预设阈值问题,侦查人员可以采取混合动态性数据的量子进化算法。量子进化算法又被称为QEA 算法,属于将进化算法和量子理论两者互相融合、互相交互的一种新型智能混合动态性数据算法。[13]量子进化算法采取通过量子比特的方式来挖掘与分析涉案不同混合动态性数据的概率幅阈值,促使其能够被快速有效地融合和叠加,进而帮助侦查人员高效地解决混合动态性数据情报侦查过程中的模糊优势关系差值较少等复杂问题。在混合动态性数据情报侦查的量子进化算法过程中,每个不同频繁项目数据集都是由数个具有量子比特特征的混合动态性数据所构成。侦查人员可以用0 和1 来表示集中混合动态性数据的概率幅阈值y,即其阈值可以表示为0 或1 也或0 与1 的中间。同时,侦查人员还可以提前将涉案混合动态性数据情报源的长度阈值预设为n,数据仓库中的频繁项目数据集表示为m,而第t 个频繁项目数据集中的混合动态性数据的量子种群即可被表示为Q因此,为了实现混合动态性数据情报侦查预测和决策的最优实际效果,量子进化算法具体可以分为以下步骤:第一步,将t 的初始值设为0,且第t 个频繁项目数据集中的混合动态性数据的量子种群表示为第二步,将频繁项目数据集中不同混合动态性数据的量子比特概率幅表示为。如果混合动态性数据的概率幅阈值那么与其相对应的量子比特值为0。反之,则为1。显然,混合动态性数据的概率幅阈值与其量子比特值呈正相关的数理关系。第三步,依据第二步的算法结果,需要对每个涉案混合动态性数据采取适应度的分析和评估。侦查人员选取适应度最优的涉案混合动态性数据作为量子进化算法中的最佳局部参考标准,然后将其与频繁项目集合中所有的混合动态性数据进行比较,并对继续发现和寻找到的最佳局部参考标准进行统计和更新,直到满足混合动态性数据情报侦查量子进化算法的终止条件为止。第四步,根据第三步量子进化算法对涉案混合动态性数据适应度分析和评估的最终结果,侦查人员对混合动态性数据的量子种群及时进行更新和运算。第五步,设t=t+1,返回第二步。量子进化算法具有使涉案不同混合动态性数据能够进行互相融合和叠加的功能作用,促使频繁项目数据集中各种混合动态性数据都能够被不断地层层关联聚类。所以,量子进化算法不仅能够帮助侦查人员降低对数据收敛速度的耗时,而且还能够提升混合动态性数据情报侦查的精确度。

(三)数据表示聚类算法

数据表示聚类算法主要原理为:首先,侦查人员通过T 次K-Means 聚类算法对涉案各种混合动态性数据进行数据集成,并将其作为混合动态性数据挖掘的符号型属性依据。其次,将剩余的混合动态性数据与数据集成的符号型混合数据互相融合,采用K-Prototypes 聚类算法获得第T 次聚类后新的符号型混合动态性数据集合。再次,将新的符号型混合动态性数据代替以前旧的并通过Q 次循环聚类算法而获得更优质的混合动态性数据基聚类。最后,将用数据表示最后获取的混合动态性数据最小的聚类集成作为混合动态性数据情报侦查预测和决策的依据。基于此,数据表示聚类算法在混合动态性数据情报侦查中的具体应用步骤为:第一步,将经过T 次K-Means 聚类算法所形成的数据结果作为对混合动态性数据进行挖掘与分析的符号型属性依据,并将其与原来剩余的混合动态性数据进行互相融合和互相结合使其形成新的混合动态性数据情报源。第二步,在形成新的混合动态性数据情报源中寻找和选取K 个聚类样本作为其进行聚类中心初始的数据仓库模型。第三步,在该聚类中心初始的数据仓库模型中对每个混合动态性数据样本的相异性进行归纳和统计,并将数据节点、数据距离以及数据路径等数据权重加权系数相同或相似的混合动态性数据进行数据聚类,使其形成不同的混合动态性数据频繁项目数据集。第四步,再次对每个混合动态性数据频繁项目数据集进行计算和挖掘,如果混合动态性数据的聚类类型属于数值型,那么就取其全部数据阈值的平均值;相反,如果聚类类型属于符号型,那么则需要取出现概率最多混合动态性数据阈值的平均值。第五步,循环第三步和第四步,直到每个混合动态性数据样本的聚类属性不再出现差异性为止。第六步,将第二步到第五步的数据表示聚类算法循环T 次,将聚类和获取后的新混合动态性数据结果不断替换原来第一步中的聚类样本。第七步,将第六步循环Q 次数据表示聚类算法以后,在其聚类矩阵结果中挖掘与分析出作为进行混合动态性数据情报侦查预测和决策的应用依据。在混合动态性数据情报侦查应用的过程中,数据表示聚类算法的核心功能在于既能够保证混合动态性数据聚类矩阵结果和其聚类初始中心数据属性的一致性,又能够保证各混合动态性数据原始数据结构属性和其频繁项目数据集属性的一致性,从而促使其通过循环的数据表示聚类算法而提高混合动态性数据情报侦查应用的聚类性和关联性。

(四)三支决策混合采样算法

针对传统数据情报侦查过程中存在关联效果质量低、数据聚类质量纯度不高以及算法耗时较长等突出问题,提出和引入一种基于三支决策理论的三支决策混合采样算法。一方面,三支决策混合采样算法能够帮助侦查人员剔除或降低关联低密度低混合动态性数据的出现率,提高对混合动态性数据关联密度高的挖掘率;另一方面,还能够帮助侦查人员解决混合动态性数据情报侦查应用算法耗时较长等相关问题,从而帮助侦查人员提高混合动态性数据情报侦查应用算法的高效性和创新变革其新思路、新途径。基于此,作者认为,侦查人员在混合动态性数据情报侦查应用过程中可以将三支决策混合采样算法具体分为以下具体步骤:第一步,混合动态性数据归一化处理。为了避免或降低由于涉案各种混合动态性数据之间预设阈值、采样取值范围、数据关联结构属性等差异性而造成出现混合动态性数据情报侦查预测和决策的偏差现象,侦查人员可以采取数据极差转换法、数据比例转换法等混合动态性数据集成算法来降低或消除不同混合动态性数据之间的差异性,将不同混合动态性数据的属性在特定关联聚类区域内进行数据归一化处理,从而帮助其提高混合动态性数据情报侦查应用算法的相比较性和数理关系关联的可行性。第二步,混合动态性数据离散化清洗。根据混合动态性数据被数据归一化处理后数据集成相同或异同的区域属性,侦查人员需要采取数据路径等距聚类的算法对其进行离散化的数据清洗。第三步,混合动态性数据等价归类。采取二元函数运算挖掘使混合动态性数据实现数据的粒化聚类处理,促使侦查人员得到具有等价属性的混合动态性数据归类。第四步,混合动态性数据三支等价粒化划分。根据第三步对混合动态性数据等价归类的结果,侦查人员按照三支决策算法将其划分为三种类型即正等价混合动态性数据、不确定等价混合动态性数据以及负等价混合动态性数据。当混合动态性数据为较少类别时,属于正等价混合动态性数据;当混合动态性数据为多数类别和少数类别混合时,属于不确定等价混合动态性数据;当混合动态性数据都是多数类别时,则属于负等价混合动态性数据。第五步,负等价混合动态性数据欠采样。负等价混合动态性数据主要包括大量多数类别的混合动态性数据,如果将负等价混合动态性数据全部进行删除,那么就会必然降低混合动态性数据情报侦查的高效性。显然,如果负等价混合动态性数据仅包含唯一类别的混合动态性数据时,那么其需要被直接保存即可;反之,如果包含不同类别的混合动态性数据时,则需要计算不同类别混合动态性数据之间数据路径的距离,以最小数据路径距离的类别混合动态性数据为采样标准,将其余的与其进行互相合并和融合而形成新的类别混合动态性数据。第六步,不确定等价混合动态性数据欠采样。由于不确定等价混合动态性数据既包括多数类别的混合动态性数据又包括少数类别的混合动态性数据,造成侦查人员难以对其进行聚类划分。鉴于此,侦查人员可以采取SMOTE 算法对全部不确定等价混合动态性数据重新进行采样,使其形成符合案件情报侦查新的不确定等价混合动态性数据。第七步,三支等价混合动态性数据的合并。在第一步至第六步的基础上,将最新形成的等价混合动态性数据、不确定等价混合动态性数据以及负等价混合动态性数据采取两两互相融合的合并方式,最终形成对案件情报侦查具有关联数理关系的混合动态性数据项目集。

(五)海明密度峰值聚类算法

海明密度峰值聚类算法是以二进制函数运算方式对涉案混合动态性数据情报源的属性重新进行编码,然后对经过编码后的不同混合动态性数据采取海明密度峰值的挖掘与分析方法,并根据不同混合动态性数据的属性而预设其不同的权重加权系数,从而帮助侦查人员挖掘分析出与涉案犯罪情势具有关联性的各种数理关系。就对涉案不同混合动态性数据的个体密度、局部密度的峰值相似度挖掘而言,可以将海明密度峰值聚类算法具体分为以下步骤:第一步,编码混合动态性数据集。若混合动态性数据情报源中包括n 个类别样本,那么其数据集即为X={x1,x2,x3,...,xn}。然后以二进制函数运算方式对全部涉案混合动态性数据情报源进行编码,如果将混合动态性数据的第R个属性AR 的编码长度预设为LR,那么AR 属性混合动态性数据的编码空间即为BR={0,1}LR,且其属性为显然,虽然不同属性混合动态性数据的编码长度各不相同,但相同属性混合动态性数据的编码长度则为互相一致。第二步,测算混合动态性数据的海明距离。依据混合动态性数据的二进制编码方式,可以将其海明距离HR(xi,xj)表示为其中,表示混合动态性数据xi在类别为AR聚类属性中第l 个的编码海明距离。第三步,预设混合动态性数据权重加权系数。在混合动态性数据情报侦查的应用过程中,不同混合动态性数据的权重加权系数会产生不同的情报侦查预测和决策结果。如果混合动态性数据的权重加权系数阈值越大,那么其对情报侦查的价值作用也就越大。所以,侦查人员此时应该根据不同混合动态性数据所包含情报侦查价值的大小而给其预设权重加权系数,促使对其挖掘与分析更加具有精确性。第四步,计算不同混合动态性数据之间的海明距离度量。混合动态性数据情报源主要包括数值型、符号型、类别型、文字型等类型的混合动态性数据,其数据路径的距离离散值主要在(0,1)之间,往往忽略了对无序型混合动态性数据关联数理关系的挖掘和聚类。鉴于此,侦查人员需要采取欧式距离的聚类算法挖掘和计算不同混合动态性数据之间的海明距离度量,尽量消除或降低无序型混合动态性数据情报侦查价值的漏缺率。第五步,混合动态性数据的海明密度峰值聚类挖掘。侦查人员采取DPC 算法利用混合动态性数据的数据密度来构建混合动态性数据情报侦查应用的决策图,这不但能够消除或避免由于不规则、无序等异常混合动态性数据给情报侦查预测和决策所造成的认知偏差,而且还能够降低噪声型、孤立型等混合动态性数据对混合动态性数据情报侦查应用的影响和制约。海明密度峰值聚类算法的优势主要是利用二进制函数对不同混合动态性数据进行重新编码,提升不同类别属性混合动态性数据的转换性和融合性,降低和避免由于侦查人员主观方面原因造成的认知偏差性,通过截断混合动态性数据的参数特征选择和构建其情报侦查决策图,从而提升了混合动态性数据情报侦查应用的客观性和准确性。

(六)模糊优势数据聚类算法

模糊优势数据聚类算法是在基于QRD 算法基础上,通过利用混合动态性数据的模糊优势关联而挖掘其不同数理关系占优度的一种聚类算法。侦查人员利用模糊优势数据聚类算法还可以挖掘与分析不同属性和类别混合动态性数据的聚类簇阈值相关问题。如果涉案的混合动态性数据呈现出复杂性、海量性、动态性等特点,那么就可以采取模糊优势数据聚类算法而实现降低耗时速度和提升关联聚类的实际效果。假设涉案混合动态性数据情报源的数据集为U,其中符号型混合动态性数据的数量为m 个,而数值型混合动态性数据的数量为n 个。首先,将该数据集划分为两个子频繁项目数据集,且分别对应混合动态性数据的符号型子频繁项目数据集和数值型子频繁项目数据集。其次,侦查人员利用涉案不同混合动态性数据之间模糊优势关联的数理关系,先对符号型的混合动态性数据进行关联聚类挖掘与分析,再对数值型混合动态性数据进行关联聚类的挖掘与分析。最后,挖掘与分析后的符号型和数值型混合动态性数据按照其聚类初始中心阈值的大小依次进行排序,将混合动态性数据聚类初始中心阈值最小的模糊优势关联占优度预设为0.5,而其他混合动态性数据的模糊优势关联占优度则通过公式而计算获得。在混合动态性数据情报侦查的应用过程中,模糊优势数据聚类算法的具体步骤为:第一步,将涉案的各种混合动态性数据情报源按照属性与类别的不同划分为符号型的混合动态性数据和数值型的混合动态性数据两部分。第二步,将符号型属性的混合动态性数据相进行关联聚类的挖掘与分析。第三步,依据混合动态性数据的特征选择需求价值不同,利用公式对所有数值型混合动态性数据的模糊优势关联占优度展开计算和归类,第四步,将按照第二步、第三步所获取全部混合动态性数据的聚类初始中心进行重新数据仓库构建和组合,清除所有空白型、异常型、过样型等离群动态性数据,并且重新计算和挖掘不同混合动态性数据之间的模糊优势关联占优度。第五步,检验和修正混合动态性数据。预设涉案所有混合动态性数据的聚类簇数量为K,如果已挖掘获取聚类簇的数目大于或小于K,那么需要侦查人员不断反复地对其进行互相融合和关联聚类,直到混合动态性数据的聚类簇数量等于K 为止。第六步,运算挖掘和输出所有涉案混合动态性数据之间模糊优势关联的占优度,从而为混合动态性数据情报侦查的聚类性和稳定性提供模糊优势关联占优度的数据保障。

综上所述,混合动态性数据情报侦查方法是智慧驱动创新科学技术时代的一种新型现代数据情报侦查方法,包括时间序列预测算法、量子进化算法、数据表示聚类算法、三支决策混合采样算法、海明密度峰值聚类算法、模糊优势数据聚类算法等多种混合动态性数据情报侦查方法,不同的混合动态性数据情报侦查方法都有着不同的算法优势。基于此,引入混合动态性数据情报侦查方法的研究范式。以混合动态性数据情报侦查的内涵与属性为研究逻辑起点,提出混合动态性数据情报侦查的平台设计,探讨混合动态性数据情报侦查的指标加权系数,构建混合动态性数据情报侦查的流程模型,并对混合动态性数据情报侦查的应用算法展开探究,这不仅促使侦查人员提升对混合动态性数据关联聚类加权系数和优先属性的阈值预设,而且还能够提高对不同混合动态性数据之间渐近正态性和相合性的挖掘与分析,从而实现混合动态性数据情报侦查方法的应然价值和实然效果。

猜你喜欢

动态性侦查人员情报
情报
情报
情报
自组织多主体系统动态性的推理研究
离群动态性数据情报侦查方法研究
管理者认知视角的环境动态性与组织战略变革关系研究
侦查人员出庭问题实证研究
侦查人员出庭作证问题研究
国土资源绩效管理指标体系的动态性探讨
侦查人员出庭作证的困境及完善策略