基于递归熵特征提取的层次化物联网数据检测
2020-09-15王旭辉
米 捷, 王旭辉
(1.河南工程学院 计算机学院,河南 郑州 451191; 2.河南工程学院 工程训练中心,河南 郑州 451191)
随着智慧物联网建设的发展,物联网应用越来越广泛,通过构建层次化物联网进行数据分布式探测设计,可实现组网优化,提高物联网量化分析能力。在进行层次化物联网设计时,需要进行数据优化检测,构建层次化物联网数据优化检测模型[1],结合模糊相关性分析方法进行物联网优化检测和信息挖掘,以提高大数据的挖掘分析能力。
过去的物联网数据检测模型,在数据检测过程中受网络环境中重复数据和干扰杂质数据的影响,导致数据检测的准确率不高、抗干扰性不好[2]。本研究提出了基于递归熵特征提取的层次化物联网数据检测方法,首先进行数据存储结构的特征分析,然后进行数据的特征分析和融合聚类处理,结合数据递归熵特征的提取结果进行数据的优化检测,最后进行仿真测试,得出了有效性结论。
1 数据的存储结构及融合聚类处理
1.1 数据的存储结构
为了实现对层次化物联网数据信息处理系统数据库的访问和调度,需要构建层次化物联网数据的存储结构模型,根据层次化物联网数据库的存储特征进行信息聚类,采用分块特征匹配方法[3]建立数据的存储空间配对模型,结合坐标指针索引方法进行数据的优化检测,得到数据的存储结构如图1所示。
图1 层次化物联网数据存储结构Fig.1 Hierarchical network data storage structure
根据图1所示的层次化物联网数据存储结构进行数据的模糊信息聚类,建立数据码元分布序列,采用层次化融合方法进行物联网数据检测过程中的自适应加权学习[4],学习式为
(1)
式中:z0为数据的关联估计值;zi为i点数据的实测值;di为数据检测点i和零点的距离;S为实测点统计特征量;K为分块特征匹配权重。
根据自适应加权学习方法,进行层次化物联网数据的空间特征加权。提取层次化物联网数据的关联规则[5],把数据通过多维空间重组方法聚焦到特征空间中,得到分布时间序列A={a1,a2,…,an},B={b1,b2,…,bm}。层次化物联网数据的空间聚类模型定义为
(2)
计算模糊聚类特征系数,定义为
(3)
通过模糊度寻优方法进行物联网数据的统计分析,分析差异度特征量,进行数据模糊度匹配,得到关联规则集为
(4)
式中:dm+1(m)为数据集在第m点的预测值;dk+1(m)为第m点的模糊性特征量。根据上述分析,实现了数据存储结构的优化重组。
1.2 层次化物联网数据的融合聚类模型
通过挖掘数据集统计的属性特征,实现数据集统计检测。采用统计分析方法[6],建立层次化物联网数据的关联规则分布矩阵:
(5)
根据式(5)构建层次化物联网数据的特征提取模型,根据特征提取结果进行数据挖掘。
采用模糊C均值聚类方法进行层次化物联网数据的融合聚类。假设有限数据集X={x1,x2,…,xn}⊂Rs中含有n个样本,样本数据为xi。数据聚类算法是把对数据的分割转化为对空间的分割,它不需要直接对数据进行处理,而是采用Lagrange定理求得聚类标函数的极值来确定数据聚类中心。采用模糊信息聚类算法进行数据聚类处理[7],得到传感节点i处采集到的数码元序列(w1 j,w2 j,wtj),其中t为层次化物联网数据的编号数目,wtj为层次化物联网数据挖掘的加权系数。结合语义特征分析方法,建立层次化物联网数据挖掘的模糊语义特征规则分析模型[8],得到层次化物联网数据的自适应加权系数
(6)
式中:maxlFreqi, j为数据的模糊度辨识特征量。
采用模糊聚类方法,计算层次化物联网数据挖掘的蚁群搜索最短路径:
(7)
式中:di和dj为相似度属性。
采用统计信息分析方法[9]建立层次化物联网数据挖掘的模糊特征分布集:
(8)
根据上述分析,构建层次化物联网数据的融合聚类模型,根据聚类结果进行物联网数据检测[10]。
2 物联网数据检测优化
2.1 递归熵特征量提取
在采用网格分块区域融合方法进行层次化物联网数据存储结构分析的基础上,进行数据检测优化,提出基于递归熵特征提取的层次化物联网数据检测方法。根据特征提取结果,采用模糊C均值聚类方法进行信息处理:
(9)
式中:Mid表示数据检测的递归熵分布中位数;Lm为最小阈值;fm为数据的中位数;fless表示各维度下数据的最小统计特征量。构建定量递归分析模型,得到递归熵特征提取结果为
(10)
在决策树模型下,采用自适应寻优方法进行层次化物联网数据递归熵的特征提取,根据提取结果进行物联网数据检测[11]。
2.2 数据检测的抗干扰设计及检测输出
提取数据的递归熵特征量,采用层次化演化聚类方法进行数据的自适应分块匹配,结合匹配滤波检测器进行干扰抑制[12],实现流程描述如下:
(1)考察层次化物联网数据信息流矢量x和xn+τ,选择一个C值,确定数据的匹配滤波系数,若数据集为m,令Aj(L)作为滤波阶数,其中j=1,2,…,k,使用关联性融合聚类分析方法进行数据分布式检测。
(2)根据递归熵的规则性分布关系,得到时刻t和t+τ之前的相互关联性和数据的融合聚类中心F(xi,Aj(L)),其中i=1,2,…,m,j=1,2,…,k。
(3)使用模糊相关性匹配方法,得到递归熵特征分布式检测输出满足
D(xi,Aj(L))=min{D(xi,Aj(L))},
(11)
那么xi∈ωk。
(4)采用互信息特征分析方法,得到数据属性检测的类别特征量S(t),在数据聚类中心进行多层迭代,得到迭代输出的平均值:
(12)
(5)当满足收敛条件‖C(l)-C(l-1)‖<ξ时,则中止程序,否则返回步骤(2)。令层次化物联网数据检测的迭代步长l=l+1,则数据检测的优化输出为
(13)
通过上述分析,结合递归熵的规则性分布关系实现了层次化物联网数据检测优化。
3 仿真测试分析
为了验证本方法在层次化物联网数据检测时的性能,进行仿真测试。采用MATLAB进行层次化物联网数据检测的算法处理,物联网的分布节点数为200,数据特征重构的嵌入维数为12,采样时延为1.4 ms,数据存储的根节点数为36,层次化物联网数据的属性类别数为8,数据的初始频率f1=1.5 Hz,终止采样频率f2=2.3 Hz。实验分别选取1维、10维和100维数据,根据上述参数设定,进行层次化物联网数据采样和检测优化,分析数据的聚类性能和特征检测能力,得到层次化物联网数据如图2所示。
图2 层次化物联网数据Fig.2 Hierarchical Internet of Things data
以图2的数据为研究对象,采用网格分块区域融合方法进行层次化物联网数据的优化存储设计,提取数据的递归熵特征量,在不同的迭代步数下得到特征提取结果如图3所示。
图3 数据递归熵特征提取Fig.3 Data recursive entropy feature extraction
分析图3可知,本方法能有效实现对层次化物联网数据的特征聚类分析,特征检测的聚类性较好,说明数据检测的抗干扰性较好。分析数据检测过程中的聚类性能,得到对比结果如图4所示。
图4 数据聚类性能对比Fig.4 Comparison of the data clustering performance
表1 层次化物联网数据检测准确率对比Tab.1 Comparison of the exact probability of the detection of the hierarchical Internet of Thing data
分析图4发现,采用本方法进行层次化物联网数据检测的聚类性能较好,抗干扰能力较强。采用不同方法进行数据检测准确率测试,得到的对比结果见表1。分析表1数据得知,采用本方法进行层次化物联网数据检测的准确率较高。
4 结语
构建层次化物联网数据的优化检测模型,结合模糊相关性分析方法进行层次化物联网的优化检测和信息挖掘,以提高数据的检测能力。提出基于递归熵特征提取的层次化物联网数据检测方法,根据自适应加权学习方法,进行层次化物联网数据的空间特征加权,结合语义特征分析方法,建立层次化物联网数据挖掘的模糊语义特征规则分析模型,采用网格分块区域融合方法进行层次化物联网数据的存储结构分析,结合匹配滤波检测方法进行数据检测过程中的干扰抑制。仿真分析得知,采用本方法进行数据检测的准确率较高、抗干扰性较好。