基于深度学习的区块链数据分片峰值聚类算法
2021-12-07张皓
张皓
摘 要: 为了提高物联网区块链数据挖掘能力,需要进行数据优化聚类处理,提出基于深度学习的区块链数据分片峰值聚类算法。采用异构有向图分析方法进行物联网区块链数据存储结构设计,结合特征空间重组技术进行物联网区块链数据结构重组,提取物联网区块链数据的关联信息特征量,采用语义相关性融合的方法进行区块链数据特征提取和自适应调度,对提取的物联网区块链数据特征量进行模糊聚类处理,采用模糊C均值聚类方法进行物联网区块链数据的网格分片峰值聚类和属性分类识别,采用深度学习方法进行数据聚类过程中的分片峰值融合和聚类分析,实现区块链数据分片峰值聚类。仿真结果表明,采用该方法进行区块链数据分片峰值聚类的收敛性较好,误分率较低,自适应学习能力较强。
关键词: 深度学习; 区块链; 数据; 挖掘; 聚类
文章编号: 2095-2163(2021)07-0020-05中图分类号:TP391文献标志码: A
Block chain data sliced peak clustering algorithm based on deep learning
ZHANG Hao
(Huali College, Guangdong University of Technology, Guangzhou 511325, China)
【Abstract】In order to improve the ability of blockchain data mining in the Internet of Things, it is necessary to carry out data optimization clustering processing and propose a block chain data slice peak clustering algorithm based on deep learning. Using the heterogeneous directed graph analysis method to design the data storage structure of the Internet of Things block chain, combining the feature space reorganization technology to reorganize the data structure of the Internet of Things block chain, extracting the related information characteristic quantity of the Internet of Things block chain data, using the semantic correlation fusion method to extract the block chain data feature and adaptive scheduling, performing fuzzy clustering processing of the extracted block chain data feature quantity, using the fuzzy C-means clustering method to identify the grid segmented peak clustering and attribute classification of the block chain data of the Internet of Things, and using deep learning methods to perform the segmented peak fusion and clustering analysis in the process of data clustering, the segmented peak clustering of the block chain data is realized . The simulation results show that the convergence of block chain data segmentation peak clustering with this method is good, the error rate is low, and the adaptive learning ability is strong.
【Key words】deep learning; block chain; data; mining; clustering
0 引 言
隨着物联网技术的发展,需要对物联网区块链数据进行优化挖掘和存储设计,通过物联网区块链数据的聚类分析,降低数据的存储空间,提高数据的挖掘精度,相关的物联网区块链数据聚类方法研究受到人们的极大关注。对物联网区块链数据挖掘是建立在对数据的特征提取和信息识别基础上,采用模糊信息识别技术,进行物联网区块链数据的存链结构开发,结合物联网区块链数据的大数据特征分布进行异构重组[1],建立物联网区块链数据的大数据信息分析模型,采用信息融合和资源优化调度的方法进行物联网区块链数据聚类分析。
当前,对物联网区块链数据聚类方法主要有K-Means聚类法、网格区域聚类方法、粒子群聚类方法等[2-3],建立物联网区块链数据的特征提取和大数据分析模型,采用相关的特征分布式检测方法,实现物联网区块链数据聚类。文献[4]提出基于模糊层次结构聚类的物联网区块链数据聚类方法,采用异构有向图分析方法进行物联网区块链数据分块层次结构设计,提高数据聚类的精度,但该方法的计算开销较大,实时性不好。文献[5]提出基于特征空间重组技术的数据聚类方法,在大数据背景下进行物联网区块链数据在线聚类优化设计,结合分片重组技术进行数据聚类优化,但该方法的模糊度较大,聚类精度不高。文献[6]提出指标约束的物联网节点部署的区块链融合技术, 采用谐波谐振扰动特征分析方法,构建物联网节能降损可靠性评估模型,结合分块数据组网控制,采用数据聚类方法,实现物联网输出参数可靠性评估,但该方法的聚类性不好。
针对上述问题,本文提出基于深度学习的区块链数据分片峰值聚类算法。首先进行区块链数据的结构特征分析,然后进行区块链数据的特征提取,结合分片峰值聚类方法,实现数据聚类优化,最后进行仿真测试分析,得出有效性结论。
1 物联网区块链数据结构分析和特征提取
1.1 物联网区块链数据结构分析
采用有向图模型构建物联网区块链数据的聚类节点分布结构模型,采用相关性的统计分析方法,得到物联网区块链数据的异构存储结构模型,计算物联网区块链数据的模糊聚类特征分布集[6],得到融合度函数定义为:
分析物联网区块链数据集统计差异分布特性,得到每个插值点的实际值公式定义为:
其中,dm+1(m)为物联网区块链数据集在第m点的预测值,dk+1(m)为采用第m点处采集的物联网区块链数据的模糊性特征量,根据物联网区块链数据的特征提取结果采用模糊C均值聚类方法进行信息处理[7],设定全局变量,建立物联网区块链数据挖掘的模糊分割系数为:
其中,Mi表示物联网区块链数据挖掘的中位数;Lm为物联网区块链数据挖掘的下界;fm为物联网区块链数据的中位数;fless表示各维度下物联网区块链数据的最小统计特征量。
1.2 物联网区块链数据特征提取
构建资源聚类的节点分布模型,在大数据背景下进行物联网区块链数据分片峰值聚类优化设计,设物联网区块链数据聚类节点图模型属性集为X=x1,x2,…,xn,进行物联网区块链数据聚类节点图模型设计,采用语义本体模型构造的方法,进行物联网区块链数据处理[8],通过自相关特征匹配方法,分析2组相似的物联网区块链数据的相对贴近度φ1定义为:
其中,∑nj=1ωj=1,s-∈S,a-∈-0.5,0.5。设s1,a1,s2,a2,…,sn,an是一组描述物联网区块链数据聚类的语义特征分布集,建立物联网区块链数据聚类的统计分析模型,在模糊网格区域,进行物联网区块链数据聚类的统计分析和自适应调度,在模糊语义相关性融合聚类下,进行物联网区块链数据的模糊加权分析[9],得到模糊加权的特征分布向量为ω=(ω1,ω2,…,ωn)T,ωj∈[0,1],考虑等价的语义映射,进行物联网区块链数据的融合分析,建立物联网区块链数据的统计特征量,通过一个映射函数M表示,M:C * C' →r描述物联网区块链数据的相似度信息,通过空间聚类分析的方法,进行物联网区块链数据分布式调度,建立本体模型,进行物联网区块链数据的语义相似度融合和特征聚类处理[10]。
2 物联网区块链数据聚类
2.1 区块链数据特征提取和自适应调度
采用有向图模型构建物联网区块链数据的聚类节点分布结构模型,在物联网区块链数据库中进行资源信息特征提取[11],设{(s1,a1),(s2,a2),…,(sn,an)}是物联网区块链数据的二元语义特征分量,采用异构有向图分析方法进行物联网区块链数据存储结构设计,结合特征空间重组技术进行物联网区块链数据结构重组,提取物联网区块链数据的关联信息特征量[12],得到物联网区块链数据聚类的优化加权系数为,采用统计分析方法进行物联网区块链数据的聚类中心检测,得到物联网区块链数据的关联性本体结构模型为:
对物联网区块链数据进行模糊处理,构建物联网区块链数据的自适应调度参数SymbolQC@2F(x),建立物联网区块链数据聚类的模糊决策矩阵:
物联网区块链数据聚类的特征提取问题转化为一个二元语义决策问题,物联网区块链数据聚类的模糊特征匹配评价指标集为,采用主体词匹配的方法,分析X的相似度函数,得到物联网区块链数据的模糊隶属度函数为:
其中,x~ik为物联网区块链数据的语义特征量,w~ik-1为惯性权重。利用概念、实例和属性等实体集,得到物联网区块链数据聚类中心节点在k+1时刻的迭代函数为:
采用决策树模型进行物联网区块链数据的特征重构,在物联网区块链数据的递归图模型中,采用相空間重构的方法,实现物联网区块链数据聚类的模糊特征信息采样[13],得到物联网区块链数据的模糊信息加群权重向量vi,物联网区块链数据的相关特征分布矩阵表示为:
其中,c为物联网区块链数据聚类的搜索步数,μik为物联网区块链数据的语义关联度决策系数。根据上述分析,进行物联网区块链数据的特征分析和优化调度,得到物联网区块链数据的模糊聚类中心为di,采用分块特征演化方法,进行物联网区块链数据的关联特征检测,得到模糊检测向量vi,vi=((w1,t1),(w2,t2),…(wj,tj)),结合模糊相关性融合的方法,进行物联网区块链数据的分片峰值聚类分析[14-17]。
2.2 数据分片峰值聚类的深度学习
采用模糊C均值聚类方法进行物联网区块链数据的网格分片峰值聚类和属性分类识别[18],采用深度学习方法进行数据聚类过程中的分片峰值融合和聚类分析,得到物联网区块链数据的在线聚类准则为:
物联网区块链数据聚类节点的深度学习加权系数为We=ωj(e),0。修正每个聚类自适应加权学习系数vi,就可得到聚类有效性评价矩阵R=rij,aijm×n和指标权重W=((ω1,β1),(ω2,β2),…,(ωn,βn)),综上分析,建立物联网区块链数据聚类的深度学习模型,构建物联网区块链数据的模糊特征分布集[19-21],得到物联网区块链数据的约束规划模型为:
由此得到物联网区块链数据聚类的最优评价集记为L1,…,Ln和Pmin1,…,Pminn,物联网区块链数据的优化聚类模型为:
其中,cosinij→x(dij,dxv)为物联网区块链数据的融合聚类特征集,根据上述分析,实现物联网区块链数据的优化聚类[22-23]。
3 仿真实验与结果分析
为了验证本文方法在实现物联网区块链数据分片峰值聚类中的应用性能,进行实验测试分析,采用C++和Matlab 7混合编程进行物联网区块链数据聚类的算法处理,在Hadoop云平台中构建物联网区块链数据数据库结构模型,物联网区块链数据大数据分布的初始样本规模为1 200,量化分布训练集为120,深度学习的步长為2.4,自适应学习的迭代步数NP=30,各组数据采样集的相似度为0.68,根据上述仿真参数设定,进行物联网区块链数据峰值聚类,得到物联网区块链数据的时域分布如图1所示。
以图1所示的数据为研究对象,采用语义相关性融合的方法进行区块链数据特征提取和自适应调度,对提取的物联网区块链数据特征量进行模糊聚类处理,实现分片峰值聚类,得到聚类结果如图2所示。
分析图2得知,采用本文方法进行物联网区块链数据聚类的峰值融合度较好,收敛性较强,测试误分率,得到结果见表1,分析表1得知,本文方法进行物联网区块链数据聚类的误分率较低。
分析图3结果得知,采用本文方法进行物联网区块链数据聚类的误分率较低,提高了数据聚类的收敛控制能力。
4 结束语
采用模糊信息识别技术,进行物联网区块链数据的存链结构开发,结合物联网区块链数据的大数据特征分布进行异构重组,建立物联网区块链数据的大数据信息分析模型,本文提出基于深度学习的区块链数据分片峰值聚类算法采用决策树模型进行物联网区块链数据的特征重构,在物联网区块链数据的递归图模型中,采用相空间重构的方法,实现物联网区块链数据聚类的模糊特征信息采样,采用深度学习方法进行数据聚类过程中的分片峰值融合和聚类分析,实现区块链数据分片峰值聚类。分析得知,采用本文方法进行区块链数据分片峰值聚类的收敛性较好,误分率较低,数据聚类的精度较高。
参考文献
[1]李宇帆,张会福,刘上力,等. 教育数据挖掘研究进展[J]. 计算机工程与应用, 2019, 55(14): 15-23.
[2]杨欢欢, 李天瑞, 陈馨菂. 基于螺旋图的时间序列数据可视化[J]. 计算机应用, 2017, 37(9): 2443-2448.
[3]李劲,岳昆,蔡娇,等. 基于距离度量的多样性图排序方法[J]. 软件学报,2018,29(3):599-613.
[4]YU Yong, WANG Ziyuan, XU Dianguo. Speed and current sensors fault detection and isolation based on adaptive observers for induction motor drivers[J]. Journal of Power Electronics, 2014, 5(14):967-979.
[5]BERRIRI H, NAOUAR W, BAHRI I, et al. Field programmable gate array-based fault-tolerant hysteresis current control for AC machine drives[J]. IET Electric Power Applications, 2012, 6(3):181-189.
[6]李雷,王磊,赵丽,等. 基于大数据技术的配电网络节能降损技术分析[J]. 电子技术与软件工程,2020(19):224-225.
[7]庞俊, 于戈, 许嘉, 等. 基于MapReduce框架的海量数据相似性连接研究进展[J]. 计算机科学, 2015, 42(1):1-5.
[8]肖文, 胡娟. 基于数据集稀疏度的频繁项集挖掘算法性能分析[J]. 计算机应用, 2018, 38(4): 995-1000.
[9]李彦,刘军. 面向大数据的多维数据缺失特征填补仿真研究[J]. 计算机仿真,2018,35(10):432-435.
[10]王慧健, 刘峥, 李云, 等. 基于神经网络语言模型的时间序列趋势预测方法[J]. 计算机工程, 2019, 45(7): 13-19,25.
[11]王晓雷,陈云杰,王琛,等. 基于Q-learning的虚拟网络功能调度方法[J]. 计算机工程, 2019, 45(2): 64-69.
[12]姚富光,钟先信,周靖超. 粒计算:一种大数据融合智能建模新方法[J]. 南京理工大学学报,2018,42(4):503-510.
[13]王楚捷,王好贤. M-CORD下无线接入网络资源分配研究[J]. 计算机工程与应用, 2018, 54(22): 92-98.
[14]刘良凤,刘三阳. 基于权重差异度的动态模糊聚类算法[J]. 吉林大学学报(理学版),2019,57(3):574-582.
[15]孙力娟, 陈小东,韩 崇,等. 一种新的数据流模糊聚类方法[J]. 电子与信息学报, 2015, 37(7): 1620-1625.
[16]于爽,李淑梅. 图书电子资源信息分布式多模块检索仿真[J]. 计算机仿真,2020,37(6):439-442.
[17]LIU Jinliang, XIAO Liang, LIU Guolong, et al. Active authentication with reinforcement learning based on ambient radio signals[J]. Multimedia Tools and Applications,2017,76(3):3979-3998.
[18]刘全, 翟建伟, 章宗长, 等. 深度强化学习综述[J]. 计算机学报, 2018,41(1):1-27.
[19]姚哲,陶剑文. 多源适应多标签分类框架[J]. 计算机工程与应用, 2017, 53(7):88-96, 170.
[20]赵国锋, 黎军, 王新恒, 等. 基于SDN的WLAN负载感知切换方案实现[J]. 计算机应用研究,2019,36(5):180-184
[21]ROWSHANRAD S,NAMVARASL S,ABDI V,et al. A survey on SDN, the future of networking[J]. Journal of Advanced Computer Science and Technology,2014,3(2):232-248.
[22]田保军, 刘爽, 房建东. 融合主题信息和卷积神经网络的混合推荐算法[J]. 计算机应用, 2020, 40(7): 1901-1907.
[23]SHU Jiangbo, SHEN Xiaoxuan, LIU Hai,et al. A content-based recommendation algorithm for learning resources[J]. Multimedia Systems,2018, 24(2):163-173.
基金项目: 2020年度广东省普通高校特色人才创新项目(自然科学类) 项目(2019KTSCX223)。
作者简介: 张 皓(1994-),男,博士研究生,主要研究方向:区块链、计算机视觉。
通讯作者: 张 皓Email:540218310@qq.com
收稿日期: 2021-03-15`