基于语义相似性关联特征提取的大数据挖掘技术
2018-10-20周亮
周亮
Abstract: In order to improve the ability of big data mining in weapon information management database, a big data mining technique based on semantic similarity association feature extraction is proposed. The distributed structure model of weapon equipment information management data is constructed, the association rule information fusion method is used to deal with the big data block structure matching, and the adaptive regression analysis method is used to extract the association feature of the weapon equipment information management data. The association rule features of the equipment management data are classified and identified, the semantic similarity of big data is calculated, and the big data fusion scheduling is carried out by combining the decision statistical analysis method. The semantic partition method is used to deal with big data fuzzy clustering to realize the big data adaptive mining performance in the weapon equipment information management database. The simulation results show that this method has high accuracy and strong anti-interference ability to redundant data, the adaptive mining and retrieval ability of weapon equipment big data is improved.
引言
在信息化作戰条件下,海军武器装备信息数据库的规模不断增大,在武器装备信息数据库中融合了大量的装备管理信息数据,常见的武器装备信息数据主要有武器性能数据、武器作战状态信息数据、作战人员信息数据以及维修管理信息数据,大量的武器装备信息数据融合在数据库中,构建了海军武器装备大数据库。为了提高信息化作战能力,需要对武器装备信息大数据进行优化挖掘,结合数据库检索和自适应信息融合方法,提高武器装备信息数据的自适应调度和检索性能,研究信息化作战条件下的武器装备信息大数据挖掘算法在提高装备信息管理方面具有重要意义[1]。
当前,对武器装备信息库中的大数据的挖掘方法主要有关联规则挖掘方法、闭频繁项集挖掘方法、模糊C均值挖掘方法和时频特征提取挖掘方法等[2-3],构造武器装备信息库中的大数据特征分布的模糊聚类中心,采用自适应的数据分类和信息融合方法进行大数据挖掘,取得了较好的数据挖掘效果。其中,文献[4]中提出一种基于模糊C均值聚类的武器装备信息库中的大数据挖掘方法,构建大数据的分类调度模型,采用属性关联规则特征提取方法进行大数据关联特征提取,实现装备信息管理数据的优化挖掘,提高数据挖掘的准确性和自适应性,但该方法进行大数据挖掘的计算开销较大,自适应性能不好。文献[5]中提出一种基于模糊分区聚类的武器装备信息库中的大数据关联挖掘改进算法,构建判别统计量进行大数据的自适应融合处理,实现对武器装备信息数据的优化挖掘,但该方法进行大数据挖掘的自适应分类调度性能不好,抗干扰能力不强。
针对上述问题,本文提出一种基于语义相似性关联特征提取的大数据挖掘技术。首先构建武器装备信息管理数据分布式结构模型,采用关联规则信息融合方法进行大数据分块结构匹配处理,结合自适应回归分析方法进行武器装备信息管理数据的关联特征提取,对提取的装备管理数据的关联规则特征量进行属性分类识别。然后计算大数据的语义相似性关联特征量,结合判决统计分析方法进行大数据的融合调度,采用语义划分方法进行大数据模糊聚类处理,实现武器装备信息管理数据库中的大数据自适应挖掘。最后通过仿真实验进行性能测试,展示了本文方法在提高大数据准确挖掘能力方面的优越性能。