APP下载

数据挖掘技术在军事情报信息获取中的应用

2022-05-29杨祯

中国军转民 2022年4期
关键词:军事情报数据挖掘技术

杨祯

摘要:网络科学技术的进步使世界进入了信息爆炸时代,对于军事情报领域而言,这样的信息爆炸给军事情报信息获取造成了一定的困境。数据挖掘技术作为一种有效的数据收集和分析手段,对军事情报收集能够起到很大的作用。本文简要阐述了数据挖掘技术的概念和步骤,并对其在军事情报领域的应用方式和过程进行了分析研究,说明了数据挖掘技术对于军事情报信息获取的重要价值。

关键词:数据挖掘技术;军事情报;信息获取

现代科技的不断发展和进步也在一定程度上推动了军事领域各项技术的进步,这在一定程度上加剧了战争的破坏性和突发性。而与之相对的,为了阻止突发性战争造成的巨大损失,对战争的预警和监测就变得非常重要,这使得现代军事行业对情报获取工作提出了更高的要求,不仅相比之前需要收集更多更复杂的情报信息,还需要进一步缩短情报获取时间,使己方能够在最短时间内获得信息,做出应对策略。在这种情况下,单纯的人工手段已经无法满足军事情报的获取要求,因此,许多高端技术被陆续应用于情报获取工作中,力求能够在极短的时间内收集到准确有用的情报反馈给决策者。数据挖掘技术作为信息网络中的前沿技术,将之运用情报信息获取中对军事情报领域的帮助是毋庸置疑的。因此,如何更好的将数据挖掘技术融入情报获取中是值得思考和讨论的问题。

1 数据挖掘技术

1.1数据挖掘概念

数据挖掘概念的来源可以追溯到上世纪八十年代,数据发现和数据挖掘被第一次提出,而随着近十年来科技的不断发展和人工智能技术的日益成熟,数据挖掘技术逐渐被人们熟知并越来越受到重视。数据挖掘是数据库知识发现技术的核心环节,主要是指从大量的随机或不完整的杂乱信息和数据中提取出潜在有用或还未被发现明确价值的信息和数据的过程。通过数据挖掘可以发现隐含在数据中概念、规则、规律、模式等有用的知识。宏观来说,数据挖掘就是指从庞大的数据库、数据新闻或其他信息集中地的巨量数据中筛选出有用或潜在有用的信息和知识的过程。数据处理技术的发展过程中,数据挖掘必不可少,这是一种数据的高级处理和利用方式。因此,在军事情报信息获取中合理运用数据挖掘技术,能够大幅度提高军事情报的数量和正确性。

1.2数据挖掘的基本过程

在当今时代下,数据存在的方法和形式都是多种多样的,除了数据库、数据集市这种专门用于储存数据的结构,数据还会以文本、图片、声音、符号等各种随机的形式存在。因此,数据挖掘技术不仅是简单的从数据流中筛选摘取有效片段,还需要利用相关的工具和手段对其他非結构性的数据进行分析,研究其中是否存在有价值的数据信息,进而进行情报收集和传递工作。详细来说,数据挖掘过程的基本过程主要有以下几个步骤:

(1)定义问题

首先要在意识形态层面清楚的定义问题,这是数据挖掘的第一步,也是至关重要的一步,只有明确了数据挖掘的目的,才能更好更高效的进行数据挖掘工作。数据的结构多样且存在着巨大的不确定性,但数据挖掘的目标和要解决的问题应该是有计划的、可以预见的,特别是在军事情报收集中,明确目的是数据挖掘成功的关键。

(2)数据准备

数据准备是数据挖掘正式开始之前最重要的步骤,这个准备过程包括数据集成、数据选择和数据预处理三个部分。数据集成是指将多个数据库或很多零散分布的数据进行集中整合,并在整合过程中筛除掉那些明显无用或模糊的数据;数据选择则是指对数据集合进行进一步的辨别和筛选,以便缩小数据挖掘的范围,提高数据挖掘效率;而预处理主要是对数据进行一定程度的处理,使数据挖掘过程更加容易。

(3)读入数据并建立模型

在确定好数据范围之后,就要使用数据挖掘的工具来读取数据,并且根据读取到的数据建立一个数据模型,数据模型并没有统一的结构标准,而是应该根据数据的特征和工具的不同而有所不同。

(4)挖掘操作

在模型建立成功之后,就要开始数据挖掘工作的核心步骤,搜索有用的数据和信息。信息搜索过程并不需要人工操作,而是可以利用数据挖掘工具由系统自动进行,可以提前在系统中设定搜索条件,以便更精确的找出目标数据。数据挖掘过程需要重复进行,并不断调整挖掘条件以提高精度,避免遗漏关键信息,同时提高数据的质量和信息量。

(5)结果表达和解释

在挖掘了数据之后,还需要对挖掘结果进行分析和解释,将挖掘到的信息进行分类和联系,整理出完整的逻辑链和信息链,这样才能提交给决策者。

1.3常用数据挖掘方法

随着科技的进步,数据挖掘的方法也越来越多,但总体来说根据任务的不同而划分为两种类型:描述和预测。描述是指对数据库中的数据规律进行分析和总结,而预测则是在描述性数据挖掘的基础上对数据进行更深层的研究和推断,对数据的未来发展进行预测,从而提高决策的正确性。

(1)概念描述

概念描述主要是对数据的总体特征和规律进行描述和总结,在进行数据整合之后对不同的数据集合体进行整体分析,总结出概括性的规律,并对这些规律或特征进行简明扼要的描述。使得其他人对该数据集合体有一个整体性的了解。概念描述分为特征性描述和区别性描述,顾名思义,一个是描述数据集合体的特征,另一个则是描述不同数据集合体之间的区别。

(2)关联分析

数据关联对于数据挖掘技术而言非常重要,这是挖掘有用数据的重要途径。因此,关联分析是最主要的数据挖掘方法之一,其目的主要是找出数据之间的隐藏关系,并且分析数据库中的一些数据关联规律,比如数据产生的时间顺序或数据之间的因果关系等,这些关联不仅可以提高数据获取的准确度,还能帮助数据挖掘人员通过已知的信息推断未知的信息。

(3)聚类分析

数据聚类是指根据数据的共同特征对数据进行分类聚合,并发现其中的主要规律和数据模式。聚类分析也是一种常见的数据挖掘方式,其主要是从宏观角度分析数据的分布规律和数据之间的关系。现如今聚类分析已经发展得相对成熟,也形成了多种数据分类模型,比如决策树模型、近邻算法、线性回归模型、神经网络模型等等。

(4)孤立点挖掘

除了上述所说的数据分类和数据整合等,数据库或其他数据流中通常都会存在很多无法被分类或没有明显特征的离散数据,这些数据往往并不能套进任何一种常见的数据模型中,因此这些数据也被叫做孤立点数据。这些孤立点数据虽然无法被分类,但并不代表其没有分析价值,相反,很多孤立点数据中都隐藏着很多有用的信息和知识,比如数据中的反常实例等,因此,在数据挖掘时也有必要对孤立点进行挖掘和分析,在特定的情况下孤立点可能会起到至关重要的作用。

2 数据挖掘技术在军事情报中的应用

数据挖掘作为一种有效的信息收集和分析的技术,在军事情报收集工作中能发挥出巨大的价值,起到良好的作用。因此,数据挖掘技术在军事情报信息收集中能够得到很好的应用。

2.1军事情报中的数据挖掘方法

在当下的军事情报领域中,数据的主要存在形式是文本。因此,军事情报的数据和普遍意义上的数据库中的数据有很大不同,军事情报领域中的数据通常都比较复杂,且没有可以通用的数据模型。这主要是因为一个军事文件中通常既包含可以进行模型分析的结构化数据,比如正常的时间、人名等,又包含大量的无结构数据,比如特殊符号、相反的观点、暗语等等。军事情报领域的数据挖掘技术必须要解决复杂数据的数据模型建立问题和数据整合分析的问题,总之,具体的数据挖掘方法必须贴合军事情报信息的特点。

(1)数据预处理

在军事情报数据挖掘过程中,要对数据进行必要的预处理。预处理的主要过程是先抽取出数据集合中的元数据,并去除数据中的多余格式标记等;然后筛选并去除文本数据中的废词、无用词等,将文本中的数字进行合并,并且对其中的一些殘缺错位或潜台词的词句进行还原;第三步是对本文信息进行分词处理,并在这个过程中标注一些词语的词性,以便更好的识别文本中的短语;然后还要对文本中出现次数较多的词语进行词频统计。最后,应该对数据进行清洗,筛除掉一些垃圾数据以及干扰数据,确保信息能够被流畅的分析解读。通过这一系列的数据预处理,能够筛除初始数据中的大部分无用特征词,简化数据分析的过程,提高数据挖掘的质量和效率。

(2)文本分类

如上文所说,军事情报数据非常复杂,通常无法使用数据模型进行分析,因此,为了方便对其进行有效挖掘,需要在数据体中找一个分类函数对军事文本进行分类。首先,要按照制定好的分类体系确定每个军事文本的类别,使其能够更加方便的被查找和阅读。对于军事情报而言,一个不同于其他数据的重要分类标准就是文本观点的正反性,不同的军事文件对于同一件事可能会有南辕北辙的观点和意见,因此在数据挖掘过程中要密切关注这一特点,并以此为标准对情报数据进行分类。

(3)文本关联

军事情报的信息数据之间往往比其他数据之间存在更多的隐藏关联,所以在军事情报信息数据挖掘过程中要主要找出军事文本之间的关系。在文本关联方面,一种常见的算法是在不同文本中寻找同一对词语,这种算法可以顺藤摸瓜的找出很多隐藏信息,因为本质上,事物之间的关联就是事件的同时出现或发生。文本关联的数据挖掘方式可以将复杂的非结构性军事信息数据转换成简单的结构化数据,比如省略军事文本中的大量复杂信息,只抓取其中的关键词进行数据搜索,先根据时间筛选出大量符合要求的数据,再将筛选出的数据进行拆分并逐一进行分析。根据对军事文本的数据分析,将文本用适用的关键词和实践节点来表示。这样,在提取军事情报时,相关人员结合实际情况判断文本的可信度,并对可能可信的军事情报数据进行关键词提取,大幅度提高军事情报数据收集的效率,同时还可以大量、准确的清除干扰数据,提高情报的准确度。

2.2 军事情报中数据挖掘的过程模型

军事情报数据挖掘过程模型图

军事情报数据相比于其他类型的数据来说具有范围广、保密性高、内容复杂性高等特点。网络科学技术的快速发展一再扩张军事情报的信息收集范围,而除了公开的情报收集渠道,比如网络媒体、社交平台、报纸书本等,还有很多隐秘性渠道,比如间谍、卧底等等,情报信息收集的难度相对较大,需要较为高端的数据挖掘技术。另一方面,军事情报在任何时候都非常注重保密性,不仅要打探敌人的虚实,防止收集到的信息泄露,还要注意不能让己方的情报收集程度泄露,也就是不能让其他人知道己方是否已经掌握了某些信息。基于军事情报收集的这几个特点,建立军事情报领域中独特的数据挖掘过程模型,如图所示:

在这个过程模型中,最重要的阶段是数据的判断推理筛选,这个阶段需要完成数据挖掘的对象、数据挖掘的目标、预测数据挖掘可能达到的效果等,并且要制定好完整的数据挖掘方案。

数据理解环节主要是对数据的特征进行分析总结,并根据这些特征对军事情报数据进行分类。利用适当的算法程序对军事情报数据进行处理,并结合情报数据的具体情况建立合适的数据挖掘模型。在模型建立好之后,还要对模型进行整体评估,确定模型的合理性和准确性,这样才能更好的分析数据挖掘的结果,保证挖掘工作的有效性。在数据挖掘完成之后,还要对挖掘出的军事情报进行集合和梳理,最后输出逻辑链完整、信息准确无误的军事情报。这就是军事情报信息收集领域中数据挖掘的完整过程模型,目前这个模型已经相对完善,但在实际操作中,会因为具体情况的不同出现各种各样的问题,因此在具体的数据挖掘过程中,要根据实际情况及时对挖掘方案进行调整,确保数据挖掘的质量,促进军事决策的正确合理。

3 结语

总之,数据挖掘作为一种高端技术,对海量数据的收集、筛选、分析、判断都具有极大的价值。军事情报和其他信息之间存在显著的差异,信息爆炸和全球化趋势也对军事情报的收集造成了很多负面影响,而将数据挖掘技术用于军事情报信息获取领域中,能够大大提高军事情报的准确率和时效性。未来我国情报人员和相关技术人员应该更加紧密的合作,不断推进数据挖掘技术的进步,促进其在军事情报领域的不断发展,进一步增强我国的软实力。

参考文献

[1]张月婷,韩全惜. 基于数据挖掘的公开网络军事情报分析研究[J]. 情报杂志,2016,35(9):12-15.

[2]赵大海,郭晶. 智能情报获取系统框架研究[J]. 军民两用技术与产品,2020(8):34-38.

[3]乔慧,苏云,安瑾. 面向海量数据的海情数据分析技术研究[J]. 指挥控制与仿真,2018,40(2):48-52.

[4]张波. 基于文本挖掘技术的情报处理方法研究[D]. 四川:电子科技大学,2017.

(作者单位:中国人民解放军69270部队)

猜你喜欢

军事情报数据挖掘技术
数据挖掘在计算机网络病毒防御中的应用
数据挖掘技术及其在医学信息领域的应用
基于Web的数据挖掘技术与相关研究