互联网开源军事情报数据采集策略与可靠性研究
2020-08-02安辉顾丽娜刘剑
安辉 顾丽娜 刘剑
摘要:阐述基于互联网采集获取军事开源情报的目的任务、采集内容和采集原则,根据不同的军事应用需求,分析开源情报的采集策略,分别从信息源和信息内容角度,对开源情报数据资源的可靠性评估进行研究,为建设基于互联网大数据的开源军事情报系统、运用情报数据支撑作战指挥决策提供研究思路与方法。
关键词:军事情报;采集策略;数据可靠性
开源情报是美国情报界重要的情报收集类别之一,与人力情报、信号情报、图像情报、技术情报、测量与特征情报共同构成了一个完备的情报收集体系。据国际情报专家的估计,目前西方发达国家的国家情报40%到95%都是以开源情报的形式获取的。在信息化时代,海量的信息和资料被数据化,共享于网络空间,成为军事情报富矿資源。在信息技术的支持下,从互联网获取开源军事情报数据,可以对全球范围内的信息资源施行24小时的持续搜集, 并通过对这些数据进行分析和处理得到情报信息产品,可以快速填充情报地图,找出情报空白,在一定程度上能对秘密情报进行相互印证和补充。
一、互联网开源军事情报采集任务和内容
(一)互联网开源军事情报采集的目的
军事情报的研究成果是指挥作战的重要保证,在军事斗争中,所有情报活动的目的都只有一个——知彼。充分占有情报,不仅会为掌握战场主动权创造必要条件,也会为充分发挥指挥谋略在军事竞争中作用奠定基础。根据军事的特定任务和情报需要,从互联网获取开源情报信息,在广泛收集和积累有关资料的基础上,运用科学方法和技术手段,对情报材料进行鉴别、整编,通过分析、对比、判断、综合等逻辑思维和聚类、分类、语义分析、神经网络关联等技术过程,揭示研究对象的本质规律和相互联系,从本质上讲,就是要最大限度地揭示情报价值,满足军事斗争对需要。
(二)互联网开源军事情报采集的任务
军事情报数据支撑是指挥员下定决心的基础,并不局限于受领任务之后和下定决心之前,而是贯穿于指挥决策的全过程。信息化条件下战争作战空间覆盖范围广,涉及领域多,战场环境更加复杂,军事情报采集任务更加艰巨。从互联网开展采集整编作战对象或潜在作战对象的作战力量、装备建设、作战能力、军事演习、预设战场自然环境、气候周期变化等相关情况报道,基于主题情报需求进行数据分析、追踪监测、整编处理、分析评估、趋势预警,获取敌方技术与装备的重要战技指标,有利于针对性地进行作战训练,提高部队作战能力,为指挥决策提供情报数据支撑。
(三)互联网开源军事情报采集的内容
作为军事指挥综合信息服务敌情、我情、战场环境数据的有益补充,从互联网收集军事情报数据为指挥员综合研判、指挥决策提供了大数据支撑,视角上应着眼战略、战役、战术三个层次。战略层视角,收集有关国家的军事战略和军事力量,包括当前世界政治形势与主要大国的政治动向、综合国力、部队建设力量甚至作战区域社会经济等信息;战役层视角,收集敌方部队敌军企图、实际作战指挥与协调能力、作战力量编成、作战方法应用、作战保障能力等信息;战术层视角要收集敌方战术指挥官情况、战斗序列、兵力部署、武器装备参数等信息。
二、互联网开源军事情报采集原则
(一)基于情报收集任务主题的针对性原则
互联网是一个公开的信息发布、传播和交流的平台,军事情报广泛分布于整个网络空间,军事信息的发布者既有政府部门、军队部门,也有各科研机构、高校院所,甚至是公司企业和个人言论。正由于军事情报来源的广泛性、多样性特征,信息冗余污染严重,信息质量参差不齐,情报拾取难度较大。因此,要制订互联网军事情报采集方案,设定情报采集目的,可预设多个情报采集主题,与军事情报需求的内容、功能、流程相适应,形成结构合理、层次清晰的军事情报采集目录清单,提高军事情报采集获取效能。
(二)基于情报应用的综合性原则
存储于互联网络的军事信息涵盖了不同历史时期、国家和地区的静态军事信息和动态军事信息,涉及与军事情报有关的政治、经济、军事、科技、社会、人文、地理及自然气候等各个专业领域,在时间和空间上跨度大。因此要基于实际军事问题的应用需求,设计具有可操作性的情报采集手段。一是收集情报的内容要体现一定的军事效益;二是按照一定规则形成体系,既要全面反映,又要重点突出;三是以宏观分析方法为依据,通过演绎和归纳,反映军事情报的内在联系;四是把握整体性、系统性和灵活性,需针对不同的军事目的采取相应的方法。
(三)基于情报溯源的动态性原则
网络的本质是信息公开和共享,信息传播速度快,更新快,信息零散保存不完整,而现代战争的快速反应、快速决策、快速实施对军事情报提出了更高的时效性要求。一方面要突出对重点国家、重点人物、重点地域的情报进行重点时段的重点采集;另一方面需要将不同时间、不同国家的数据和以往战争的军事情报数据结合,进行合乎逻辑地分析,互相补充、互相印证,使得“情报拼图”更加清晰、完整,挖掘出深层次的联系,从而辨别真伪,提高情报的准确性和可靠性。
三、互联网开源军事情报采集策略
(一)目标网站定向抓取策略
根据既定军事情报任务需求,确定情报研究的主题,制订军事情报采集整编方案,选取典型情报来源网站,框定情报数据获取范围,基于主题设置采集匹配的关键要素、要素间的关联关系和关联程度,运用网络爬虫在目标网站中采集获取情报数据。主要是针对网站的新闻热点、重要人物报道、重大事件动态、武器装备研发试射等描述性信息、静态及动态网页数据实时采集和定时段抓取,形成情报任务关联综合数据信息库,采用大数据技术手段进行整编,形成主题情报资源目录,为指挥决策提供情报资料信息服务。
(二)关键目标溯源追踪抓取策略
根据关键目标情报任务,制订军事情报采集整编方案,基于目标主题设置采集匹配的关键要素、要素间的关联关系和关联程度,运用搜索引擎在互联网网站群中采集获取情报数据。一是进行关键词关联搜索和语义目标搜索,借助时间序列分析、相关性分析等定性和定量相结合的情报分析方法,对多源采集的半结构化和非结构化等异构情报数据,按目标主题需求进行过滤、去重、筛选;二是运用语义分析方法,对数据中的人物、地点、时间、事件、武器装备、环境等关键要素信息进行智能提取,形成被描述对象的标签属性体系;三是采用聚合分类技术,将零乱的、彼此孤立的、无序的情报数据资料加工成相互关联的情报信息,使数据资料变得系统化、有序化,整编为精准全面的情报数据产品。
四、互联网开源军事情报信息可靠性评估
可靠性包含专业性和真实性两层含义,在进行可靠性评估时, 应分别对应于互联网开源情报的信息源和信息内容,开展相互独立而又相互关联的综合评估。
(一)信息源可靠性评估
从互联网收集獲取情报信息,信息源就是特定的网站,要从网站的组织特征、页面特征和价值特征三个方面进行评估。(1)组织特征,信源网站有无网站备案,是否由一个合法组织来管理运营,该网站有无管理监督机构,该组织的专业性如何,网站信息提供者资质是否符合军事情报信息采集要求。(2)网页特征,网页内容主体是否会围绕某领域、某主题展开报道和论述,内容上是否以方便阅读作为报道目标,页面的商业性内容与主体内容是否明确区分开,网页链接是否为死链,其链接是否指向可靠性较低的信息源。(3)价值特征,网站相关报道能否持续更新,是否满足军事需求,与情报主题内容相关的数据量能否满足技术手段运用。
(二)信息内容可靠性评估
从互联网采集获取的公开信息要成为情报信息,必须避免单一信息来源带来的片面性,采集多渠道来源的大量情报数据,通过运用相应技术手段有意识地发现、辨别、筛选和确认,需从信息内容合理性、逻辑可靠性、对比可靠性等方面进行评估。(1)信息内容合理性,所表述的事件内容是否在当时的政治、经济、社会、军事背景下合乎形势,人物姓名是否含糊不清,所言有无断章取义,行文是否直截清晰准确。(2)逻辑可靠性,信息本身是否存在逻辑冲突和逻辑错误。
(3)对比可靠性,既要对信息源内部的连续报道与已经证实的事件和得到的结论之间进行对比,也要进行信息源之间的相互印证,与其他来源的信息进行对比分析,能否与其他来源的信息相互佐证,是否与其他来源的信息冲突。
五、结语
任何开源信息都是具体活动的征兆,或是不为人知的活动所引发的联动效应。要树立大情报观念,重视开源情报在军事领域的基础性价值,在信息化、网络化、数字化的社会背景下,从互联网采集获取开源军事情报,建立多源情报大数据体系,将各渠道、各领域的情报信息进行整编、关联、印证分析、分类展现,在运用情报数据支撑指挥决策方面发挥重要作用。
【参考文献】
[1]沈固朝,赵小康.国外公开源情报研究及其对我们的启迪[J].图书情报工作,2011.
[2]赵科.网络环境下公开军事情报的收集途径研究[J].图书馆工作与研究,2008(6):54-57.
[3]李月丽.论军事情报作战[J].情报杂志,2017(7):
99-100.