面向算法认知战的开源情报智能化分析
2024-03-19李灵芝
李灵芝 李 浩 冯 讯
乌克兰危机是人类进入数字化、信息化、智能化时代的一次重大军事冲突,呈现了战争形态和规则颠覆性的变革,使战争的主体和范畴不断扩展、战争的社会化特点更加突出。战争不仅仅是现实世界的火力攻击,更是人类认知的激烈博弈。借助于算力、算法,数据算法认知战在乌克兰危机中大显身手,使人们第一次深刻体会到智能化时代认知攻防的巨大威力。算法认知战是算法战和认知战的结合,它基于情报能力的支撑,利用算法的强大力量与数字条件下的智能优势,达到改变人类认知的目的。
利用社交媒体操控和影响民心士气,进而影响决策已经成为算法认知战的通用手段。以美国为例,对内,类似Cambridge Analytica利用大数据影响美国竞选的丑闻屡见不鲜;对外,从颜色革命到乌克兰危机,利用各类媒体操控和影响民众意识更是层出不穷。纵观算法认知战的实践运用,算法固然是核心,情报信息却是算法显效的关键,由此凸显了开源情报工作的重要性。开源情报具有易获取、时效强、内容多、传播快等特点,但同时也存在数据一致性差、数据解释力低下、碎片化等不足,传统的开源情报分析方法已经不能满足算法认知战的要求,需要研究利用机器学习、知识图谱等人工智能新理念与新技术,形成快速、精准、高效的情报产品,以面对未来战争的混合多域和智能化的发展需要。
面向算法认知战的开源情报分析面临的主要挑战
要充分发挥开源情报在算法认知战中的巨大优势,就要对各类开源数据应搜尽搜。根据各类数据进行挖掘分析,形成目标的活动规律库、事件的关联关系库等,以便构建目标知识图谱,对目标进行研判,对事件进行推理预测,制定策略措施。但要发挥开源情报在算法认知战的最大效能还面临着以下三大主要挑战。
情报来源多且同质化严重。开源情报获取渠道众多,随着各类新媒体的出现,使得信息流动更快更方便,大量传播者和平台喜欢跟风炒作热点事件,敌方利用这一特点,制造热点新闻和话题,迅速以音频、视频、文本、评论等方式散播,使大众看到听到的都是重复内容,达到改变大众认知的目的。同质化的开源信息需要情报搜集人员全面、细致地筛选,既影响了情报人员研判的客观性,又可能遗漏重要的情报,还增加了情报预处理的难度。
情报源质量不高。算法认知战是一场看不见硝烟的战争,大部分原始数据都来自于网络上的视频、音频、文本等非结构化数据,为了赢得战争,采用深度伪造技术,充分利用短视频、直播、演讲等直观有冲击力的方式,引发大众强烈的情感,致使在信息洪流中,搜集到的数据带有欺骗性和隐蔽性,挖掘分析的结果会出现严重偏差,大大降低了情报的可用性,甚至会导致错误的决策。
开源情报信息易失效。社交媒体等网络平台的实时信息,往往是目标识别、趋势预测、威胁预警的第一窗口,但网络上各类舆论信息是快餐式、碎片化的,甚至是昙花一现的,而有的极具情报价值的关键点可能就隐藏在某些不易察觉的信息里,如果没有及时发现,就会很快被淹没在信息洪流中,再要寻找无异于大海捞针。而稍纵即逝的时间窗口被耽误后,敌方很可能就达到了瞒天过海的目的,实现信息时代“眼皮子底下”的运筹帷幄、排兵布阵。
威胁情报信息体量、获取难度、重要性的层级图
智能化开源情报分析的体系架构
随着算法认知战在不同冲突场景中的广泛应用,新的威胁在无形中快速出现,开源情报的价值挖掘在算法认知战中将持续提升。人工智能技术的迅速发展为开源情报分析持续赋能,探索将人工智能领域新兴技术应用到开源情报搜集、分析和运用流程中,采用机器学习、关联规则、神经网络等智能化技术或方法,从大量的开源数据中,发现其中的隐含价值,为决策者提供有效情报,对打赢算法认知战具有重要意义。
收集层收集开源情报数据并进行预处理,是情报分析的基础层。由于不同数据源采用的数据格式、度量单位、属性描述等不一定相同,因此需要经过清洗、去重、分类、评估等一系列预处理,才能得到相对完整准确的数据。数据清洗可以去掉无关的广告、垃圾信息等;数据去重可以去掉不同来源的重复信息,减少数据处理的时间和空间;数据分类可以按照任务或规则分成不同的类别并且打上标签;数据评估可以去除虚假情报,并对情报来源的重要程度进行排序。
广东省药品检验所坚持“为药品标准做方法,为药品监督做方法”,不断提升食品药品检测能力和水平,把食品药品质量风险关进防控笼子里,书写“最严谨标准”的“广东样本”。
管理层分布存储并管理各类预处理后的数据。预处理后的数据具有不同的结构,而不同结构数据采用不同的数据库来保存,如表格等结构化数据可采用关系型数据库来保存;视频、图像、文本等非结构化数据,采用HDFS保存。在保存数据时,需要实时监控各个存储节点的存储资源,当某一节点出现过载时,则需要将数据迁移到其他节点,从而达到负债均衡。
各类数据中蕴涵大量的目标特征信息,具有一定的价值,因此在存储数据时采用相应的冗余策略,避免出现某一节点崩溃导致数据丢失的现象。同时,大部分数据具有一定的密级,需求设置访问权限、加密存储、数据隔离等措施来提高数据安全性。
分析层分析层是算法认知战中算法、算力价值的体现。通过对大量的数据进行分析和处理,挖掘出敌方的行为模式、意图、目标等证据库,构建其知识图谱,为目标识别、态势预测、威胁评估提供依据。
应用层应用层是挖掘分析结果在作战中的运用。根据活动规律、事件关联等证据性结果,对事件进行推理研判、趋势预测,结合重点区域、要地目标,研判其企图、评估威胁等级;根据不同用户的需求和理解力,对信息进行精准推送,实现信息的高效利用和认知效能的最大化。
智能化开源情报知识挖掘与运用
算法认知战背景下,智能化开源情报知识的挖掘和运用主要是通过分析获取开源情报中的敌方目标活动规律、网络行为痕迹、关系关联网络等信息构设知识图谱,基于知识图谱开展算法认知战攻防行动。
智能化开源情报知识挖掘数据挖掘的方法包括统计分析、聚类分析、关联规则挖掘、序列模式挖掘等。统计分析法可以揭示目标的活动规律,从而发现敌方目标活动特点、行为习惯等;聚类分析法可以将数据按照不同的特征进行聚类,从而发现敌方的不同活动区域、不同组织结构或不同的目的;关联规则法可以挖掘出数据之间的关联关系和规则,从而发现敌方行动背后的关联事件和规律;序列模式法可以挖掘出数据之间的时序关系,从而预测敌方下一步可能的行动。
智能化开源情报分析的体系架构
揭示目标活动规律。虽然算法认知战以高频、分层、精准、多样的形式对普通大众形成思维认知压迫,但其背后仍然存在一定的规律。目标活动规律主要包括目标活动频次、活动地域、活动时间、活动路线、兴趣偏好等来表征。主要采用聚类分析、分类分析方法揭示各类目标在特定路线、特定地域、特定时间反复出现的活动状态,挖掘出不同类型目标规律性的特性,进而综合分析和归纳总结出目标的活动规律。例如,通过关键人物的外交、演讲、行为等开源数据,挖掘其性格特点、活动习惯等规律,按照一定的格式组装后,建立起目标活动规律的数据库。
挖掘目标事件关联关系。向大众精准推送专门设计的内容是算法认知战的关键环节之一,而推送的内容不仅仅是一次简单的事件,往往与社会活动、军事行动等有一定的关联度。事件关联关系是发现不同事件之间的联系,这种联系可以从多个维度挖掘,包括事件发生的时间、地点、参与者、利益相关者、因果关系等。关联规则分析是目标事件关联关系挖掘的重要研究方法之一。在大数据环境下,关联规则分析的作用得到了极大的发挥,它可在海量数据中寻找隐藏的数据项之间的关联或相互关系。采用关联规则分析可寻找得出某一事件或目标与其他相关事务之间的关联关系,通过对挖掘所得的关联规则的理解,达到预测推理的目的。
构建知识图谱。大量传播伪造信息是实施有效的算法认知战的重要手段之一。要准确理解敌方行动意图,就要掌握敌方复杂的内在连接关系、战场事件序列、动态变化等情况。知识图谱可以根据目标相关的专业知识,建立目标体系关系,从而形成以知识为中心的态势。知识图谱构建主要包括知识抽取、知识融合、知识存储三个步骤。
知识建模是按照知识图谱约定的一些模式进行业务抽象以及业务建模,主要是指对目标活动数据中的文本内容进行实体、实体属性、实体属性值类型、实体关系等的定义。
知识图谱构建和运用过程
知识抽取是从管理层的结构化、半结构化和非结构化数据中提取实体、属性、关系和事件数据,构建他们之间的关系,形成一系列的知识表达。例如,在算法认知战情报感知体系知识图谱中,目标实体包括人物、装备等;属性包括人物外形特征、活动特点、兴趣爱好,装备的型号、性能参数、作战能力等;关系包括人际关系、装备部署、指挥关系等;事件包括重点人物参与重要事件的时间、地点,装备参与主要战争使用情况等。
知识融合是将不同来源的知识在规范下进行关联、消歧处理,减少冗余和错误,达到知识、方法、思想的综合,形成统一的目标知识库。实体关联是判断两个或多个实体是否属于同一目标的实体,并将属于同一目标的实体进行融合;实体消歧是根据上下文关系消除模糊、消除同一实体的一词多义。
知识存储将融合后的知识实体以“图”这种数据结构存储起来,形成知识图谱。
将目标活动规律库和关联规则库与知识图谱结合起来,可以通过可视化的方式展现事件的发展趋势,对目标进行识别和威胁评估。知识运用的结果又可以更新知识图谱,使图谱不断完整壮大,为算法认知战提供有力的情报支撑。
知识结果在算法认知战中的运用算法认知战是一个复杂的系统工程,基于算法、数据、情报、媒体等的支撑,才能稳中有序地层层推进,实现作战目的。
趋势预测。通过目标活动规律库、目标关联关系库、知识图谱等证据,形成包括目标、目标体系、事件之间的活动特点和关系数据,进而生成重要事件热度趋势、扩散途径、发展演化,大众在事件中的情感倾向、观点态度等多维度全方位的分析结果,采用神经网络建模、时间序列等方法实现事件发展趋势预测和目标行为意图预测,发出早期预警。
目标识别。通过分析敌方算法的语义、行为模式、逻辑结构等信息,识别出敌方的目标、意图和动机。目标识别的方法包括文本分析、图像识别、语音识别等,通过自然语言处理技术,可以分析出文本中的关键词、主题、情感等,从而判断出敌方的意图和目标;图像识别技术可以识别出图片中的物体、场景、人脸等,从而判断出敌方的行动计划和目标;语音识别技术可以识别出语音中的关键词和语调,从而判断出敌方的情绪和态度。
威胁评估。这是评估敌方攻击能力和可能造成危害的重要手段。通过对敌方算法的分析,评估出敌方的技术水平、不同内容攻击范围和层次、可能造成的伤害等。威胁评估的方法包括定量评估和定性评估。定量评估可以通过数学建模,分析敌方算法的攻击能力和危害程度;定性评估可以通过专家意见、案例分析等方式,评估敌方算法的威胁程度。
智能化开源情报分析需要把握的问题
算法认知战具有压制敌人思维认知的智能优势。近几场具有智能化特点的军事冲突表明,开源情报尤其是社交媒体情报在算法认知战中的重要性日益增加。未来人工智能技术与开源情报挖掘分析将深度融合,人工智能等新兴技术是一把双刃剑,在提升开源情报分析能力的同时也可能面临情报虚假欺骗的问题,因此需要把握三个方面。
技术为主,人工为辅。利用人工智能技术可以及时筛选、抓取、搜集并分析处理开源情报信息,自动生成规范化的情报产品,及时为事件的发展预测提供预警。人工智能的计算速度和耐力已经远远突破了人脑的极限,但人工智能技术不能完全模拟人的行为、也无法感知人的情感,面对算法认知战的精准释能,难以从多维度分析,因此在关键环节仍然需要人的干预。由于开源情报信息数据来源和内容的复杂性,利用人工智能技术提升人脑认知能力才是算法认知战中开源情报分析工作发展的方向。
知识结果在算法认知战中可用于威胁评估
分级管理,数据共享。开源情报种类繁多,各级各类情报分析部门搜集方法与手段不一样,得到的情报维度和深度就不一样,针对有计划、有迭代、无孔不入、大范围制造的话题热点,应建立“战争目标中心、全源数据分析、按规分类共享”的分布式大情报分析体系,打破情报部门之间的壁垒,建立不同层级的数据管理机制,在安全的条件下,协调不同情报机构搜集分析尽可能全面的数据,并实现相互共享。
加强监测,防范安全。基于算法认知战的开源情报分析需要实时关注舆论环境的变化,不断扫描监测有无异常信息,对热点话题进行持续跟踪,但当数据积累到一定程度的时候,情报分析人员的操作习惯会被敌方发现并利用,从而可能出现身份冒用、恶意入侵等安全问题。因此,要增强数据入口、传输和分析过程中的安全监控、威胁预警等能力,使用基于人工智能技术研究数据加密、存储的方法,确保数据安全。
结 语
算法认知战在乌克兰危机中显示出巨大威力,开源情报、智能技术在其中起到了决定性作用。面对如今无处不在的开源数据,应加强人工智能相关领域以及相关技术的开发,将复杂的数据、先进的技术优势、分析人员的主观能动性结合起来,充分挖掘开源情报数据的内在价值,破解算法认知战中情报分析的困境,进一步满足作战的情报需求。