数字情报的智能化处理和分析
2020-12-01韩全惜曹蓉蓉陈雪强
韩全惜,曹蓉蓉,陈雪强
(国防大学政治学院,上海 200433)
情报作为信息处理占比很高的数据处理与分析工作,大多由情报信息系统负责。随着移动网络、社交网络、云存储、物联网等信息技术的普及,网络信息汹涌泛滥,传感器材广泛应用,情报人工处理和分析无以为继。信息化为提升情报处理和分析的质量和效率提供了技术条件。当前,人工智能技术风起云涌,作为信息化的高级阶段,情报智能化处理和分析迈开发展的脚步。
本文采用传统的情报处理与分析流程模型,即情报处理和分析,包括搜集、处理、分析、生成和分发等环节。本文以各个环节作为研究对象,以智能化为途径,以提升情报分析质量和效率为目标,讨论各个环节的现状和需求,阐述情报处理和分析的智能化应用。
当前,在人工智能技术支持下,已经有很多智能产品和应用场景,就情报处理和分析智能化而言,是充分应用人工智能技术的发展成果,将相对成熟的技术和产品运用到情报处理和分析工作中来;是按照人类实践积累的经验和做法,模拟数据处理的逻辑思维和推断规则,借鉴并运用已有的、成熟的信息技术、信息设备和人工智能产品,部分替代情报人员进行情报处理和分析。上述的人工智能的应用模式被归类为弱人工智能应用,属于相对低级的应用阶段。
1 数字情报的智能搜集
1.1 数字情报人工搜集力不从心
网络舆情的突发性要求随时察言观色,传感数据的连续性必须时刻捕捉异常,人力情报的客观性值得冒险获取事实,竞争情报的斗争性追求快速、准确和全面,情报人员人工处置应接不暇,疲于奔命,替代方案呼之欲出,信息技术、智能技术生逢其时,当仁不让地成为可靠的中坚力量。
1.2 情报信息系统构成数字情报搜集体系
在信息网络时代,由情报信息系统连接各类信息采集终端,代替情报人员承接信息采集任务。网络爬虫下载刚刚传播的网页资料,照相卫星拍摄地面情景,传感设备测量信号信息,无人机巡视特定目标,情报信息系统接受各类异构情报数据,形成情报资料大数据,情报人员足不出户、免动手、实时获取来自全世界各地的数据信息。
1.3 情报信息系统趋向智能搜集数字情报产品
情报搜集环节,情报信息系统模拟人类感官功能,模拟人类接受外界环境的刺激,从视觉、听觉、味觉、温度觉、重量觉、位置觉等方面吸收已有的人工智能的发展成果,根据情报搜集目标的需要,借鉴人类已经掌握的知识,类似机器人,克服工作时间无法持久、工作环境存在危险的缺陷,探测、接受客观世界状况,发挥其地域全覆盖、时间全囊括、空间全搜索的态势感知功能,尽可能地收集瞬息万变的情报信息。
在各类业务系统中,情报或信息搜集是首先需要做的工作,使用网络“爬虫”替代情报人员有规则无休止自主地下载网页资料搜集网络信息,使用高分辨率光学卫星远程拍摄地表图像了解地面变化信息,使用由预警卫星、预警雷达和地基雷达等构筑的导弹防御系统的观测子系统,时刻捕捉地球各地可能发射的导弹迹象,使用麦克风阵列随时搜集交通违法鸣笛等,智能产品广泛运用于信息搜集领域,降低了情报人员的劳动强度,提升了人们对情报获取的质量和效率。
2 数字情报的智能处理
情报信息系统在搜集阶段积聚了铺天盖地、蜂拥而至的庞大的数字情报,为缩小情报分析数据体量,降低情报分析复杂度,必须进行情报数据的预处理。
2.1 数字情报人工处理左支右绌
在情报分析之前,进行情报数据的预处理,有多方面的考虑:(1)大幅度压缩情报素材的体量以减少情报分析的工作量。(2)多方面规范情报素材的形式以强化情报素材的可理解性。(3)尽可能地提纯与研究对象的相关度以提高情报素材的可用度。为此,在情报处理阶段,需要合并或消除重复冗余的数据,鉴别或纠正虚假错误的数据,拒收或抛弃无效无用的数据,识别或裁剪图像视频的数据,翻译或理解外语方言资料,倾听或转换音频语音的数据,破译或解释无线电技术侦察的数据等,这些数据体量庞大,处理工作繁琐耗时。显然,传统人工情报处理方式无法应对海量的数据处理要求。
2.2 情报信息系统趋向智能预处理数字情报产品
数字情报预处理工作大量是有规律的、事务性的数据处理,涉及许多其他专业技术,比如,图像识别技术、视频识别技术、语音识别技术、无线电技术、雷达技术等,这些技术大多已经成熟,能够提供成型的解决方案或配套的处理设备,是情报信息系统智能化预处理数字情报的技术支撑和实现基础。
多源情报信息数据智能化融合技术可以将多渠道来源的数字情报,以集大成的策略组合现有成熟技术,实现数字情报的预处理工作。
科大讯飞采用深度神经网络机器翻译技术智能处理语音情报或地方方言,达到语序顺、语义明、辨认口语化表达准缺的标准[1-2];依据网页底部网站备案信息、多个可信网站佐证、非网络途径获取情报等策略,按照情报人员手工处理时采用的筛选、鉴定、分析、研究、整理等真假情报判断经验,借助神经网络技术数据模式关联、聚类、分类和预测能力,编制程序执行算法,制作数字情报甄别处理模块,能够自主过滤真假混合的数字情报。
当然,现有技术不能完全实现人们的设想,不能完全替代情报人员进行数字情报的预处理工作,不能完全依赖情报信息系统数字情报预处理的质量和能力,但是数字情报智能化自主处理大量规则的预处理工作,有效缓解情报人员的高强度工作压力,采用由情报信息系统与情报人员构成的人机系统,是解决数字情报预处理较好的解决方案。
3 数字情报的智能分析
数字情报分析是指根据情报用户需求,对搜集到的、经过预处理的情报资料进行汇总、统计、比较、推理、判断、综合等逻辑分析活动而形成情报结论的过程。数字情报的分析环节是情报处理和分析流程中核心的环节。
3.1 数字情报人工分析捉襟见肘
在人工情报分析过程中,面对庞大的数据,推演过程覆盖数据有限,片面运用情报资料,分析结果自然无法做到严谨的要求;依赖分析人员长期积累的经验,分析过程中存在分析人员的思维定式,分析结论与经验值和分析思维方式相关性高,情报产品主观性强,不能准确反映现实情况,不能满足情报用户决策需要;数字情报人工分析耗时漫长,情报价值随时间急剧降低,无法达到情报用户所希望的及时提供有效情报产品的要求。
3.2 情报信息系统趋向智能分析数字情报
数字情报智能分析是指数字情报的逻辑分析活动由人工智能技术完成或部分完成的过程。智能分析是信息设备或智能设备模拟情报分析人员的分析方法和规则,客观地进行数字情报分析,可以有效克服先入为主等多种偏见,可以不分昼夜、不知疲倦地持续工作,更加高效、有效地协助情报分析人员共同承担情报分析任务。
数字情报分析工作一般包括将资料转换为知识、将知识整合到现有知识体系中和预测未来发展态势等内容。人工智能技术现有成果能够支持或部分支持数字情报分析的工作包括以下几个方面。
3.2.1 将资料转换为知识
在人工处理时,情报人员将零散的资料进行抽象概括,标注关键字,将带有类似关键字的资料整合,确定相互关系,构筑相关资料群,形成知识。人工智能模拟人类的学习行为,可以将资料整理为知识,从而自动生成情报产品。2012年美国启动文本深度发掘和过滤(Deep Exploration and Filtering of Text)项目,运用深度神经网络技术获取蕴藏在海量结构化文本中有价值的特征信息,运用自然语言处理技术进一步整合特征信息[3]。
3.2.2 将资料整合到现有知识体系中
数字情报工作是知识不断积累的过程,把不同来源、不同格式、孤立的情报汇总整合到现有情报资料中,构筑起情报全景图,揭示研究对象的本质。人工智能机器学习技术不断探索并尝试自主构筑知识体系的能力。2014年美国在“智能编撰整合”项目中开发了协助机器学习科技文章的技术,具备整合知识片段的能力[4]。
3.2.3 预测未来发展态势
情报产品服务决策的一个特点就是情报产品能够预测客观事物可能发展的趋势。其依据是利用已采集到数据描述事物特征,根据统计学原理发现事物运动规律来预见未来可能出现的状况。大数据、大数据技术、人工智能技术为数据预测、技术预测、机器(信息系统)预测的实现提供了数据条件和技术条件。现实中,使用“风云一号”卫星数据,依据已经掌握的大气变化规律来预测未来气象变化。
通过机器学习模型,在零售、产品生产、保险、能源、大型设备模拟试验、医疗保健等领域,预测用户需求,提供用户高品质个性化服务。
生活中,交通导航软件以现有交通状态数据为基础,以数学模型为依据,经过数据统计和分析,得到从出发地到目的地的各条行驶路线耗时预测结果,能够为驾驶员规划最省时的驾车行进路线方案,而且能够在行进过程中采集最新交通数据重新计算各条行驶路线耗时预测结果,随时更新驾车行进路线方案。股票软件大量使用过往股票交易数据,采用了各种统计理论,提供多种预测数据,使用股票软件的股民参考其中一种或多种预测数据,按照自己的交易策略,以此作为买卖股票的依据。
4 数字情报的智能生成
数字情报的生成是指在情报分析的基础上,根据情报用户的需求,把情报分析成果以恰当的形式形成情报产品的过程。一般情况下,情报产品是以文本报告的形式表达,根据需要也可能以数字、语音或图形等形式呈现。
4.1 情报产品人工生成书不尽言
数字情报产品手工生成模式存在效率低、效果差的问题。具有千万、亿级客户群的银行、淘宝、电信等企业不可能人工生成月度费用报表,卫生健康部门不可能人工制作即时全球性疫情报告,临机应变的战场指挥员不可能依赖按部就班的情报产品决策指挥。为应对窘况,应调整情报产品生成的模式。
4.2 情报信息系统趋向智能生成数字情报产品
情报信息系统根据实时数据驱动算法、模型自动运算推演,呈现即时态势,提供给情报用户意见建议。一般地,情报信息系统在智能分析数据后,直接将分析结果及其未来可能的趋势以情报用户可接受的方式显示在输出设备上,供情报用户利用。
可视化技术支持将大量杂乱数字情报以可理解的直观形象、动态变化的表现形式呈现给情报用户。
一般地,金融市场软件系统通过显示数值自动报告实时价格,通过绘制图形自动呈现动态变化,通过标记符号自动提示买卖建议。互联网的舆情监测系统自动聚类分析网络数据,自动描述舆情发生、发展、扩散到消亡的各个演变阶段,自动生成舆情来龙去脉的文字、图形报告。科大讯飞具备AI虚拟主播交互解决方案,在虚拟客服与情报用户互动基础上,可以实现虚拟的音视频情报产品的输出。
5 数字情报的智能分发
数字情报产品是服务于情报用户的,必须实现有效传递。判断情报产品分发是否合理的标准是,在合适的时间将适合的情报产品以适合的方式传递给适合的情报用户。
5.1 数字情报人工分发逐宕失返
在情报产品分发的过程中,存在信息过载和信息不足的现象。汹涌而来的庞大信息形成信息过载,让情报用户无所适从,“日理万机”的高层公司领导拒绝阅读行业态势万字言,灾难现场的指挥员无法按部就班理解情报产品。信息过载和信息不足都影响决策质量的准确性和及时性。
5.2 情报信息系统趋向智能分发数字情报产品
人工智能技术将发挥其强大的、具有针对性的信息分享控制功能,实现情报产品的有效分发。可将情报产品设置包括战略、战役和战术的情报产品的分辨率,可标注任务、地域、相关人员和时间等的情报产品属性,情报信息系统根据规则和算法的约定,有针对性地精准推送情报产品。
例如,三星GALAXY NOTEⅡ智能手机作为穿戴式态势感知系统的用户终端,设置了情报智能分发算法,可以自主选择适当信息传递给适当的用户,具有实时分享位置、动态地图等各类重要功能,极大地提升信息融合能力和态势感知能力[5]。
6 结语
数字情报处理和分析智能化过程是人工智能技术不断发展的过程,是情报处理和分析运用人工智能技术的实践过程。当前,大数据、大数据技术已经应用于包括情报处理和分析领域,大数据为机器学习、自然语言理解等强人工智能提供了可能性,也是情报处理和分析盼望的帮手。