基于联机分析处理技术的实验数据分析方法*
2018-12-19耿松涛操新文李晓宁原晓波
耿松涛,操新文,李晓宁,原晓波
(1.国防大学联合作战学院,石家庄 050084;2.解放军31683部队,兰州 730300)
0 引言
现代军事问题研究已经越来越多地借助于实验的方法,美军认为组织作战实验的能力是21世纪军队必备的核心能力之一[1]。一例成功的作战实验,除了富有创造性的实验设计外,还要有科学合理的实验数据分析。只有通过有效的数据分析,才能从大量无序的实验数据中,挖掘出有意义的结论,发现军事问题规律。随着信息化战争的不断发展,作战仿真实验、实兵演习等军事活动产生各种实验因素、实验指标的数据量大幅度上升,从而对实验数据分析能力提出了更高的要求。
虽然经济金融行业中的数据分析方法已经比较成熟,但是作战仿真实验中的数据分析相对比较匮乏,数据分析的方法比较单一,实用性、可操作性相对较差。所查到的文献中只有军事科学院外国军事研究部翻译的《恐怖的海峡?中台对抗的军事问题与美国的政策选择》报告中,通过定性与定量相结合的数据分析方法,对仿真实验结果数据进行了研究[2],但对于因果分析的研究相对较少。文献[3]中对数据挖掘分析、支撑向量机等方法进行了研究;文献[4]提出的对仿真实验结果数据多层面、多粒度的挖掘和合成等方法进行了研究。综合来说,实验数据因果分析研究在成熟性、实用性、便捷性等方面还存在明显不足。
1 实验要素分析的需求
根据实验目的的不同,探索性实验大致可分析寻优、寻需、寻规律3类,本文主要致力于研究适用于寻规律实验的数据分析方法。探索性分析的基本思想是广泛地试探各种条件下所可能产生的结果,理解不确定性因素对于想定问题的影响,所以要重点进行实验要素(实验因子)分析[5]。根据寻规律的实验目的,实验要素分析可归纳为4类需求。
第1类需求:分析在某种特定条件下,比如某变量取固定值时,其他变量对考察指标的影响关系。比如想知道当选择雷达Ⅰ、Ⅲ、Ⅳ和地面情报与指挥中心Ⅶ为作战目标时,对抗手段和兵力规模两个方案因素的统计结果,考察特定目标选择组合情况下这两个维度对防空预警系统的探测距离的影响关系。
第2类需求:通过展示更为细节的数据,分析考察指标随某个变量的细微变化过程;或者汇总细节数据,从总体上把握影响规律。
第3类需求:分析多个变量交叉或者组合情况下对考察指标的影响,比如说选定不同作战目标组合时,考察干扰方式对效能指标的影响关系;或者改变交叉关系或者组合次序时,分析新的交叉或组合对考察指标的影响,比如说不同干扰方式下,目标组合对效能指标的影响关系。
第4类需求:筛选一批满足特定条件的数据,对新的数据集进行进一步的分析。
实验要素分析的目标并不是找一个最优点,更注重分析不同方案因素对结果的影响,注重把握系统内部的规律,这个目标决定了寻规律仿真实验的数据量必然会很大,而且会随着考察因素的增多而呈指数增长,所以必须研究合适的数据分析技术。
2 基于OLAP的探索分析方法
根据方案要素分析的4类需求,联机分析处理技术(OLAP)在针对性和灵活性方面优于数据挖掘,且OLAP分析技术具有图示化的表现能力,直观形象,便于充分表现各类影响关系,适于进行基于预期的数据分析。
2.1 OLAP探索分析的基本概念
针对实验数据分析需求,这里基于OLAP的操作理念、数据仓库数据存储组织方式和探索性分析的基本思想,提出一个OLAP探索分析的概念,基本思想是:为了全面把握各种关键要素,把仿真实验数据以数据仓库的形式组织和管理,利用OLAP的切片、切块、旋转、钻取、过滤等基本分析技术,进行多层次、多角度、反复地进行探索分析,广泛地试探各种条件下所可能产生的结果,帮助分析员发现或验证预期的或隐藏的知识或数据特征。
为什么选用OLAP作为寻规律实验数据探索性分析方法的核心?OLAP,称作联机分析处理技术,又称多维分析系统,可以在多个维的角度分析多个度量,也就是分析输入变量或自变量与考察指标的影响关系,目的在于发现趋势和关键因素,具体是指对数据仓库中的数据进行分析的一系列分析技术,主要有钻取、切片、切块、过滤和旋转等[6],适合进行有指导的、基于预期的探测分析,而这恰好是探索性分析所要求的分析能力。
2.2 OLAP探索分析的主要技术
OLAP的几个常用分析技术,即切片、切块、钻取、旋转和过滤,是OLAP探索分析的基础,这里给出这几个分析技术的详细概念和操作说明。结合探索分析的思想,提出切片探索、切块探索、钻取探索、旋转探索和过滤探索的概念。下面具体分析OLAP探索分析的几个主要分析方式:
1)切片探索:按一个或多个维的固定值从多维数据集中抽取汇总数据,考察其他维度和度量的多维统计结果。反复切片的过程称作切片探索,适合解决实验要素分析的第1类需求。
2)切块探索:抽取一个子立方体或多维数据集的切片集,两次及两次以上的切片操作就是切块。反复切块的过程称作切块探索,适合解决实验要素分析的第1类需求。
3)钻取探索:根据各个维度取值的分类层次情况,实现按照各个层次逐层展开或者逐层收拢。向下钻取能进一步展现细致的数据,向上钻取能展现数据总体情况。反复钻取的过程称作钻取探索,适合解决实验要素分析的第2类需求。
4)旋转探索:将多维数据集按轴旋转,可以从不同角度查看数据。在数据透视表中,维度分布在行和列上,通过行表头及列表头之间调换数据维的位置,可实现分析角度的变换。反复旋转的过程称作旋转探索,适合解决实验要素分析的第3类需求。
5)过滤:按限定条件对多维数据集进行数据筛选。反复过滤的过程称作过滤探索,适合解决实验要素分析的第4类需求。
2.3 OLAP探索分析的操作实施
从Excel 2000开始,微软将Excel开发成了OLAP前端分析工具,利用Excel的OLAP基本分析功能,实现OLAP探索分析[7]。实施步骤:
第1步 建立多维数据集。实验数据存放在SQL Sever 2000管理的数据库中,把标准的关系型运算数据库转换为星型模型的多维数据集时,关键完成下列3个步骤。
1)确定度量和维。
2)设计维表。
3)设计事实表。
在数据库里建立多维数据集,基本是完成了一个依托于SQL Sever 2000的简单数据仓库。
第2步 创建Excel连接。连接Excel和数据仓库,数据仓库为OLAP分析提供数据。
第3步 实施OLAP探索分析。使用Excel为工具实施OLAP探索分析,并利用Excel的数据透视图和数据透视表直观地展现OLAP探索分析结果。
值得一提的是,Excel的数据透视图既能直观展示探索分析结果,同时也是一种交互式的可视化探索工具,帮助分析员直观、方便灵活地从大量的结果数据中取得更多有价值的决策信息。
3 基于OLAP的电子对抗作战部署要素分析
作战部署是指挥员对作战力量的任务区分、兵力编组和配置作出的安排,是作战决心的重要内容[8]。作为筹划决策的必备环节,作战方案评估主要是对方案优劣的评估,在此基础上,为更好拟制、调整部署方案,还需要了解部署方案要素对整个方案优劣的影响关系。下面以对防空预警系统电子对抗作战为例进行说明。
3.1 构建作战部署方案探索空间
对电子对抗作战部署的要素做简化处理,选取目标选择、对抗手段、兵力规模3个核心要素,每个决策要素分别有多个备选方案。作战部署方案是多阶段决策的产物,所以作战部署方案集或作战部署方案探索空间可以采用结构化的决策树来表示[9],如图1所示,从根到叶节点的一条路径表示一个作战部署方案,用XML格式存贮,便于读取和存储。
图1 电子对抗作战部署方案决策树
其中,目标选择方案中,Ⅰ、Ⅱ代表蓝方机载预警雷达,Ⅲ、Ⅳ、Ⅴ、Ⅵ代表蓝方地面警戒雷达,Ⅶ代表预警机与地面的情报通信;对抗手段方案中,A代表地面干扰站对空中预警机系统远距离支援干扰,B代表干扰飞机对地面警戒雷达的远距离支援干扰,C代表反辐射无人机对警戒雷达的反辐射压制和摧毁,D代表干扰飞机对地面的空地情报通信接收站的远距离支援干扰,“Ⅱ-A”就表示对目标Ⅱ使用A手段进行对抗;兵力规模方案中,小、中、大代表兵力规模大小,“Ⅱ-A-小”就表示对目标Ⅱ使用A手段进行对抗,使用小规模兵力。
3.2 设计实施作战仿真实验
根据作战部署辅助决策的军事需求,周密细致设计作战仿真实验,并依托作战仿真实验系统组织实施实验。实验过程中,动态采集数据,同时对数据进行预处理[10],然后设计关系型数据库存储实验数据。在辅助决策过程中,可根据需要查询提取实验数据。从数据库中查询提取红方作战部署方案与蓝方作战仿真结果的映射表,在此基础上对反映蓝方作战结果的5个指标进行聚合计算,得到方案效能指数,如下页表1所示。
3.3 基于OLAP探索分析方法的要素分析
第1步 目标选择要素分析。如图2所示,考察什么样的目标选择作战效能高,进一步分析各作战目标的威胁大小。在图形左上方是切片维,Ⅲ-T、Ⅳ-T就是此次选定的切片维,所附带的数值是该维度的切片值,Ⅲ-T=1就表示在已选择雷达Ⅰ为作战目标的情况下研究其他维度;在图形下方是钻取维,Ⅴ-T、Ⅵ-T就是此次选定的钻取维,Ⅴ-T就表示在目标选择方案中雷达Ⅴ的数据维,数字“1”、“0”分别表示选择该雷达或不选该雷达。不同竖条的值表示在特定钻取维(目标选择方案)下作战部署方案效能指数的平均值。从图中可以读出:在选定雷达Ⅲ、Ⅳ作为作战目标的情况下,不选雷达Ⅴ、Ⅵ为作战目标时作战效能平均值最高(1.90),说明雷达Ⅴ、Ⅵ对我威胁较小,如果分兵对其实施干扰容易造成兵力浪费。此外,可以调整切片维和钻取维进行其他目标选择要素分析,这里不再一一展示。
表1 作战部署方案评估实验数据及聚合指标展示表
图2 目标选择要素分析示意图
第2步 对抗手段要素分析。如图3所示,在选定作战目标的情况下,考察不同对抗手段对作战效能的影响,图左上角切片维表示选定的作战目标方案,图下方钻取维表示研究的对抗手段。从图中可以读出:在此目标选择方案下,对雷达Ⅲ单独实施远距离支援干扰(B),对雷达Ⅳ同时实施远距离支援干扰和反辐射摧毁(B、C),此时作战效能平均值最高(2.30),说明雷达Ⅲ可能抗反辐射攻击能力较强,而雷达Ⅳ抗反辐射攻击能力较弱。
图3 对抗手段要素分析的示意图
第3步 兵力规模要素分析。如下页图4所示,在选定作战目标、对抗手段的情况下,考察不同兵力规模对作战效能的影响,图左上角切片维表示选定的作战目标、对抗手段,图下方钻取维表示研究的兵力规模。从图4(a)中可以看出,对抗雷达Ⅲ使用大规模兵力时的平均效能比中等规模时普遍高出一截,效能最高的兵力规模方案是对雷达Ⅲ使用大规模兵力,对雷达Ⅳ使用“中中”规模兵力(B、C手段都用中等规模)。另外对比图4的(a)、(b)两图发现,(b)图从正中间分割成左右两部分的话,两部分的条形图分布格局类似,且都与(a)图类似。说明雷达Ⅲ、Ⅳ的兵力规模对作战效能的影响规律是确定的,且如果对抗雷达Ⅱ时使用大规模兵力,则能显著提高整体作战效能。
图4 兵力规模要素分析
4 结论
与美军相比,我军作战实验尚处于起步阶段,尤其是作战实验的具体应用还比较欠缺,需要大量基础性和探索性工作。基于联机分析处理技术OLAP的实验数据分析方法是对作战实验应用的新探索,为解决作战部署辅助决策问题提供了一种新思路。该方法也可以为其他因果分析、要素分析之类的辅助决策问题的研究提供借鉴。