作战试验遴选考核指标的准则研究*
2021-12-29廖学军白洪波
薄 云,廖学军,白洪波,白 宇
(1.航天工程大学研究生院,北京 101416;2.中国白城兵器试验中心,吉林 白城 137001;3.航天工程大学航天保障系,北京 102206;4.国防大学联合勤务学院,北京 100039)
0 引言
作战试验是我军体制机制改革在武器装备试验鉴定领域的重点内容,它强调“打仗怎么打,试验就怎么试”,是实战化导向在武器装备试验鉴定领域最重要体现[1-2],对于提升试验鉴定服务实战的综合效益具有重要推动作用。截至目前,我军作战试验在运行机制、内容设计、任务策划、组织实施、环境保障等方面已形成一批研究成果[3-6],在各军兵种、各级、各类、各型武器装备方面也已积累大量任务经验[1,7-9]。
为推动我军武器装备作战试验进一步发展,必须深化作战试验底层机理研究。考核指标作为作战试验任务组织出发点和结果评估落脚点,其遴选科学性将深刻影响作战试验任务组织有效性和鉴定结论正确性。本文概述了作战试验指标考核过程,讨论了考核指标数据特性,仿真演示并总结归纳了考核结果规律,探讨了遴选指标的具体准则,可为后续任务提供有益参考。
1 作战试验指标考核过程概述
我军自2015 年启动试验鉴定体制机制改革以来,将武器装备的全寿命周期试验活动划分为3 类,分别是性能试验、作战试验和在役考核[1]。其中,作战试验是军方以“用户”身份模拟被试武器装备实战过程,针对被试武器装备引申自作战使命的一系列考核指标,检验并评估被试武器装备履行既定作战任务的完成情况和适用情况。具体过程包括5 个环节:
1)指标构建环节。主要依据作战使命,分解武器装备的关键作战任务。再围绕这些关键作战任务,以指标的形式度量武器装备的作战效能水平及作战适用性水平,即构建了武器装备的指标体系。
2)试验策划环节。主要依据指标体系,设计试验方案,确定如何考核单项指标、综合评价武器装备某方面或整体能力;设计作战想定,确定如何模拟武器装备作战背景;确定资源保障方案,确定人员、装备、设备、场地、耗材等资源需求;计算试验日程,确定试验具体的日程计划安排;编订应急方案,针对可能危及人身财产安全,或因技术故障无法继续试验的情况,确定处置措施。
3)试验准备环节。主要审核武器装备是否具备开展作战试验的基本条件;开展人员培训;协调装备、设备、场地,及耗材等资源。
4)任务实施环节。主要是依据策划环节的试验方案开展试验考核,采集试验数据。
5)结果评估环节。主要是对任务实施环节采集的数据进行处理,得出单项指标检验结果和综合评估结果,给出是否通过鉴定的决策建议和装备改进、战法应用的具体意见。
可以看出作战试验考核指标选取对于作战试验各环节都有影响。应充分反映被试武器装备的作战能力需求,即全面涵盖武器装备作战效能与作战适用性的考核场景[5-6,8-9],且作为作战试验任务组织出发点和检验评估落脚点,其影响主要表现在4 个方面:
1)影响作战试验全程有效性。如果指标反映武器装备关键作战问题的本质属性,那么作战试验就可以非常公正客观地衡量并评判武器装备作战效能与作战适用性需求的达成情况。
2)影响作战试验进度高效性。如果指标缺乏良好的数据特征,不仅难以基于数据科学高效设计试验方案[10],更加严重的是,难以回答试验应当试多少次,即样本量估算的问题。
3)影响作战试验成本经济性。如果选择了不合适指标,作战试验不仅影响任务进程,而且会导致作战试验成本的整体提升。
4)影响作战试验结论可靠性。如果指标不具备良好的数据特征,试验方案往往难以控制无关因素,使试验引入大量信息噪声[10],并最终造成试验结果存较大误差,从而扩大了决策风险。
2 作战试验考核指标数据特性
作为一种特殊试验,作战试验既体现试验的一般特征,又表现出实战化的独有特征。为依据数据科学合理遴选指标,本节分析作战试验的数据特性。
2.1 考核指标基本分类
作战试验的指标按照其内容,可分为效能和适用性指标[6,11];按照数据特征,可分为定量和定性指标;按照考核形式,可被分为以下两类:
1)单项检验指标,主要考察武器装备是否达到了研制总要求的相关阈值。其数据处理方法一般是统计学中的各种假设检验。
2)综合评估指标,主要将武器装备所有的性能、效能、适用性信息“打包”进一个“总”的数值,以这个数值代表武器装备的综合评估得分。其数据处理方法一般为AHP 法等加权求和方法[11-13]。
2.2 考核指标基本特性
作战试验通过模拟实战评估被试装备的作战使命达成情况。而无论模拟实战还是真实作战,侦查、通信、指控、打击、保障等各作战要素必须协调运转,才能保证任务有效完成。这使得作战试验考核指标体现出如下3 项数据特性:
1)数据存在随机性。任何试验都是通过研究样本信息推断总体信息[14],所以无论是单项检验还是综合评估,其结果都是随机变量。这种随机性一般通过数据的集中属性和离散属性加以描述,最常用的形式是均值和标准差。
2)数据存在相关性。由于各作战要素之间必须充分协调才能有效完成作战任务,因此,这些要素的作战表现是相互关联的,即它们存在统计学意义上的相关关系[15]。这些相关关系可通过协方差矩阵[15]加以描述。
3)数据存在正态性。作战试验的单项指标一般以均值表述结果,而依据中心极限定理[15],当单项指标结果存在方差且有限,那么在样本量充足的情况下,近似服从正态分布。当前综合评估模型大多为加权求和模型,而正态变量的线性变换仍为正态变量,因此,综合评估结果也近似服从正态分布[15]。
3 作战试验指标考核仿真演示
前文概述了作战试验指标考核一般过程,分析了作战试验考核指标的基本特性。本节通过数值仿真演示分析该过程下,具备该特性的指标考核结果反映出的一般性规律,为后文提出作战试验指标遴选准则提供支撑。
3.1 案例描述
某装甲突击类武器作战试验经过前期论证,构建了包含侦查、指控、打击、保障、防护、机动6 类作战效能和作战适用性的指标体系。对于各底层指标,均以假设检验的方式考核。最后综合所有底层指标考核结果,按指标体系的层次,以AHP 法对上层指标进行评估。
于是,根据前文阐述的作战试验指标的基本数据特性,在不失一般性的前提下,可以简化作战试验的指标考核过程。具体参数设置包括3 个方面。
3.1.1 设定各指标近似服从正态分布。
通过AHP 法,自底向上加权求和得到了包含打击、侦查、指控、保障、防护、机动6 个分量的随机向量x→,则它的分布为六元正态分布,其协方差矩阵为:
由于正态分布经过平移和缩放,都可以转化为标准形式,且过程可逆[15],因此,可假设该六元正态分布的均值向量μ→为零向量。
3.1.2 设定各单项指标的检验阈值。
由于设置了被试装备的均值向量为零向量,则指标的阈值为正数时,表示被试装备的该项能力低于阈值,反之则高于阈值。阈值的绝对值反映了这种差别的程度。于是,设置侦查、指控、保障、防护、机动能力的阈值为其对应标准差的0.05 倍、-0.1倍、-0.1、-0.2 倍、-0.2 倍、-0.3 倍。另外,根据假设检验的原理[15],当显著性水平为0.05 时,如果仿真出的某一指标的取值小于阈值1.644 854(z0.05)倍标准差时,即认为该单项指标未通过考核。
3.1.3 设定综合评估指标
由于该作战试验主要考察武器装备履行突击任务作战使命的情况,因此,最关注x→中的打击分量,其次是侦查、指控、保障、防护分量,最后是机动分量,因此,设定权重向量ω→为:
由于AHP 法需标准化各指标,故设置标准化方法为:
其中,允许值为阈值减去0.8 倍标准差,满意值为其阈值加上0.8 倍标准差。当标准化值小于0 时,令其为0;大于100 时,令其为100。
3.2 仿真结果
根据以上仿真参数设置,模拟生成1 000 组作战试验数据,每组数据为每次作战试验获取的打击、侦查、指控、保障、防护、机动各分量的试验结果均值,通过分析处理,可反映出3 方面问题。
3.2.1 单项指标检验存在错误率上升情况
按照参数设定,对生成数据进行单项指标检验,得出每组数据分别有1~6 项能力通过假设检验的情况,如图1 所示;而各能力分别通过检验的情况,如下页图2 所示。由于各分量均值都比较贴近各自标准,因此,在不失一般性的情况下,可认为检验拒绝原假设即犯了“第1 类错误”[15-16]。
图1 单次试验有1~6 个分量通过检验的情况
通过观察图2,可以看出,各分量通过检验的比率大约都为95%,即出现第一类错误的概率大约为5%,与预设基本持平。然而图1 却显示出至少有一项能力未通过检验的为173 个。即同时检验6 个单项指标时,单次试验犯第一类错误的概率由预设的5%上升至17.3%。
图2 各分量的单项指标检验情况
3.2.2 综合评估指标可能误导决策
按照参数设定,对生成数据进行综合评估,得出的综合评估结果以10 分为间隔统计的频数情况如图3 所示。很显然,综合评估的结果是随机变量。
如果以AHP 等加权求和算法进行综合评估,每次作战试验只能得到综合评估的一个具体数值,而这个数值并无法反映图3 所展示出的综合评估结果的变动情况,即被试装备的综合评估结果会以多大的概率出现在哪个得分区间内。
图3 综合评估结果示意图
更为严重的是,由于综合评估结果的随机性,如果只仅仅依据作战试验的数据给出一个具体的评估数值,非常可能误导装备发展的决策。例如,综合评估结果没有落在概率密度[15]最大,也即最有可能出现的75~95 的区间,而是落在了概率密度最小,也就是最没有可能出现的0~60 的区间,则该结果将会影响主管部门做出正确决策。
3.2.3 单项指标与综合指标考核结果存在冲突
由于作战试验考核指标的随机性,单项指标和综合指标的检验或评估结果显然也会存在一定的冲突概率。即综合评估暗示被试装备应当通过鉴定时,单项指标却暗示不应当通过鉴定,或者相反。
归纳整理1 000 次模拟作战试验的单项考核结果与综合评估结果,可得如表1 所示的对应表。该表各行表示以10 为跨度的各综合评估成绩区间内,分别通过1~6 各单项检验结果的统计情况。中间的分割线区分了综合评估低于和高于60 分的结果,即综合评估认为不应/应该通过作战试验的情况。5 个添加背景色的单元格表示综合评估认为应当通过作战试验(高于60 分),而单项检验认为不应通过作战试验(至少有1 个单项指标未通过检验)的情况,或其相反情况。
表1 综合评估与单次试验检验结果对应表
由于5 个单元格数值总和为88,即综合评估与单项检验结果冲突的概率大约为8.8%,接近于10次试验即会出现一次。
4 作战试验考核指标遴选准则
通过作战试验指标特性的定性分析和基于仿真的定量研究,可以看出遴选指标时,不仅需要有效反映武器装备履行作战使命的程度,具备良好的数据特征,而且不宜选用过多指标,尤其是综合指标往往无法有效反映装备信息,所以,后续作战试验遴选指标可参照以下准则。
4.1 强化任务指标,兼顾性能指标
作战试验的根本目的是从军方角度衡量被试武器装备作战任务完成程度,以及作战任务适用程度。实践中,考核指标应尽可能与作战演训评价指标相兼容,这既方便作战人员理解作战试验结果,也提升作战试验服务实战水平。必要时可适当参考作战部队的训练大纲,或是定型鉴定中的部队试验、部队试用军用标准。性能指标主要用来考察武器装备的工程实现情况,要求精准控制试验条件,这与作战试验实战化的高度动态特性相冲突。如果必须在作战试验中兼顾性能指标,应尽可能确保该性能指标有利于解释作战任务完成情况。
4.2 强化定量指标,兼顾定性指标
与定性指标相比,定量指标精确性更高,结果可靠性更好,可用的数据处理方法也往往更加成熟。作战试验往往涉及作战人员主观感受评价,因此,也势必存在定性指标。实践中,在遴选指标时,可以吸纳军事专家、工程人员、试验人员成立专家组。首先,由军事专家提出日常演训评价作战任务完成情况的各类指标;其次,由工程人员尽可能分析这些指标反映的物理实质,尽可能以定量指标加以描述,并尝试其可用军事化语言加以解释的可能性;最后,由试验人员综合考虑试验资源、技术、日程的可行性,组织军事专家、工程人员对已选指标进行迭代优化。
4.3 强化核心指标,兼顾一般指标
一般指标与核心指标往往具有较强相关性,核心指标结果实际反映了一般指标完成情况。选用过多一般指标检验不仅提升了试验复杂度,增加了任务成本,也如仿真所示,不可避免地提高了错检率。实践中,可由军事专家从一线作战角度出发,考察作战试验指标体系各类指标在日常演训活动中的使用频次。根据作战试验的资源承受情况,依频次由多至少精选核心指标,兼顾一般指标。
4.4 强化单项指标,兼顾综合指标
同上,核心指标往往与所有指标都有较强相关性,而其在综合评估的过程中又必定具有更高权重。因此,综合评估结果可以被看作加入一定扰动信息的核心指标检验结果。考虑到核心指标往往具有物理层面的比较明确的作战含义,且作为单项检验,能以概率形式提供更多的数据变动信息,从而更好地指导装备管理与作战运用。实践中,可以用单项指标的假设检验结果作为是否通过作战试验的基本依据,而把综合评估结果作为武器装备是否定型的决策参考。