美军试验鉴定即连续体概念研究
2024-11-19杨涛张毅梁葆华李国乐
摘 要: 试验鉴定改革是美国国防采办体系改革和美军数字化转型的重要组成。 面对人工智能、 自主等新兴技术发展, 以及多域战、 全域战等体系化作战要求给武器装备能力交付带来的试验鉴定挑战, 美国国防部积极推动试验鉴定领域的数字化转型, 其中一项重要举措便是提出试验鉴定即连续体概念, 以期借助数字工程理念, 持续开展试验策略与鉴定流程优化, 进一步提升武器装备采办效率与质量。 本文简述了试验鉴定即连续体的发展情况, 分析研究了其框架内容、 概念内涵, 以及具体实施所需的能力要素, 给出了有关武器装备试验鉴定数字化转型发展的启示。
关键词: 试验鉴定即连续体; 数字化转型; 数字工程; 使命任务工程; 系统工程
中图分类号: TJ760
文献标识码: A
文章编号: 1673-5048(2024)05-0034-07
DOI: 10.12132/ISSN.1673-5048.2024.0114
0 引 言
近年来, 大国竞争日趋激烈, 为贯彻落实“第三次抵消战略”重要举措, 并应对中俄等潜在对手在人工智能、 自主、 量子计算、 6G等新兴技术方面前所未有的加速创新, 美国国防部正在大力推进国防采办政策制度改革, 特别是试验与鉴定(T&E)领域的变革转型。
同时, 数字工程(DE)的持续推进, 为试验鉴定领域变革转型带来新的要求和方法, 人工智能、 有人-无人协同等作战能力倍增技术和联合全域作战等体系化作战概念给武器装备能力交付提出新的要求, 美国国防部推出试验鉴定即连续体(T&EaaC, Test and Evaluation as a Continuum)概念, 以期利用数字工程方法, 促进试验鉴定与使命任务工程(ME)、 系统工程(SE)的深度融合, 形成贯穿系统全生命周期的连续且不断迭代的过程, 推动试验鉴定数字化转型, 以此满足美军对于“以相关速度”交付能力的要求[1]。
本文通过系统梳理美国国防部试验鉴定即连续体的发展背景与历程, 对其主要内容、 概念内涵和实施能力要素进行了分析研究, 并就有关武器装备试验鉴定数字化转型发展提出了几点启示。
1 T&EaaC发展背景与历程
1.1 产生背景
在美国国防采办活动(特别是重大能力采办活动)中, 目前试验鉴定范式的生成和执行是以传统串行过程进行的, 主要通过依次实施承包商试验(CT)、 研制试验(DT)和作战试验(OT), 来实现系统能力交付。 虽然近年来美军在装备采办流程中持续推行“左移”策略, 但结合部分承包商试验、 研制试验和/或作战使用要素形成的一体化试验鉴定(IT&E)在很大程度上也依旧是串行的, 而且仍然需要分别为研制试验和作战试验建立鉴定框架。 因此, 美军认为, 随着多域战、 全域战等概念提出, 以及人工智能、 自主等新兴技术的发展, 当前的武器装备试验鉴定方式存在着一些问题和挑战。
(1) 从本质上讲, 承包商试验和研制试验侧重于需求验证, 而作战试验则专注于评估任务有效性和适用性。 通常, 作战试验在系统研制/开发后期进行, 这种做法缺乏在项目早期对系统在真实任务场景中性能的考虑和试验鉴定, 从而造成了某些场景中影响性能的问题过晚暴露。 而当问题出现时, 特别是当系统研制/开发的技术和组件成熟度较低时, 解决这些问题将变得异常困难。 同
收稿日期: 2024-07-09
作者简介: 杨涛(1986-), 男, 陕西勉县人, 高级工程师。
*通信作者: 张毅(1986-), 男, 贵州台江人, 硕士, 高级工程师。
时, 由于项目规划和资金安排通常不包括全面解决投入使用前发现的重大问题所需的时间和资源, 所以, 为了
在规定期限内完成交付, 项目往往会调整所需的系统功能或性能指标, 这种做法极大降低了向作战人员交付能
力的效能。
(2) 目前这种串行的试验鉴定方式不仅是从有限数量的资源密集型离散事件中收集有限的信息集, 而且没有充分考虑在整个研制过程中、 部署与使用保障期间通过持续学习而不断演进的人工智能(AI)/机器学习(ML)支持系统。
(3) 系统工程领域通常对系统工程“V”模型以串行方式进行解释, 这导致试验方过晚参与到真实任务场景中的系统性能评估, 从而进一步推迟了试验阶段能够提供的重要反馈信息, 而这些信息正是鲁棒系统, 尤其是AI/自主系统设计、 开发和持续改进所必需的。
为应对日益复杂多变的威胁环境, 在美国国防部试验鉴定组织体(Test and Evaluation Enterprise)总体试验与鉴定战略指引下, 作战试验鉴定局(DOT&E)以问题和挑战为导向, 开始与各军种试验鉴定主管以及国防部长办公室(OSD)下属的试验鉴定组织机构协调开展试验鉴定数字化转型研究。 其中, 美军计划结合数字工程方法, 将试验与鉴定工作作为一个连续体, 集成到系统工程和使命任务工程中, 试验鉴定即连续体概念应运而生[1]。
1.2 发展历程
航空兵器 2024年第31卷第5期
杨 涛, 等: 美军试验鉴定即连续体概念研究
早在2010年, 时任美国国防部采办、 技术与后勤副部长, 研制试验鉴定局(DDT&E)局长Edward R. Greer曾提出一体化试验鉴定连续体的设想, 通过将试验鉴定工作前伸后延, 范围覆盖整个研制/开发和采办过程, 即从里程碑A(进入技术开发阶段)前的装备方案分析阶段一直到后续作战试验与鉴定(FOT&E)及里程碑C(进入生产与部署阶段)后的使用与保障阶段, 同时引入系统工程理念, 在组件级研制/开发中实现良好的系统规范, 以此来提高承包商研制试验与鉴定(DT&E)、 政府研制试验与鉴定和政府作战试验与鉴定(OT&E)的效率[2]。 但由于实施成本较高, 缺乏可互操作的数字工程环境与工具, 以及缺少统一数据策略来支撑整个试验鉴定阶段与采办寿命周期的完整端到端知识与数据共享等因素制约, 转型发展缓慢[3]。
2018年, 美国国防部发布《国防部数字工程战略》, 加速推动数据整合和共享, 构建了试验鉴定数字化转型的总体依据, 表明美国国防采办改革的大致方向, 将借助系统工程方法, 促进数字工程在试验鉴定中的深化应用[4-6]。 2020年11月, 美国国防部发布首版试验与鉴定指示文件DoDI 5000.89指出: “一体化试验和独立鉴定是更大的试验鉴定连续体的一部分。 ”同时, 结合《国防部数字工程战略》要求, DoDI 5000.89指示还要求: “采办项目要在任务背景下对系统进行数字表征, 并(尽可能)使用数字生态系统, 整合权威的模型、 数据和试验工件(如试验用例、 计划、 缺陷和结果)来源, 以提高整个一体化试验鉴定连续体的效率。 ”因此, 试验鉴定需要变革并采用数字工程战略思想, 以改进建模与仿真校核与验证(V&V)流程以及整个生命周期内的试验鉴定评估[7-8]。
2021年5月, 美国空军发布“数字工程的数字建设规范”, 概述了试验鉴定对于数字工程的重要性, 并强调试验鉴定必须与数字工程活动相结合[9]。 与此同时, 美国国防部期望通过对试验鉴定支撑能力交付的方式进行变革, 建立一种新的试验鉴定范式, 使试验鉴定活动在整个能力生命周期内(从使命任务工程最初阶段持续到使用与保障阶段)为当前复杂的技术开发和部署决策提供支持, 以大大增强试验鉴定在以“相关速度”交付关键作战能力方面的作用[10-11]。 紧接着, 2021年7月, 在国际试验鉴定协会(ITEA)第38届试验与鉴定年会上, 美国国防部作战试验鉴定局和研究与工程副部长办公室(OUSD(R&E))研制试验、 鉴定与评估处(DTE&A)首次提及“试验鉴定即连续体”一词, 初步将其阐述为: “所有试验(测试)都是连续进行的, 在此过程中, 当前的试验会根据先前的试验结果进行迭代更新和完善[12]。 ”至此, 美国国防部指示DoDI 5000.89中描述的“更大的试验鉴定连续体”有了更进一步的发展和完善。 一体化试验鉴定的转型如图1所示。
2022年6月, 美国国防部作战试验鉴定局发布《2022财年作战试验鉴定战略更新》, 基于《国防部数字工程战略》及其数字工程转型, 总结提出了试验鉴定5大战略支柱, 概述了变革试验鉴定基础设施、 流程、 概念、 工具和人才队伍的愿景, 以跟上技术、 威胁和作战环境的快速演变[13-14]。 同年7月, 作为年度战略更新的积极响应, 针对多域作战(MDO)对试验鉴定在自主/人工智能使能、 一体化、 弹性和敏捷等方面的挑战, 为促进试验鉴定转型发展, 充分评估多域作战环境中的战斗能力, 美国国防部研制试验、 鉴定与评估处再次提出“试验鉴定即连续体”概念, 并明确指出试验鉴定即连续体概念建立在国防部2018年数字工程战略基础上, 通过使用数字工程使试验与鉴定成为系统工程和使命任务工程流程的组成部分, 不仅能支持单个系统的决策, 而且有助于实现国防部能力开发组合的知情管理[15]。
2023年3月, 美国国防部研制试验、 鉴定与评估处和美国海军航空系统司令部(NASC)基于能力的试验鉴定办公室正式联合发布“试验鉴定即连续体”概念, 明确了“试验鉴定即连续体”的三大关键属性内容及三大能力要素, 并建议在复杂系统采办中实施更加基于风险、 能力驱动和一体化的复杂系统采办试验鉴定方法[1, 3]。
2 T&EaaC框架内容
2018年, 美国国防部在数字工程战略中, 提出了5个关键目标基础[4]。 2022年, 作战试验鉴定局新制定的战略更新文件中, 总结提出了试验鉴定5大战略支柱[12]。 在此基础上, 依据战略目标和支柱衍生出总体框架, 试验鉴定即连续体主要构成逐渐清晰[1]。 图2所示为其总体框架。
如图2所示, 试验鉴定即连续体的主要内容包括: 以能力和结果为中心的试验; 敏捷、 可扩展的鉴定框架; 增强的试验设计。 其中, 每个属性内容对于以“相关速度”交付能力都至关重要。
2.1 以能力和结果为中心的试验
以能力和结果为中心的试验又称“以任务为中心的试验”, 旨在尽早关注军事能力在投入使用时的性能表现。 美国国防部认为, 需要在装备采办过程中“像作战一样进行试验”, 并确保在承包商试验和研制试验期间进行的早期工程和技术验证试验能够提供直接支持最终在作战试验的任务环境中进行性能评估的各种信息。 所有承包商试验和研制试验活动与任务的直接结合, 可让决策者非常清晰地了解整个采办过程中任务级能力性能, 并能更早洞悉与当前及预计威胁环境和任务级能力性能相关的风险。 这种任务背景还有助于探究作战弹性, 例如, 在高度动态或竞争环境(包括与网络空间攻击造成的不利条件相关的环境)中作战期间的弹性。
此外, 以能力和结果为中心的试验强调尽早关注试验的弹性, 以便优先考虑对试验结果的响应, 从而确定未来的试验要求和优先级。 例如在赛博域, 美军已开始将重点从传统仅关注防范网络威胁的“控制”方法, 转向更关注任务背景、 不利影响、 对不利影响的早期识别, 以及更好的恢复能力。 未来, 随着“需求”背景很可能从离散的关键性能参数和关键系统属性演变为通过系统模型提供的“系统行为”之一, 连续试验过程将实现在基于模型的环境背景中, 对系统行为进行更快速的评估。
因此, 作为一个重要基础, 严格地执行使命任务工程流程将提供有关国防部使命任务及执行使命任务所需能力的表征, 从而实现系统需求的识别与更新。 然后, 利用基于模型的系统工程(MBSE)方法, 并使用共享能力表征, 可以对不断演进的武器系统(包括结合AI/ML的系统)进行迭代式的试验与鉴定。
2.2 敏捷、 可扩展的鉴定框架
随着数字工程和试验鉴定改革的持续推进, 美军认为, 当前传统的鉴定框架开发工作开始得太晚, 并且要跨科学技术(S&T)、 研制试验和作战试验领域进行整合, 实际效果较差。 要成功解决从使命任务工程到使用与保障阶段的整个能力生命周期中的“决策空间”问题, 需要在项目正式启动之前制定一个基础性的总体鉴定框架。 新的鉴定框架要持续更新, 并确定支持决策所需的信息, 以及如何使用使命任务工程、 系统工程和试验鉴定活动与工具来获取这些信息。 总体鉴定框架还要具有适应性和可扩展性, 能用于适应性采办框架的6种路径, 同时也可以根据转为采办项目之前的科学技术、 原型设计和实验工作进行剪裁(定制)。 随着性能信息的积累和项目的成熟, 这种框架将实现对试验鉴定活动的迭代和持续优化。
按照美军设想, 总体鉴定框架要包含对建模与仿真和其他对开展试验鉴定即连续体至关重要的MBSE元素进行校核、 验证与确认(VV&A)所需的信息。 应当确定试验基础设施, 包括需要获取所需评估信息的LVC资产, 以尽早明确对跨国防部能力组合的试验鉴定基础设施资源的直接需求。 在基于模型的环境中开发这种鉴定框架将有利于管理跨子系统、 系统, 尤其是体系(SoS)元素的集成复杂性。 而且该框架还将支持管理跨异步开发的校核与验证工作。
目前, 这种方法已经应用到敏捷软件开发流程, 并且与以能力和结果为中心的试验相结合, 为决策者提供更多有关设计开发与威胁环境是否一致的信息。 其优势在于支持早期投用和原型设计决策, 提高对整体系统弹性的理解, 并更好地了解支持能力交付所需的项目设计和验证工作的充分性和范围。
2.3 增强的试验设计
开发涵盖特定能力随时间演变的一体化试验策略, 同时考虑高度动态和竞争性任务环境, 是试验鉴定即连续体的关键组成部分。 因此, 以鉴定框架为基础, 增强的试验设计将扩展美军近年来为一体化试验改革所做的工作, 并更好地支持任务背景下的早期性能评估。
首先, 增强的试验设计会将VV&A纳入整个能力演进或项目生命周期, 并向早期工程和技术验证试验提供初始数据, 为能否实现预期能力结果提供依据。 还将采用迭代的“设计/试验/验证”方法, 全面评估不断演进的“系统行为”, 使能力开发工作适应不断变化的作战环境。
其次, 增强的试验设计还会包括对人-机综合(HSI)的鲁棒性评估, 重点是对作战人员接受和使用人工智能/机器学习使能系统所需的可信度进行演示验证。 因为对于美国国防部, 无论是监管部门、 采购部门, 还是军方用户, 信任是基础保证。 对于作战人员来说, 在这种背景下, 人-机系统试验设计尤其重要。 在实际冲突中, 使用决策几乎必须是瞬时的, 并且依赖于在使用系统时对系统正确校准的信任。 因此, 信任和团队合作的指标至关重要。
最后, 增强的试验设计还会适当结合科学试验与分析技术(STAT), 以提高试验效率, 并有利于开展试验结果的严格评估。 贝叶斯统计近年来在这方面受到越来越多的关注, 就是因其提供了一种严谨的数学方法, 可以将多个来源的预测和不确定性结合起来, 并在一系列试验活动中进行更新。
3 T&EaaC内涵分析
3.1 概念解析
试验鉴定即连续体是将试验与鉴定从一系列基本上独立于系统工程活动和使命任务工程活动而进行的活动集合进行有效综合, 形成的一种基于连续体的新的综合性框架。 概念强调试验鉴定不是一种“一次性”活动, 而是需要贯穿整个系统全生命周期的持续过程。 从系统工程流程角度来看, 试验鉴定即连续体方法将试验鉴定从主要在系统工程“V”模型右侧进行的一组串行活动(如图3所示), 转变为从“V”模型左侧就开始的一系列活动(如图4所示)。 从实际运行角度来看, 基于模型的环境和相关工具将使系统工程界能够管理在“V”型连续体中同时开展的许多复杂活动, 这样使命任务工程界、 系统工程界和试验鉴定界就能够尽早、 持续地协同工作, 并对动态威胁环境做出快速响应, 最终将图3所示的传统“V”型结构变为图4所示的压缩折叠后的“V”型连续体结构。
由总体框架内容可知, 执行试验鉴定即连续体, 会将使命任务工程、 系统工程和试验鉴定整合为并行、 协同和联合的工作。 通过协同使用使命任务分解、 相关任务条件以及由使命任务工程生成的相关效能和性能指标, 将使系统工程和试验鉴定能够对验证任务能力所需的设计迭代和试验活动达成共识, 这种经过验证的任务能力对于在实际应用中能够自我学习和调整的智能装备/系统尤为重要。 此外, 使命任务工程、 系统工程和试验鉴定组合方法的实施, 能够更早、 更持续地关注任务完成而不是需求验证。 同时, 由于强调系统工程和试验鉴定之间的共同责任, 这种连续体方法能使早期系统工程设计权衡和分析利用作战试验最终用于验证任务效能的试验方法和条件。
对于美国国防部而言, 一方面, 试验鉴定即连续体可以提供关于系统在威胁环境中实际性能的知情风险管理, 使各方能够更早地了解研制/开发进展, 并对整个采办生命周期中的试验情况和关键节点充满信心, 确保所需能力如期交付, 以支持作战人员。 另一方面, 试验鉴定即连续体能够有效应对当前国防系统能力复杂性带来的风险表征和总体保证改进需求, 这些工作将自然而然地推动传统系统工程和试验鉴定活动的整合和交织, 提供超学科、 连续的流程, 将设计演进与VV&A耦合, 以推动试验鉴定工作的更科学发展。
3.2 能力要素分析
为支撑试验鉴定即连续体3大关键属性的实施需求, 美国国防部结合数字工程战略的5大关键目标, 总结提出了实施试验鉴定即连续体的3大能力要素, 即鲁棒的LVC试验、 基于模型的环境和“数字”人才队伍。 融合这些能力要素, 可从采办初期设计阶段就提供关于系统性能和风险特征的及时且全面的信息, 从而实现装备系统快速开发和部署, 同时为日益复杂的系统和体系提供持续支持。
3.2.1 鲁棒的LVC试验
鉴于现代作战系统的复杂性, 美军最新的理念认为, 试验鉴定必须向全面涵盖LVC方法转型, 其中包括基于模型的试验。 由于系统复杂性和/或对揭示能力的敏感性, 对某些系统进行真实、 露天试验面临着巨大的挑战。 因此, 增加使用建模与仿真及其他构造性方法对于全面了解系统性能至关重要。 美国国防部将会继续发展和完善其试验靶场和设施能力, 以建立可涵盖尽可能多的威胁和作战环境频谱的LVC能力组合, 而这种转变势必需要在数字工程环境中建立“共享”基础设施, 图5所示为整个采办生命周期内的各种共享能力。
这种转变的优势之一是能够进行体系试验测试, 而这正是支持在全域作战背景下概念评估的基本要求, 例如联合全域指挥与控制(JADC2)评估。 由于组成体系能力的系统为异步开发, LVC框架将显著提升集成度, 以支持能力验证, 特别是对于为实现共同目标而协作的平台的分布式或多代理AI/ML能力。 与此同时, 这些LVC能力还能用于美军成功完成全域作战所需的逼真训练。 不过, 美国国防部也强调, 日益重视LVC试验并不意味着会减少对真实、 露天试验的需求, 以评估关键系统性能, 并为建模与仿真VV&A提供支持。 通过适当的VV&A, LVC试验势必会更全面、 更准确地表征系统面对日益复杂的对手进行多域作战时的能力。
3.2.2 基于模型的环境
试验鉴定即连续体概念指出, 基于模型的环境是其最关键的能力要素。 美国国防部认为, 能力开发工作的复杂性, 加上增强的试验设计的复杂性, 都需要数字骨干和基于模型的方法来管理连续的试验鉴定活动, 将其与并行开展的使命任务工程和系统工程活动相结合, 并管理、 整理和分析所有这些活动生成的数据。 这种基于模型的环境将整合敏捷、 可扩展的鉴定框架, 并确保其与所有使命任务工程、 系统工程和试验鉴定活动的一致性, 从而实现在试验鉴定采办生命周期中提供关于建模、 仿真、 数据分析、 数据共享和使命任务工程-系统工程-试验鉴定集成的数字支持。
利用基于模型的环境, 美国国防部装备研制将从传统的“设计-建造-试验-修复-试验”(Design-Build-Test-Fix-Test)流程模式过渡到更优的“建模-试验-验证-设计-试验”(Model-Test-Validate-Design-Test)流程模式, 提供关于预期任务能力的早期和持续信息, 避免采用传统流程时出现较晚发现能力方面不足等问题。 目前, 美军正在验证和使用这种新的拥有一条数字线索的流程, 通过高保真度“数字孪生”的潜在开发来支持使用与保障阶段的项目, 从使命任务工程初期开始显示系统性能建模的进展。 此外, 为了更好地支持试验鉴定工作, 基于模型的环境还必须对系统将要运行的联合作战空间进行真实复现。
3.2.3 “数字”人才队伍
美国国防部强调, 为了支持基于模型的环境, 还需要一支掌握“数字”能力的人才队伍, 他们需要精通与MBSE、 基于模型的试验鉴定和其他基于模型的方法相关的流程和工具。 随着《国防采办劳动力改进法案》(DAWIA)认证流程和相关职能领域认证的改革, 美军数字人才队伍建设转型已经初步开始, 美国国防部需要付出更多的努力, 才能在国防部内获取并发展有关使用基于模型的方法并行开展使命任务工程、 系统工程、 试验鉴定连续体活动所需的技术和管理技能。 此外, 美国国防部指出, 当前的转型工作并没有推动更广泛的系统工程领域内所需的全面集成, 来确保试验鉴定成为系统工程V&V工作的重要组成部分。 而且, 系统工程“V”模型的“折叠”并不否定良好的普通系统工程实践, 重大挑战则在于如何迭代管理这些实践, 以确保与这种基于模型的新的系统工程“V”模型环境的动态、 关联性质保持一致。
4 研究启示
试验鉴定作为武器装备能力交付的重要环节, 在美国国防部推进数字工程的过程中, 受到格外重视。 在装备研制能力快速发展的背景下, 美军新提出的试验鉴定即连续体概念对于当前装备试验鉴定的数字化转型具有一定启示。
4.1 重视工程理念融合, 推动试验鉴定数字化变革
美国国防部针对当前武器装备复杂性特点, 开展的此系列举措, 旨在推动试验鉴定活动与传统系统工程的整合和交织, 期望提供超学科、 连续的流程, 将设计改进与VV&A耦合。 与此同时, 试验鉴定即连续体概念所强调的并行、 协同和联合模式, 是“左移”策略的进一步深化, 能够尽早提供相关任务场景中系统试验的重要反馈信息, 满足当前AI/自主等鲁棒系统设计开发和持续改进的需求。 应当借鉴连续体这种模式, 加快试验鉴定数字化转型进程, 增强装备研制风险表征, 促进试验鉴定前伸后延, 完善生命周期数据管理体系, 从而保证装备系统整体交付能力目标。
4.2 重视基于模型的方法, 提升AI/ML等新兴技术的试验鉴定效能
早在F-22和F-35等装备研制期间, 美军就已经进行了大量建模与仿真研究实践。 近年来, 美国国防部在数字工程推进和数字化转型实施过程中, 持续深化试验鉴定数实结合的总体思路, 不断强化像作战一样试验的理念, 推动了LVC等基于模型的技术发展。 随着未来装备(如六代机、 蜂群)快速发展, 人工智能/自主技术已成为核心要素, 使得软件能力在武器装备研制中的比重越来越大, 美军越发重视软件能力的试验鉴定。 据悉, 美军软件工程领域正在通过“软件采办路径”领导实施一种更具迭代性的基于模型的软件开发设计/测试方法, 以实现在试验鉴定采办生命周期内, 提供连续体需要的关于建模、 仿真、 数据分析、 数据共享和使命任务工程-系统工程-试验鉴定集成的数字支持。 应当借鉴连续体这种做法, 加强基于模型的方法的研究与应用, 提升AI/ML赋能的武器系统在跨所有作战域的综合环境中、 在专注于体系构成和更大指数级攻击面的任务线程中的试验鉴定效能, 确保装备系统管用、 好用。
4.3 重视结合装备研制实际, 促进试验鉴定科学发展
随着装备系统复杂度和作战体系化要求的不断提升, 2022年6月, 美国国防部作战试验鉴定局发布的《2022财年作战试验鉴定战略更新》, 为试验鉴定基础设施、 工具、 流程和人才队伍的变革制定了路线。 同时, 美国国防部数字工程工作组专门成立基础设施团队来解决基于数字工程的试验鉴定自动化问题, 美国空军也在持续推进试验策略与开发流程改进。 试验鉴定即连续体这种系统化方法便是美军探索之一。 此外, 美国国防部近年来还在推动MBSE、 贝叶斯方法、 超学科技术方法在试验鉴定中的应用, 并加强了试验鉴定人员对于基于模型的试验鉴定等科学方法的培训学习。 在装备研制迈向并驾齐驱, 甚至领先超越的过程中, 应当借鉴美军连续体发展思路, 秉持系统科学的发展理念, 结合数字化、 体系化、 智能化装备发展需要, 加强相关试验鉴定能力提升方面的基础研究, 形成一套标准化、 系统化、 科学化的试验鉴定理论和方法, 从而促进试验鉴定科学可持续发展。
5 结 束 语
随着数字工程战略的持续推进, 多域作战概念的日趋成熟, 人工智能/机器学习、 自主等新兴技术的快速发展, 美国国防部认为必须对整体采办模式进行变革转型, 要求各军种结合数字工程理念持续开展试验策略与开发流程优化。 美军后续可能将紧跟分布式人工智能和数字工程技术发展步伐, 继续推动该概念的验证、 完善和深入应用等工作, 完善试验环境的数字化和LVC能力, 增强鉴定框架的灵活性和扩展性, 提升复杂人工智能系统和多域作战的试验鉴定能力, 以期达到试验鉴定改革效果。
参考文献:
[1] Collins C, Senechal K. Test and Evaluation as a Continuum[J]. The ITEA Journal, 2023, 44(1): 4-1-4-16.
[2] Greer E R. The Integrated T&E Continuum, the Key to Acquisition Success[J]. The ITEA Journal, 2010, 31(4): 443-446.
[3] Freeman L, Beling P, Esser K, et al. Positioning Test and Evaluation for the Digital Paradigm[J]. The ITEA Journal, 2023, 44(2): 7-1-7-11.
[4] Office of the Deputy Assistant Secretary of Defense for Systems Engineering. DoD Digital Engineering Strategy[R]. Washington: United States Department of Defense, 2018.
[5] 崔艳林, 王巍巍, 王乐. 美国数字工程战略实施途径[J]. 航空动力, 2021 (4): 84-86.
Cui Yanlin, Wang Weiwei, Wang Le. US Digital Engineering Implementation Strategy[J]. Aerospace Power, 2021(4): 84-86. (in Chinese)
[6] 卫旭芳, 刘彬. 美军数字工程建设发展研究及启示[J]. 航空兵器, 2023, 30(3): 56-66.
Wei Xufang, Liu Bin. Research on the Development of US Military Digital Engineering and Its Enlightenment[J]. Aero Weaponry, 2023, 30(3): 56-66.(in Chinese)
[7] Office of the Under Secretary of Defense for Research and Engineering, Office of the Director, Operational Test and Evaluation. DoD Instruction 5000.89, Test and Evaluation[R]. Washington: United States Department of Defense, 2020.
[8] Cortes L A, Wong M K, Cortes-Morales A, et al. Advance M&S in Acquisition T&E [R]. McLean: The MITRE Corporation, 2021.
[9] The Office of the Assistant Secretary of the Air Force. Digital Building Code for Digital Engineering[R]. Washington: Department of the Air Force, 2021.
[10] Bjorkman E, Grigaliunas J. Test and Evaluation-Where the Rubber Meets the Road in Digital Engineering[J]. Defense Acquisition Magazine, 2021, 50(6): 8-14.
[11] DOT&E. 2021 DOT&E Annual Report[R]. Washington: United States Department of Defense, 2022.
[12] Hobson S, Collins C. Transforming T&E to Adequately Assess Warfighting Capability in a Multi-Domain Operational Environment[C]∥1st T&E in a Multi-Domain Operational Environment Workshop, 2021.
[13] DOT&E. DOT&E Strategy Update 2022[R]. Washington: United States Department of Defense, 2022.
[14] Hobson S, Lowe P, Thomas N, et al. Proven Warfighting Capabili-ties Delivered at the Speed of Need[R]. Washington: United States Department of Defense, 2023.
[15] Collins C. Multi-Domain Operations-Initiatives to Enable T&E Evolution[C]∥ITEA’s 2nd Annual Multi-Domain Operations Workshop, 2022.
Research on US Military Test and Evaluation as a Continuum
Yang Tao, Zhang Yi*, Liang Baohua, Li Guole
(Chinese Flight Test Establishment, Xi’an 710089, China)
Abstract: The reform of test and evaluation is a critical component of the US defense acquisition system reform and the digital transformation of the US military. Facing the challenges of test and evaluation brought by the development of emerging technologies such as artificial intelligence and autonomy, as well as the systematic operational requirements like multi-domain warfare and all-domain warfare, to the delivery of weapon equipment capabilities, the US Department of Defense is actively promoting digital transformation in the field of test and evaluation. One of the crucial measures is to put forward the concept of test and evaluation as a continuum, aiming to continuously optimize test strategies and evaluation processes with the help of digital engineering concepts, and further enhance the efficiency and qua-lity of acquiring weapon equipment. This article briefly outlines the development of test and evaluation as a continuum, analyzes its framework content and conceptual implications, discusses the specific capability elements required for implementation, and provides insights into the digital transformation of test and evaluation for weapon equipment.
Key words: test and evaluation as a continuum; digital transformation; digital engineering; mission engineering; systems engineering